Ciencia de datos y oceanografía: una mirada al encuentro entre ambas

Uno de sus principales usos es facilitar el análisis.

Actualmente el desarrollo de la tecnología nos permite acceder a grandes cantidades de datos en poco tiempo, con mucha variedad de fuentes y formatos. La ciencia de datos surge como una disciplina que nos ayuda a procesarlos a través de herramientas como la programación computacional y los modelos matemáticos, a fin de transformarlos en información valiosa, comprensible y relevante para las distintas áreas en las que se utiliza. Una de ellas es la oceanografía, campo en el que se desempeña Pamela Linford, postdoctorante del COPAS Coastal.

La científica, quien trabaja con ciencia de datos como parte de sus actividades en el centro, cuenta que los instrumentos utilizados en la investigación oceanográfica arrojan datos que pueden ser caóticos de leer. Con el fin de ordenarlos y presentarlos en formatos que faciliten un análisis claro, se vale de paquetes de programas que, una vez cumplido su propósito, también enseña a otras personas cómo utilizarlos. Así, los datos instrumentales que se obtienen directamente de los sensores instalados en ellos, por ejemplo, en anclajes o boyas, pasan a constituir planillas de Excel, series de tiempo y gráficas. Listas para que las y los investigadores del área los analicen. “He trabajado bastante sistematizando. Cuando se conecta el instrumento al computador sale un archivo, generalmente muy extraño. Yo tomo las variables de ese archivo, las ordeno, realizo conversiones de unidades y otros cálculos requeridos, pero todo con código sistematizado, de manera que para una próxima vez que se utilice el instrumento, solo sea necesario que el investigador le entregue al programa información básica al inicio y luego este hará todo el resto de forma automática”, afirma.

Alcanzando ámbitos más allá del trabajo instrumental, esta disciplina también se puede utilizar con el trabajo de datos satelitales. Según explica Linford, los anteriores suelen estar asociados con algún modelo, por ejemplo, oceanográfico, que a su vez puede ser de carácter global o regional. Los modelos globales no tienen una gran resolución espacial, “si tú quieres saber exactamente qué ocurre aquí, frente a tu casa, no lo vas a poder encontrar porque son datos globales”. Sin embargo, son de gran utilidad cuando se requiere observar fenómenos o situaciones a gran escala, como lo que ocurre en la costa de Chile. Por su parte, los modelos regionales o locales permiten extraer datos más detallados y específicos.

Asimismo, la científica trabaja con datos in situ que recibe de estudios en terreno, los cuales se utilizan para elaborar una hipótesis de acuerdo con lo observado y, posteriormente, explicarlos a partir de los datos entregados por modelos reconocidos. “La idea básica es entender con datos in situ la variabilidad de distintos componentes que afectan a los ecosistemas ambientales, siempre mostrar qué es lo que hemos podido encontrar, qué patrones hay. Y dadas las hipótesis de porqué ocurre eso, las explicamos mayoritariamente con datos de modelos”, explica.

Sin embargo, los modelos, como herramienta, no se encuentran completamente exentos de posibles errores, por lo que se hace necesaria la validación. Esta es otra de las áreas en la que Pamela Linford se desempeña con su trabajo de datos. Según cuenta, luego de que un modelo ha sido calibrado y procesado los datos de entrada, se obtienen los datos de salida, que corresponden a las variables que se esperan predecir. Para validar el modelo, estos se comparan con datos reales, que no pueden ser ni los de entrada ni los utilizados en la calibración.

Linford comparte que en su trabajo también aborda la estadística, estudiando el comportamiento de variables de estudio oceanográfico a partir del cálculo de, por ejemplo, promedios en periodos de tiempo. Algunas de estas variables pueden ser datos de temperatura, salinidad y oxígeno disuelto en determinados lugares de estudio. Este trabajo está principalmente orientado a entender las tendencias de las variables en cuestión, valiéndose de estadísticas tanto tradicionales como otras de computación y matemáticas más complejas.

La ciencia de datos es una disciplina que, en un mundo donde el fenómeno del big data parece haber llegado para quedarse, brinda un servicio crucial para extraer conocimiento valioso en distintos ámbitos y tomar decisiones informadas. En el caso de la oceanografía, y del Centro COPAS Coastal, su aplicación supone una herramienta no sólo para la investigación oceanográfica en sí, sino que también al desarrollo de la sociedad a través del aporte científico.

Uso del diagrama de Taylor en validación. Gráfica del estudio "Recent Deoxygenation of Patagonian Fjord Subsurface Waters Connected to the Peru–Chile Undercurrent and Equatorial Subsurface Water Variability". Figura 2.

¿Te ha gustado este artículo?

Compartir en Facebook
Compartir en Twitter
Compartir en Linkdin
Compartir en WhatsApp
Ir al contenido