Núcleo Milenio Centro para el Descubrimiento de Estructuras en Datos Complejos – Midas

Área de Impacto: Optimización de procesos
Especialidad: Análisis de datos

Debido al crecimiento continuo de las capacidades para su adquisición y almacenamiento, los datos se han convertido en un importante recurso, en gran medida sin explotar, que tiene el potencial de fomentar el progreso económico y social. Sin embargo, los datos en sí mismos no significan nada y no pueden cumplir este potencial a menos que apliquemos metodologías apropiadas para extraer la información relevante de ellos. Por esta razón, es la interacción entre los datos y técnicas estadísticas sofisticadas lo que permite lograr un profundo impacto en las diferentes aplicaciones. En este sentido, los datos son una materia prima que, con la tecnología correcta, puede ser refinada en una “pieza valiosa de oro”: el conocimiento obtenido de los datos sobre el mundo que nos rodea y que impulsa la creación de nuevos conocimientos.

El valor de los datos no crece simplemente acumulando más y las grandes ideas son más importantes que los grandes datos. De hecho, el interés en los conjuntos de datos grandes es cuando en realidad son extraños y nos permiten conocer sobre los mecanismos complejos que los generan. En conjuntos de datos grandes y simples, unos pocos estadísticos de resumen contienen la misma información, o casi la misma, sobre el mecanismo de generación de datos que el conjunto de datos original, lo que hace que muchos de los datos almacenados sean redundantes. Por ejemplo, la información genética de un individuo puede servir como un muy buen representante de otros individuos de una misma población ancestral poco heterogénea. En estos casos, los datos pueden caracterizarse completamente por modelos estadísticos de baja dimensión, que se describen mediante un número pequeño y fijo de parámetros. Por el contrario, los conjuntos de datos grandes y complejos no se pueden resumir de esta manera, y su análisis requiere un marco que permita que los modelos crezcan en tamaño y complejidad a medida que se acumulan los datos. Estos se conocen como modelos estadísticos noparamétricos.

El Núcleo Milenio MiDaS es un centro que realiza investigación fundamental sobre modelos estadísticos noparamétricos. Motivados por las características de los datos que surgen en diferentes áreas del conocimiento, para responder a preguntas científicas específicas, los investigadores de MiDaS se dedican al desarrollo de nuevos enfoques estadísticos para la identificación, reconstrucción y clasificación eficiente de información estructural relevante en conjuntos de datos complejos. Algunos ejemplos motivadores incluyen:

  • La evaluación de la relación entre la forma y la composición de la canal en peces
  • La cuantificación de incertidumbre en reconstrucciones regularizadas para imágenes biomédicas
  • La evaluación de factores asociados con el tiempo a caries y al tiempo del desarrollo de SIDA desde la infección por VIH
  • La comprensión del comportamiento espacio-temporal del fenómeno del niño
  • La construcción de enfoques de limitación de divulgación basados ​​en datos sintéticos generados desde modelos estadísticos flexibles
Alejandro Jara
Alejandro JaraDirector
Fernando Quintana
Fernando QuintanaDirector Alterno

Mail de contacto: atjara@uc.cl
E-mail comunicaciones: midas@mat.uc.cl
Teléfono:+56 2 2222 4422
midas.mat.uc.cl