2.6  MODELOS PROBABILISTICOS

2.6 MODELOS PROBABILISTICOS

Preparación de Propuestas y Evaluaciones

Introducción a la Presentación de Propuestas

  • Se concluye un módulo donde los estudiantes deben preparar y enviar su propuesta, comenzando con un perfil de trabajo.
  • Se menciona la importancia de no dejar el informe final para el último momento, ya que hay muchos alumnos que deben ser evaluados.

Fechas Clave y Organización del Trabajo

  • La fecha límite para entregar es la semana del 28 de noviembre; se enfatiza en la necesidad de cumplir con este plazo.
  • Se está preparando un trabajo práctico que incluirá una base de datos para crear un modelo ejecutivo.

Recursos Disponibles y Consultas

  • Los estudiantes tienen tiempo para hacer preguntas sobre el contenido del curso, dado que el calendario no está muy apretado.
  • Un estudiante revisa grabaciones anteriores y pregunta sobre la disponibilidad del material subido a la plataforma.

Materiales Adicionales y Herramientas

Acceso a Recursos Educativos

  • Se confirma que las grabaciones están disponibles en Drive, facilitando su descarga por parte de los estudiantes.
  • Nadia también subirá documentos adicionales relacionados con los informes realizados en clase.

Comprensión Estadística

  • Un estudiante expresa su necesidad de entender mejor las herramientas estadísticas utilizadas en el curso.
  • Se discute la falta de comprensión sobre gráficos específicos y se menciona un manual disponible para ayudar con estas interpretaciones.

Interpretación Gráfica y Herramientas Isatis

Explicación de Gráficos

  • No existe un tutorial específico sobre cada gráfico, pero hay recursos generales disponibles dentro del software Isatis.
  • Se explica cómo importar datos y qué parámetros son necesarios al utilizar las herramientas gráficas.

Recomendaciones para Estudiantes

  • Lucas se anima a revisar videos previos donde se explican conceptos como Box plots e histogramas.

Introducción a Modelos Probabilísticos en Geoestadística

Concepto General de la Geoestadística

  • Se plantea una pregunta sobre un gráfico y se menciona la importancia de entender los conceptos detrás de él, como el "bigote" que representa variaciones en los datos.
  • Se inicia con tres lecciones, comenzando con una breve introducción a modelos probabilísticos y su relevancia en geoestadística.

Diferencias entre Modelos Determinísticos y Probabilísticos

  • La clase se enfoca en formalizar conceptos generales antes de entrar en detalles matemáticos complejos, buscando simplificar la comprensión.
  • Se discute por qué es necesario utilizar modelos probabilísticos, contrastándolos con enfoques deterministas que son aplicables solo en ciertas disciplinas.

Aplicación de Modelos Probabilísticos

  • En meteorología, se pueden usar modelos deterministas basados en datos precisos; sin embargo, esto no es viable para caracterizar yacimientos minerales debido a la complejidad e incertidumbre inherente.
  • En ciencias de la tierra, las variables que describen un yacimiento son muy complejas y no permiten una descripción determinista efectiva.

Introducción a la Aleatoriedad

  • Al adoptar un modelo probabilístico, se incorporan tanto datos observacionales como probabilidades para reflejar incertidumbres sobre el yacimiento.
  • Este enfoque permite manejar lo conocido (datos recolectados) junto con lo desconocido (incertidumbres del fenómeno).

Enfoques Tradicionales en Estadística

  • La estadística tradicional utiliza modelos probabilísticos donde las observaciones provienen de variables aleatorias independientes; este supuesto puede ser restrictivo al analizar fenómenos regionalizados.
  • Se ejemplifica cómo cada medición puede interpretarse como resultado de una variable aleatoria representada por un dado.

Dependencia Espacial entre Datos

  • El inconveniente del modelo probabilístico radica en su suposición de independencia entre datos cercanos; esto no refleja adecuadamente la realidad espacial observada.
  • Ejemplos visuales muestran que existe dependencia entre valores medidos: si un punto tiene cierto valor (ej. 3% cobre), es probable que puntos adyacentes tengan valores similares.

Observaciones Finales sobre Dependencia Espacial

  • La continuidad observada entre mediciones resalta la necesidad de considerar dependencias espaciales al modelar datos geológicos.

Geoestadística y Dependencia de Datos

Concepto de Dependencia en Geoestadística

  • La geoestadística aborda la dependencia de los datos, sugiriendo que afirmar que los datos son dependientes no impone restricciones significativas. Esto contrasta con la estadística tradicional, donde suponer independencia es una hipótesis restrictiva.
  • En geoestadística, se reconoce que los datos están correlacionados y esto permite hacer predicciones más precisas sobre valores desconocidos en el espacio.
  • La dificultad en la estadística tradicional radica en predecir un valor desconocido basándose solo en observaciones independientes, lo cual resulta poco realista.
  • Al considerar la dependencia entre datos, se puede acotar mejor las predicciones; por ejemplo, si se observa un dado con un número específico, se puede inferir el siguiente número probable.

Modelos y Herramientas en Geoestadística

  • La geoestadística utiliza modelos para interpretar la dependencia entre datos. Se simboliza esta relación mediante resortes que representan flexibilidad y similitud entre valores.
  • Los resortes ilustran cómo todos los datos interactúan entre sí, permitiendo realizar predicciones más ajustadas sobre valores sin información previa.
  • Para formalizar estos modelos, se introducen herramientas como el variograma, covarianza y correlograma para medir interacciones entre variables aleatorias.

Variabilidad e Incertidumbre

  • El objetivo del variograma es cuantificar la interacción entre los datos. Las variables aleatorias reflejan incertidumbres debido a la variabilidad espacial de las mediciones.
  • Hay dos aspectos complementarios: la aleatoriedad (variabilidad irregular de una variable) y las relaciones espaciales (continuidad estructural).

Importancia del Variograma

  • Un modelo efectivo debe integrar tanto la aleatoriedad como las dependencias espaciales. Esto permite entender mejor cómo coexisten estos aspectos antagónicos en el análisis de datos geoespaciales.
  • El variograma es una herramienta clave utilizada para medir estas dependencias. Aunque existen otras herramientas como correlogramas o covarianzas, el variograma es el más comúnmente utilizado por investigadores.

Ejemplo Práctico

¿Cómo se relacionan la geoestadística y la variabilidad de los datos?

Comparación entre estadística y geoestadística

  • La varianza en el histograma es igual en ambos casos, lo que significa que la estadística trata 36 datos como equivalentes. Sin embargo, la geoestadística considera la ubicación espacial de esos datos, marcando una diferencia significativa.
  • Al observar las diferencias entre datos adyacentes, se nota que estas son menores a la izquierda (0.15 a 0.199) en comparación con las diferencias a la derecha (0.41 a 3.24), indicando un comportamiento más errático en esta última.
  • Aunque físicamente los yacimientos pueden parecer iguales, desde una perspectiva geoestadística se presentan como distintos: uno más continuo y otro más errático, lo cual afecta su representación visual.

Introducción a conceptos técnicos

  • Se introduce notación técnica para formalizar conceptos; se menciona el dominio o campo donde se distribuye una variable geológica.
  • La variable de interés puede ser, por ejemplo, la ley de cobre en un punto específico del espacio (X). Este enfoque idealiza que dicha ley puede medirse en un solo punto.

Idealización y aleatoriedad

  • La ley no se mide realmente en un punto sino en un volumen pequeño; esto implica una idealización al considerar el dato como un punto único.
  • Se conceptualiza que el valor de la ley de cobre es resultado de una variable aleatoria (Z mayúscula), similar al lanzamiento de un dado, sugiriendo que hay incertidumbre inherente al medir estos valores.

Campo aleatorio y función aleatoria

  • Al considerar múltiples puntos dentro del dominio D, cada uno tiene asociada una variable aleatoria; esto forma lo que se denomina un campo aleatorio o función aleatoria.
  • En textos sobre geoestadística, términos como "Random Field" o "proceso estocástico" son utilizados para describir funciones cuyos valores dependen del azar.

Reflexiones sobre determinismo y azar

  • Se plantea si existe realmente el azar; aunque algunos consideran ciertos eventos como aleatorios debido a nuestra falta de conocimiento sobre todos los factores involucrados.
  • El concepto del dado es utilizado para ilustrar cómo algo puede parecer aleatorio si no conocemos todas las variables determinísticas detrás del evento.

Introducción a las Funciones Aleatorias y Variables Regionalizadas

Conceptos Básicos de Medición

  • Se discute la importancia de medir herramientas de trabajo, destacando la variable regionalizada como un ejemplo clave en el contexto de la ley del cobre.
  • Se introduce el concepto de función aleatoria, que se caracteriza por su naturaleza abstracta y probabilística.

Caracterización de Variables Aleatorias

  • La caracterización de una variable aleatoria se ejemplifica con un dado, donde cada valor tiene igual probabilidad (1/6).
  • Una función aleatoria también se caracteriza por una distribución de probabilidad, pero es más compleja debido a la corrección entre variables aleatorias.

Distribuciones Conjuntas y Espaciales

  • Se explica cómo caracterizar distribuciones conjuntas para múltiples variables aleatorias mediante umbrales específicos.
  • La complejidad aumenta al considerar infinitas distribuciones posibles en un espacio determinado, lo que plantea desafíos para el análisis práctico.

Simplificaciones Necesarias

  • Dado que los datos son finitos (por ejemplo, 2000 o 5000), es necesario simplificar el modelo para hacerlo operativo.
  • Se propone reducir el número de puntos considerados a uno o dos para facilitar la comprensión y análisis.

Ejemplo Práctico: Lanzamiento del Dado

  • Para determinar si un dado está cargado, se sugiere realizar experimentos repetidos lanzándolo varias veces y analizando los resultados.
  • La inferencia sobre la distribución de probabilidad requiere repetir experimentos; sin embargo, esto presenta dificultades en contextos únicos como los yacimientos geológicos.

Desafíos en Evaluación de Yacimientos

  • El orador menciona que no se pueden repetir mediciones en diferentes yacimientos reales; solo hay acceso a uno único.

Estacionalidad y Homogeneidad en Geoestadística

Conceptos Clave de Estacionalidad

  • La estacionalidad permite intercambiar repeticiones dentro de un mismo yacimiento a través del espacio, facilitando el análisis de datos geológicos.
  • Se menciona que la estacionalidad se basa en la invariancia de las distribuciones de probabilidad por translación en el espacio, lo que es fundamental para las técnicas de geoestadística.
  • La hipótesis de estacionalidad implica que al desplazarse en el espacio, los datos mantienen propiedades estadísticas similares (media, varianza).

Implicaciones Prácticas

  • Al observar diferentes puntos en un yacimiento, se espera que las distribuciones estadísticas sean homogéneas; esto significa que no hay diferencias significativas entre los datos recogidos en distintas ubicaciones.
  • La homogeneidad sugiere que las propiedades de una variable son constantes al desplazarse espacialmente, lo cual es crucial para realizar inferencias precisas.

Análisis Estadístico

  • Cuando se analizan dos puntos (x y x'), la distribución conjunta no depende de sus coordenadas absolutas sino solo de su separación relativa.
  • Esto implica que la similitud entre dos datos está determinada únicamente por la distancia entre ellos, reforzando la idea central de homogeneidad espacial.

Desafíos y Consideraciones

  • A pesar del concepto teórico de estacionalidad, existen cuestionamientos sobre su aplicabilidad debido a variaciones observadas en diferentes zonas del yacimiento.
  • Se discute cómo mezclar zonas con comportamientos distintos puede vulnerar la hipótesis subyacente de estacionalidad, afectando así los resultados estadísticos obtenidos.

Reflexiones Finales

¿Cómo se aborda la varianza en geoestadística?

Varianza y su relación con el sector

  • La varianza no es constante y se observa más alta en el sector de alta ley que en el de baja ley, lo que genera debates sobre su interpretación.
  • Se menciona la homogeneidad como un concepto relevante, sugiriendo que las decisiones de modelamiento pueden influir en cómo se percibe la variable de interés, como la ley de cobre.

Decisiones vs. Hipótesis

  • La teoría es una herramienta abstracta; las decisiones sobre cómo modelar variables son más relevantes que las hipótesis tradicionales.
  • Cuestionar la estacionalidad puede ser visto como una decisión más que una hipótesis, lo cual permite flexibilidad en el análisis.

Escalas Locales y Globales

  • En geoestadística, se trabaja a escala local; los modelos deben definirse considerando vecindades específicas para obtener resultados precisos.
  • Aunque globalmente la media puede variar, a nivel local puede parecer constante si se limita el análisis a un área específica.

Herramientas Estadísticas Relevantes

  • En geoestadística no siempre se utilizan distribuciones; sin embargo, ciertos momentos estadísticos son cruciales para entender los datos.
  • La media y varianza son parámetros clave: la media representa el valor promedio y la varianza indica dispersión respecto a este promedio.

Covarianza y Disimilitud

  • La covarianza mide similitudes entre dos variables aleatorias basándose en su separación espacial; es fundamental para entender relaciones espaciales.

¿Cuál es la diferencia entre variograma y covarianza?

Conceptos Básicos

  • El variograma mide la disimilitud entre datos, mientras que la covarianza mide la similitud. Ambos son funciones que dependen de una separación o distancia entre los datos.
  • La covarianza cuantifica qué tan parecidos están dos datos en función de su separación en el espacio, mientras que el variograma evalúa el contraste entre ellos.

Distancia y Orientación

  • La distancia no solo se refiere a un valor numérico, sino también a una orientación; por lo tanto, se utiliza un vector para representar esta separación.
  • Es importante considerar múltiples direcciones al analizar los datos, ya que el variograma puede variar según la dirección de los puntos analizados.

Aplicaciones en Minería

  • En minería, el variograma es comúnmente utilizado. Si hay dificultades con su estimación, se puede recurrir a la covarianza como alternativa.
  • A veces, las oscilaciones pueden ocurrir en las funciones del variograma y covarianza; sin embargo, generalmente se espera una tendencia decreciente.

Relación entre Varianza y Covarianza

  • La varianza es esencialmente la covarianza de un dato consigo mismo. Se considera que parte de cero y tiende a cero cuando los datos son muy distantes e independientes.
  • El variograma comienza desde cero (disimilitud total) y aumenta conforme se comparan datos más distantes. Su valor asintótico es igual a la varianza.

Resumen Final sobre Modelos Geoestadísticos

  • Se discute cómo el correlograma está relacionado con la covarianza y cómo este último comienza desde la varianza.
  • La variable regionalizada es determinística y medible; representa una realidad tangible influenciada por funciones aleatorias caracterizadas por distribuciones espaciales complejas.
  • La media y varianza son constantes en el espacio, mientras que las funciones de covarianza dependen del vector H de separación entre los datos.

Simulación y Funciones Aleatorias en Geoestadística

Introducción a la Simulación

  • Se introduce el concepto de simulación, que se discutirá más a fondo en dos meses. La simulación se basa en la generación de escenarios utilizando un modelo de función aleatoria.

Concepto de Escenario

  • Un escenario es una realización alternativa de una función aleatoria. Aunque no se conoce la realidad exacta, al entender la función aleatoria, se pueden crear diferentes escenarios hipotéticos.

Técnicas Alternativas a la Geoestadística

  • Existen técnicas para estimar recursos que no dependen de geoestadística ni probabilidades, como el aprendizaje automático y redes neuronales. Estas técnicas pueden ofrecer resultados sin utilizar métodos tradicionales.

Competencia entre Métodos

  • Hay un creciente interés en técnicas determinísticas avanzadas (como Machine Learning) que compiten con métodos geoestadísticos tradicionales como la inversa distancia. Esto plantea preguntas sobre su efectividad comparativa.

Cuantificación de Incertidumbre

  • La geoestadística tiene una ventaja significativa en la cuantificación de incertidumbre mediante el uso de probabilidades. Otras técnicas, aunque útiles, no logran medir esta incertidumbre geológica adecuadamente.

Herramientas Geoestadísticas

  • A pesar del avance en otras metodologías, la geoestadística sigue siendo relevante debido a sus herramientas basadas en simulaciones y modelos probabilísticos que abordan directamente el tema de incertidumbre.

Reflexión Final sobre Geoestadística