XL Conferencia Sobre Educación Matemática

XL Conferencia Sobre Educación Matemática

Introducción

Resumen de la sección: En esta sección, el presentador da la bienvenida a los asistentes y presenta al profesor Diego Castro, quien hablará sobre el uso de las matemáticas en el machine learning.

  • El presentador saluda a los asistentes y presenta al profesor Diego Castro.
  • Se menciona que esta es la cuadragésima conferencia del ciclo sobre educación matemática.
  • Se destaca que el tema de hoy es el uso de las matemáticas en el machine learning.

Presentación del Profesor Diego Castro

Resumen de la sección: En esta sección, el profesor Diego Castro se presenta y habla sobre su experiencia y trabajo como estadístico.

  • El profesor Diego Castro se presenta y menciona su formación académica.
  • Se destaca que es docente en varias universidades y tiene experiencia trabajando en riesgo de créditos bancarios.
  • Se menciona que su conferencia tratará sobre la aplicación del machine learning en la estimación del riesgo en cumplimiento en el sector bancario.

Intermediarios financieros

Resumen de la sección: En esta sección, el profesor explica por qué existen intermediarios financieros como los bancos y cómo estos calculan la probabilidad de incumplimiento de un cliente.

  • Se explica que los intermediarios financieros existen para facilitar préstamos a personas o empresas con proyectos de inversión exitosos.
  • Los bancos necesitan calcular si un cliente podrá pagar sus obligaciones antes de otorgar un préstamo.
  • Antes de la crisis financiera de 1998, los bancos calculaban la probabilidad de incumplimiento a ojo.
  • Después de la crisis, se solicitó a las entidades financieras que estimaran modelos estadísticos para predecir la probabilidad de incumplimiento.

Modelos estadísticos

Resumen de la sección: En esta sección, el profesor explica cómo los modelos estadísticos permiten calcular la probabilidad de incumplimiento y cómo estos han evolucionado desde su implementación en el sector bancario.

  • Los modelos estadísticos permiten calcular la probabilidad de incumplimiento con mayor precisión que los cálculos a ojo.
  • La Superintendencia Financiera solicitó a las entidades financieras que estimaran modelos estadísticos para predecir la probabilidad de incumplimiento después de la crisis financiera del 98.
  • Los modelos han evolucionado desde su implementación en el sector bancario y ahora se utilizan en otras áreas como el machine learning.

Estimación de provisiones y pérdida esperada

Resumen de la sección: En esta sección, el orador explica cómo los bancos estiman las provisiones para incumplimientos y cómo se calcula la pérdida esperada. También habla sobre la garantía o colateral que se utiliza en caso de un crédito vehicular.

Cálculo de pérdida esperada

  • La probabilidad de incumplimiento es el foco principal para calcular la pérdida esperada.
  • La garantía o colateral utilizado en caso de un crédito vehicular es una prenda del vehículo.
  • Se multiplica la exposición dada por el incumplimiento con el saldo u obligación bajo la normativa colombiana.

Estimación de probabilidades de incumplimiento

Resumen de la sección: En esta sección, el orador explica cómo se estima la probabilidad de incumplimiento y cómo se calcula la provisión para cada año del crédito.

Tres etapas para estimar probabilidades

  • Etapa 1: clientes cumplidos, solo se provisiona para los primeros doce meses.
  • Etapa 2: clientes con indicios de deterioro, donde el banco determina matemáticamente si es probable que haya un incumplimiento. Se estima la provisión para toda la vida remanente del crédito.
  • Etapa 3: clientes incumplidos, donde existen dos etapas bajo Norma Internacional: clientes con altos indicios y clientes sin cumplir.

Modelos supervisados y no supervisados

  • Los modelos supervisados incluyen regresión logística provincial multinomial y ordinal, así como árboles de clasificación o decisión.
  • Los modelos no supervisados se utilizan para segmentar clientes y agruparlos por características comunes.

Riesgo de crédito comercial

Resumen de la sección: En esta sección, el orador explica cómo se modela una variable para el riesgo de crédito comercial o consumo en vivienda.

Definición de variable dependiente

  • La variable dependiente es uno si el cliente incumple con sus obligaciones y cero si ha sido cumplido.
  • Bajo Norma Colombiana, un cliente es incumplido si su mora en los últimos 365 días es mayor o igual a 150 días. Bajo Norma Internacional son 90 días.

Modelos independientes

  • Es necesario estimar modelos independientes para cada normativa debido a que los umbrales son diferentes.

Lo siento, pero no puedo proporcionar una respuesta sin el archivo de transcripción. Por favor proporcione la transcripción para que pueda comenzar a trabajar en ella.

Indicadores para el modelo matemático estadístico

Resumen de la sección: En esta sección, se explica cómo se calcula el indicador de la curva característica de operación y cómo se utiliza una tabla cruzada para determinar el error en la estimación del modelo. También se discuten los conceptos de sensibilidad y especificidad.

Cálculo del indicador

  • El indicador se calcula como el área bajo la curva característica de operación menos 0.5 por 2.
  • La tabla cruzada ayuda a determinar el error en la estimación del modelo.
  • Se busca minimizar los dos tipos de errores: n1 y n2.

Sensibilidad y especificidad

  • La sensibilidad es la capacidad del modelo para determinar correctamente los clientes que son incumplidos.
  • La especificidad es la capacidad del modelo para determinar correctamente los clientes que son cumplidos.
  • Se debe minimizar ambos tipos de errores.

Indicadores para el modelo matemático estadístico (continuación)

Resumen de la sección: En esta sección, se explican diferentes tipos de indicadores que pueden ser utilizados en el modelo matemático estadístico, incluyendo tamaño de empresa, endeudamiento, eficiencia, liquidez y rentabilidad.

Tipos de indicadores

  • Los diferentes tipos de indicadores incluyen tamaño de empresa, endeudamiento, eficiencia, liquidez y rentabilidad.
  • Es importante que los indicadores tengan sentido intuitivo para poder ser incluidos en el modelo.

Relación entre los indicadores y la probabilidad de incumplimiento

  • Las empresas grandes generalmente tienen mejores condiciones de pago que las empresas pequeñas.
  • A mayor endeudamiento, se espera una mayor probabilidad de incumplimiento.
  • A mayor eficiencia, se espera una menor probabilidad de incumplimiento.
  • A mayor liquidez, se espera una menor probabilidad de incumplimiento.
  • A mayor rentabilidad, se espera una menor probabilidad de incumplimiento.

Indicadores para el modelo matemático estadístico (continuación)

Resumen de la sección: En esta sección, se discuten las variables macroeconómicas y su relación con la probabilidad de incumplimiento.

Variables macroeconómicas

  • Las variables macroeconómicas también pueden ser utilizadas como indicadores en el modelo matemático estadístico.
  • La relación entre las variables macroeconómicas y la probabilidad de incumplimiento depende del tipo específico de variable.

Probabilidad de incumplimiento y modelos de estimación

Resumen de la sección: En esta sección, el orador habla sobre cómo los bancos en Colombia estiman sus modelos para predecir la probabilidad de incumplimiento. Explica que la tasa de desempleo y la mora son factores importantes a considerar al evaluar el riesgo crediticio.

Metodología para estimar modelos

  • Los bancos en Colombia utilizan información histórica de clientes del sector económico y comercial entre enero del 2012 hasta diciembre del 2018 para estimar sus modelos.
  • La metodología es homogénea e incluye un análisis descriptivo de cada uno de los indicadores, como diagramas de caja, media, mediana y moda.
  • Se utiliza un diagrama de árbol para analizar el comportamiento de las variables y determinar si el sentido es válido o no.
  • Se escoge una muestra aleatoria del 80% para estimar el modelo y se valida con el otro 20%. Las variables deben ser significativas y acordes con la teoría económica.
  • Se debe validar que las variables sean independientes estadísticamente. El coeficiente Ginny debe ser mayor al 50%.
  • Se replica el modelo con otro periodo de información externa a la base original (backtesting).

Estimación del modelo

  • Para la estimación del modelo, se cuenta con treinta mil ciento cuarenta y una firmas. El 80% equivale a veinticuatro mil ciento trece.
  • Los diagramas de cajas y alambres permiten analizar la variabilidad o volatilidad de los datos.

Sesgo en la información histórica

Resumen de la sección: En esta sección, el orador habla sobre el sesgo que puede existir en la información histórica utilizada para estimar modelos.

Sesgo en la información histórica

  • La información histórica utilizada para estimar modelos está cerrada porque solo se considera un período específico (2012-2018).
  • Para evitar este sesgo, se utiliza backtesting con información externa a la base original (por ejemplo, todos los clientes de diciembre del 2020).

Análisis de riesgos crediticios

Resumen de la sección: En esta sección, el orador habla sobre cómo los bancos evalúan el riesgo crediticio y toman decisiones basadas en los modelos estimados.

Evaluación del riesgo crediticio

  • No hay bullet points asociados con timestamps disponibles en esta parte del video.

Análisis de la cartera y obligaciones bancarias

Resumen de la sección: En esta sección, se analiza la relación corriente y las obligaciones bancarias de pasivo total. Se observa que el nivel de endeudamiento es mayor en los clientes incumplidos y que las empresas medianas tienen una mayor probabilidad de incumplimiento en comparación con las grandes.

Nivel de endeudamiento

  • El 50% de los clientes tiene un nivel de endeudamiento menor a 23.
  • Los clientes incumplidos tienen obligaciones bancarias mucho más altas.
  • Las empresas medianas tienen una mayor probabilidad de incumplimiento en relación a las grandes.

Estimación del modelo

  • El modelo estadístico incluye variables como rentabilidad, eficiencia, liquidez, endeudamiento y tamaño de empresa mediano y pequeño.
  • La variable categórica debe tener n menos uno categorías para ajustar el modelo correctamente.
  • Todos los coeficientes son significativos al uno por ciento.

Ecuación matemática del Z

  • La ecuación matemática del Z es igual a menos al intercepto que menos once coma dieciocho dieciséis ochenta y seis menos cero coma cero tres sesenta y cuatro más este valor menos este valor más este es una combinación lineal que está de acuerdo en matemáticas.

Análisis del PIB, tasa de desempleo y apalancamiento

Resumen de la sección: En esta sección, se analiza el impacto del PIB, la tasa de desempleo y el apalancamiento en la probabilidad de incumplimiento.

Impacto del PIB

  • A mayor PIB, disminuye la probabilidad de incumplimiento.

Impacto de la tasa de desempleo

  • A mayor tasa de desempleo, aumenta el apalancamiento.
  • Las empresas pequeñas tienen un mayor riesgo en relación a las medianas.

Ecuación matemática del Z

  • No hay información relevante para incluir en esta sección.

Multicolinealidad y Validación del Modelo

Resumen de la sección: En esta sección, el presentador habla sobre la multicolinealidad en la literatura de estadística matemática y cómo el VIP debe ser menor que cinco para evitar problemas de multicolinealidad. Luego, explica que si alguna variable tiene un VIP mayor a cinco, debería descartarse del modelo. También muestra la ecuación matemática y cómo se comporta con el 20% restante de los clientes.

Multicolinealidad

  • El VIP debe ser menor que cinco para evitar problemas de multicolinealidad.
  • Si alguna variable tiene un VIP mayor a cinco, debería descartarse del modelo.

Validación del Modelo

  • La validación del modelo indica que el indicador debe ser mayor al 50% para poder considerar el modelo válido estadísticamente.
  • La base con la que se valida el modelo es generalmente un poco menor que la base con la que se estimó originalmente debido a tener en cuenta solo una parte de toda la información disponible.

Interpretando los Efectos Marginales

Resumen de la sección: En esta sección, el presentador explica cómo calcular los efectos marginales para cada variable (rentabilidad, eficiencia y liquidez) y cómo interpretarlos.

Efectos Marginales

  • Por cada diez puntos porcentuales que aumente la rentabilidad de una firma, disminuirá en 0.63 puntos porcentuales su incumplimiento.
  • Por cada cien puntos porcentuales que aumente la eficiencia de una firma, disminuirá en 0.5 puntos porcentuales su incumplimiento.
  • Si las condiciones financieras y económicas son exactamente iguales, pero la cartera de un cliente aumenta, su probabilidad de incumplimiento también aumentará.

Variables y Modelos de Probabilidad

Resumen de la sección: En esta sección, el profesor explica cómo las variables permanecen constantes en la matemática financiera y cómo es importante distinguir entre puntos porcentuales y porcentajes. Luego, presenta los datos de clientes incumplidos utilizados para estimar el modelo de probabilidad.

Variables en Matemática Financiera

  • Las variables permanecen constantes en la matemática financiera.
  • Es importante distinguir entre puntos porcentuales y porcentajes.

Datos de Clientes Incumplidos

  • Se utilizaron 24.113 firmas para estimar el modelo.
  • De esas firmas, 829 fueron incumplidas.
  • Para el batesting con información de diciembre del 2019, se tuvo en cuenta a todos los clientes que tuvieron una probabilidad de incumplimiento entre el 0.6% y el 1%.
  • La probabilidad real de incumplimiento aumentó al 3.92%.

Homologación de Probabilidades

  • Existen bandas para homologar la probabilidad de incumplimiento.
  • Por ejemplo, la banda uno va desde cero hasta el 0.6%, mientras que la banda dos va desde el 0.6% hasta el 1%.

Comportamiento del Modelo

  • El comportamiento del modelo se mide comparando las probabilidades estimadas con las probabilidades reales.
  • El ARR (Accuracy Ratio Rank) debe ser mayor al 50% para que sea válido.

Análisis de Clientes Incumplidos

  • Se analizó el comportamiento de los clientes incumplidos.
  • Se comparó la probabilidad estimada con la probabilidad real.
  • El objetivo es que ambas líneas se superpongan.

Datos por Cantidad de Clientes

  • Los datos presentados son para 24.103 clientes, 1.028 clientes y 4.511 clientes.

Preguntas y Respuestas

Resumen de la sección: En esta sección, el profesor responde a las preguntas e inquietudes de los estudiantes sobre el modelo de probabilidad presentado.

Uso del Logaritmo Neperiano

  • El logaritmo neperiano se utiliza para resolver ecuaciones matemáticas estadísticas.

Función de Enlace

  • Es necesario tener una función de enlace para poder interpretar los resultados obtenidos en el modelo.

Combinación Lineal

  • Se utilizó una combinación lineal en el modelo presentado.

Escenarios Base, Favorable y Desfavorable

  • Es importante considerar tres tipos de escenarios al estimar un modelo: base, favorable y desfavorable.
  • Bajo la norma colombiana, solo se considera un escenario.

La importancia de las matemáticas en el sector financiero

Resumen de la sección: En esta sección, Diego habla sobre cómo su formación en matemáticas le ha ayudado a entender y aplicar conceptos básicos en su trabajo en el sector financiero. También explica cómo los bancos utilizan modelos matemáticos para monitorear variables y determinar la probabilidad de incumplimiento de los clientes.

Formación en matemáticas y aplicación práctica

  • Diego explica que su formación en matemáticas le ha ayudado a entender mejor la aplicación práctica de los conceptos teóricos.
  • La formación que se recibe durante el pregrado es muy buena para entrar al campo real, especialmente en estadística.
  • Las bases teóricas son importantes para entender la aplicación práctica cuando se trabaja en el sector financiero.

Uso de modelos matemáticos para monitorear variables

  • Los bancos hacen un monitoreo permanente de variables para determinar la probabilidad de incumplimiento de los clientes.
  • Si un segmento específico tiene una alta probabilidad de incumplimiento, ¿qué hace el banco? ¿Guarda más dinero o utiliza esos datos estadísticos?
  • El banco utiliza modelos matemáticos y estadísticos para tomar decisiones concretas.

Cambio constante y mejora continua

  • Es importante cambiar constantemente los modelos si no están funcionando correctamente.
  • El indicador de estrella es muy bueno para descartar clientes que son incumplidos.
  • Los bancos están mejorando sus modelos para cuando hay una etapa recesiva o cuando no se está en agua.

Agradecimiento y cierre

Resumen de la sección: En esta sección, el profesor agradece a Diego por su presentación y destaca la importancia de entender cómo las matemáticas se aplican en la vida cotidiana. También invita a los asistentes a hacer preguntas antes del cierre del evento.

Agradecimiento y reflexión

  • El comité de carrera de la licenciatura en matemáticas y la Facultad de Educación agradecen la presencia de Diego.
  • Es fundamental que las personas entiendan cómo las matemáticas se usan en la vida cotidiana.

Invitación a hacer preguntas

  • Se invita a los asistentes a hacer preguntas antes del cierre del evento.
Video description

Uso de las matemáticas: aplicación del Machine Learning en la estimación del riesgo de incumplimiento en el sector bancario. Conferencia a cargo de Diego Alejandro Castro Llanos; Estadístico y Magíster en Economía Aplicada de la Universidad del Valle. Profesor de la Maestría en Economía de la Universidad del Valle y Coordinador de Riesgos del Banco Diners (Cali, Colombia)

XL Conferencia Sobre Educación Matemática | YouTube Video Summary | Video Highlight