XL Conferencia Sobre Educación Matemática
Introducción
Resumen de la sección: En esta sección, el presentador da la bienvenida a los asistentes y presenta al profesor Diego Castro, quien hablará sobre el uso de las matemáticas en el machine learning.
- El presentador saluda a los asistentes y presenta al profesor Diego Castro.
- Se menciona que esta es la cuadragésima conferencia del ciclo sobre educación matemática.
- Se destaca que el tema de hoy es el uso de las matemáticas en el machine learning.
Presentación del Profesor Diego Castro
Resumen de la sección: En esta sección, el profesor Diego Castro se presenta y habla sobre su experiencia y trabajo como estadístico.
- El profesor Diego Castro se presenta y menciona su formación académica.
- Se destaca que es docente en varias universidades y tiene experiencia trabajando en riesgo de créditos bancarios.
- Se menciona que su conferencia tratará sobre la aplicación del machine learning en la estimación del riesgo en cumplimiento en el sector bancario.
Intermediarios financieros
Resumen de la sección: En esta sección, el profesor explica por qué existen intermediarios financieros como los bancos y cómo estos calculan la probabilidad de incumplimiento de un cliente.
- Se explica que los intermediarios financieros existen para facilitar préstamos a personas o empresas con proyectos de inversión exitosos.
- Los bancos necesitan calcular si un cliente podrá pagar sus obligaciones antes de otorgar un préstamo.
- Antes de la crisis financiera de 1998, los bancos calculaban la probabilidad de incumplimiento a ojo.
- Después de la crisis, se solicitó a las entidades financieras que estimaran modelos estadísticos para predecir la probabilidad de incumplimiento.
Modelos estadísticos
Resumen de la sección: En esta sección, el profesor explica cómo los modelos estadísticos permiten calcular la probabilidad de incumplimiento y cómo estos han evolucionado desde su implementación en el sector bancario.
- Los modelos estadísticos permiten calcular la probabilidad de incumplimiento con mayor precisión que los cálculos a ojo.
- La Superintendencia Financiera solicitó a las entidades financieras que estimaran modelos estadísticos para predecir la probabilidad de incumplimiento después de la crisis financiera del 98.
- Los modelos han evolucionado desde su implementación en el sector bancario y ahora se utilizan en otras áreas como el machine learning.
Estimación de provisiones y pérdida esperada
Resumen de la sección: En esta sección, el orador explica cómo los bancos estiman las provisiones para incumplimientos y cómo se calcula la pérdida esperada. También habla sobre la garantía o colateral que se utiliza en caso de un crédito vehicular.
Cálculo de pérdida esperada
- La probabilidad de incumplimiento es el foco principal para calcular la pérdida esperada.
- La garantía o colateral utilizado en caso de un crédito vehicular es una prenda del vehículo.
- Se multiplica la exposición dada por el incumplimiento con el saldo u obligación bajo la normativa colombiana.
Estimación de probabilidades de incumplimiento
Resumen de la sección: En esta sección, el orador explica cómo se estima la probabilidad de incumplimiento y cómo se calcula la provisión para cada año del crédito.
Tres etapas para estimar probabilidades
- Etapa 1: clientes cumplidos, solo se provisiona para los primeros doce meses.
- Etapa 2: clientes con indicios de deterioro, donde el banco determina matemáticamente si es probable que haya un incumplimiento. Se estima la provisión para toda la vida remanente del crédito.
- Etapa 3: clientes incumplidos, donde existen dos etapas bajo Norma Internacional: clientes con altos indicios y clientes sin cumplir.
Modelos supervisados y no supervisados
- Los modelos supervisados incluyen regresión logística provincial multinomial y ordinal, así como árboles de clasificación o decisión.
- Los modelos no supervisados se utilizan para segmentar clientes y agruparlos por características comunes.
Riesgo de crédito comercial
Resumen de la sección: En esta sección, el orador explica cómo se modela una variable para el riesgo de crédito comercial o consumo en vivienda.
Definición de variable dependiente
- La variable dependiente es uno si el cliente incumple con sus obligaciones y cero si ha sido cumplido.
- Bajo Norma Colombiana, un cliente es incumplido si su mora en los últimos 365 días es mayor o igual a 150 días. Bajo Norma Internacional son 90 días.
Modelos independientes
- Es necesario estimar modelos independientes para cada normativa debido a que los umbrales son diferentes.
Lo siento, pero no puedo proporcionar una respuesta sin el archivo de transcripción. Por favor proporcione la transcripción para que pueda comenzar a trabajar en ella.
Indicadores para el modelo matemático estadístico
Resumen de la sección: En esta sección, se explica cómo se calcula el indicador de la curva característica de operación y cómo se utiliza una tabla cruzada para determinar el error en la estimación del modelo. También se discuten los conceptos de sensibilidad y especificidad.
Cálculo del indicador
- El indicador se calcula como el área bajo la curva característica de operación menos 0.5 por 2.
- La tabla cruzada ayuda a determinar el error en la estimación del modelo.
- Se busca minimizar los dos tipos de errores: n1 y n2.
Sensibilidad y especificidad
- La sensibilidad es la capacidad del modelo para determinar correctamente los clientes que son incumplidos.
- La especificidad es la capacidad del modelo para determinar correctamente los clientes que son cumplidos.
- Se debe minimizar ambos tipos de errores.
Indicadores para el modelo matemático estadístico (continuación)
Resumen de la sección: En esta sección, se explican diferentes tipos de indicadores que pueden ser utilizados en el modelo matemático estadístico, incluyendo tamaño de empresa, endeudamiento, eficiencia, liquidez y rentabilidad.
Tipos de indicadores
- Los diferentes tipos de indicadores incluyen tamaño de empresa, endeudamiento, eficiencia, liquidez y rentabilidad.
- Es importante que los indicadores tengan sentido intuitivo para poder ser incluidos en el modelo.
Relación entre los indicadores y la probabilidad de incumplimiento
- Las empresas grandes generalmente tienen mejores condiciones de pago que las empresas pequeñas.
- A mayor endeudamiento, se espera una mayor probabilidad de incumplimiento.
- A mayor eficiencia, se espera una menor probabilidad de incumplimiento.
- A mayor liquidez, se espera una menor probabilidad de incumplimiento.
- A mayor rentabilidad, se espera una menor probabilidad de incumplimiento.
Indicadores para el modelo matemático estadístico (continuación)
Resumen de la sección: En esta sección, se discuten las variables macroeconómicas y su relación con la probabilidad de incumplimiento.
Variables macroeconómicas
- Las variables macroeconómicas también pueden ser utilizadas como indicadores en el modelo matemático estadístico.
- La relación entre las variables macroeconómicas y la probabilidad de incumplimiento depende del tipo específico de variable.
Probabilidad de incumplimiento y modelos de estimación
Resumen de la sección: En esta sección, el orador habla sobre cómo los bancos en Colombia estiman sus modelos para predecir la probabilidad de incumplimiento. Explica que la tasa de desempleo y la mora son factores importantes a considerar al evaluar el riesgo crediticio.
Metodología para estimar modelos
- Los bancos en Colombia utilizan información histórica de clientes del sector económico y comercial entre enero del 2012 hasta diciembre del 2018 para estimar sus modelos.
- La metodología es homogénea e incluye un análisis descriptivo de cada uno de los indicadores, como diagramas de caja, media, mediana y moda.
- Se utiliza un diagrama de árbol para analizar el comportamiento de las variables y determinar si el sentido es válido o no.
- Se escoge una muestra aleatoria del 80% para estimar el modelo y se valida con el otro 20%. Las variables deben ser significativas y acordes con la teoría económica.
- Se debe validar que las variables sean independientes estadísticamente. El coeficiente Ginny debe ser mayor al 50%.
- Se replica el modelo con otro periodo de información externa a la base original (backtesting).
Estimación del modelo
- Para la estimación del modelo, se cuenta con treinta mil ciento cuarenta y una firmas. El 80% equivale a veinticuatro mil ciento trece.
- Los diagramas de cajas y alambres permiten analizar la variabilidad o volatilidad de los datos.
Sesgo en la información histórica
Resumen de la sección: En esta sección, el orador habla sobre el sesgo que puede existir en la información histórica utilizada para estimar modelos.
Sesgo en la información histórica
- La información histórica utilizada para estimar modelos está cerrada porque solo se considera un período específico (2012-2018).
- Para evitar este sesgo, se utiliza backtesting con información externa a la base original (por ejemplo, todos los clientes de diciembre del 2020).
Análisis de riesgos crediticios
Resumen de la sección: En esta sección, el orador habla sobre cómo los bancos evalúan el riesgo crediticio y toman decisiones basadas en los modelos estimados.
Evaluación del riesgo crediticio
- No hay bullet points asociados con timestamps disponibles en esta parte del video.
Análisis de la cartera y obligaciones bancarias
Resumen de la sección: En esta sección, se analiza la relación corriente y las obligaciones bancarias de pasivo total. Se observa que el nivel de endeudamiento es mayor en los clientes incumplidos y que las empresas medianas tienen una mayor probabilidad de incumplimiento en comparación con las grandes.
Nivel de endeudamiento
- El 50% de los clientes tiene un nivel de endeudamiento menor a 23.
- Los clientes incumplidos tienen obligaciones bancarias mucho más altas.
- Las empresas medianas tienen una mayor probabilidad de incumplimiento en relación a las grandes.
Estimación del modelo
- El modelo estadístico incluye variables como rentabilidad, eficiencia, liquidez, endeudamiento y tamaño de empresa mediano y pequeño.
- La variable categórica debe tener n menos uno categorías para ajustar el modelo correctamente.
- Todos los coeficientes son significativos al uno por ciento.
Ecuación matemática del Z
- La ecuación matemática del Z es igual a menos al intercepto que menos once coma dieciocho dieciséis ochenta y seis menos cero coma cero tres sesenta y cuatro más este valor menos este valor más este es una combinación lineal que está de acuerdo en matemáticas.
Análisis del PIB, tasa de desempleo y apalancamiento
Resumen de la sección: En esta sección, se analiza el impacto del PIB, la tasa de desempleo y el apalancamiento en la probabilidad de incumplimiento.
Impacto del PIB
- A mayor PIB, disminuye la probabilidad de incumplimiento.
Impacto de la tasa de desempleo
- A mayor tasa de desempleo, aumenta el apalancamiento.
- Las empresas pequeñas tienen un mayor riesgo en relación a las medianas.
Ecuación matemática del Z
- No hay información relevante para incluir en esta sección.
Multicolinealidad y Validación del Modelo
Resumen de la sección: En esta sección, el presentador habla sobre la multicolinealidad en la literatura de estadística matemática y cómo el VIP debe ser menor que cinco para evitar problemas de multicolinealidad. Luego, explica que si alguna variable tiene un VIP mayor a cinco, debería descartarse del modelo. También muestra la ecuación matemática y cómo se comporta con el 20% restante de los clientes.
Multicolinealidad
- El VIP debe ser menor que cinco para evitar problemas de multicolinealidad.
- Si alguna variable tiene un VIP mayor a cinco, debería descartarse del modelo.
Validación del Modelo
- La validación del modelo indica que el indicador debe ser mayor al 50% para poder considerar el modelo válido estadísticamente.
- La base con la que se valida el modelo es generalmente un poco menor que la base con la que se estimó originalmente debido a tener en cuenta solo una parte de toda la información disponible.
Interpretando los Efectos Marginales
Resumen de la sección: En esta sección, el presentador explica cómo calcular los efectos marginales para cada variable (rentabilidad, eficiencia y liquidez) y cómo interpretarlos.
Efectos Marginales
- Por cada diez puntos porcentuales que aumente la rentabilidad de una firma, disminuirá en 0.63 puntos porcentuales su incumplimiento.
- Por cada cien puntos porcentuales que aumente la eficiencia de una firma, disminuirá en 0.5 puntos porcentuales su incumplimiento.
- Si las condiciones financieras y económicas son exactamente iguales, pero la cartera de un cliente aumenta, su probabilidad de incumplimiento también aumentará.
Variables y Modelos de Probabilidad
Resumen de la sección: En esta sección, el profesor explica cómo las variables permanecen constantes en la matemática financiera y cómo es importante distinguir entre puntos porcentuales y porcentajes. Luego, presenta los datos de clientes incumplidos utilizados para estimar el modelo de probabilidad.
Variables en Matemática Financiera
- Las variables permanecen constantes en la matemática financiera.
- Es importante distinguir entre puntos porcentuales y porcentajes.
Datos de Clientes Incumplidos
- Se utilizaron 24.113 firmas para estimar el modelo.
- De esas firmas, 829 fueron incumplidas.
- Para el batesting con información de diciembre del 2019, se tuvo en cuenta a todos los clientes que tuvieron una probabilidad de incumplimiento entre el 0.6% y el 1%.
- La probabilidad real de incumplimiento aumentó al 3.92%.
Homologación de Probabilidades
- Existen bandas para homologar la probabilidad de incumplimiento.
- Por ejemplo, la banda uno va desde cero hasta el 0.6%, mientras que la banda dos va desde el 0.6% hasta el 1%.
Comportamiento del Modelo
- El comportamiento del modelo se mide comparando las probabilidades estimadas con las probabilidades reales.
- El ARR (Accuracy Ratio Rank) debe ser mayor al 50% para que sea válido.
Análisis de Clientes Incumplidos
- Se analizó el comportamiento de los clientes incumplidos.
- Se comparó la probabilidad estimada con la probabilidad real.
- El objetivo es que ambas líneas se superpongan.
Datos por Cantidad de Clientes
- Los datos presentados son para 24.103 clientes, 1.028 clientes y 4.511 clientes.
Preguntas y Respuestas
Resumen de la sección: En esta sección, el profesor responde a las preguntas e inquietudes de los estudiantes sobre el modelo de probabilidad presentado.
Uso del Logaritmo Neperiano
- El logaritmo neperiano se utiliza para resolver ecuaciones matemáticas estadísticas.
Función de Enlace
- Es necesario tener una función de enlace para poder interpretar los resultados obtenidos en el modelo.
Combinación Lineal
- Se utilizó una combinación lineal en el modelo presentado.
Escenarios Base, Favorable y Desfavorable
- Es importante considerar tres tipos de escenarios al estimar un modelo: base, favorable y desfavorable.
- Bajo la norma colombiana, solo se considera un escenario.
La importancia de las matemáticas en el sector financiero
Resumen de la sección: En esta sección, Diego habla sobre cómo su formación en matemáticas le ha ayudado a entender y aplicar conceptos básicos en su trabajo en el sector financiero. También explica cómo los bancos utilizan modelos matemáticos para monitorear variables y determinar la probabilidad de incumplimiento de los clientes.
Formación en matemáticas y aplicación práctica
- Diego explica que su formación en matemáticas le ha ayudado a entender mejor la aplicación práctica de los conceptos teóricos.
- La formación que se recibe durante el pregrado es muy buena para entrar al campo real, especialmente en estadística.
- Las bases teóricas son importantes para entender la aplicación práctica cuando se trabaja en el sector financiero.
Uso de modelos matemáticos para monitorear variables
- Los bancos hacen un monitoreo permanente de variables para determinar la probabilidad de incumplimiento de los clientes.
- Si un segmento específico tiene una alta probabilidad de incumplimiento, ¿qué hace el banco? ¿Guarda más dinero o utiliza esos datos estadísticos?
- El banco utiliza modelos matemáticos y estadísticos para tomar decisiones concretas.
Cambio constante y mejora continua
- Es importante cambiar constantemente los modelos si no están funcionando correctamente.
- El indicador de estrella es muy bueno para descartar clientes que son incumplidos.
- Los bancos están mejorando sus modelos para cuando hay una etapa recesiva o cuando no se está en agua.
Agradecimiento y cierre
Resumen de la sección: En esta sección, el profesor agradece a Diego por su presentación y destaca la importancia de entender cómo las matemáticas se aplican en la vida cotidiana. También invita a los asistentes a hacer preguntas antes del cierre del evento.
Agradecimiento y reflexión
- El comité de carrera de la licenciatura en matemáticas y la Facultad de Educación agradecen la presencia de Diego.
- Es fundamental que las personas entiendan cómo las matemáticas se usan en la vida cotidiana.
Invitación a hacer preguntas
- Se invita a los asistentes a hacer preguntas antes del cierre del evento.