Kalika Bali: The giant leaps in language technology -- and who's left behind | TED
Introducción a la Tecnología del Lenguaje
Presentación de Kalika Bali
- Kalika Bali es lingüista y tecnóloga, con 20 años de experiencia en educación y tecnología del lenguaje.
- Su objetivo es hacer que la tecnología supere las barreras del idioma, trabajando en Microsoft Research Labs en India.
Conceptos Clave del Procesamiento del Lenguaje Natural (PLN)
- El PLN permite a las máquinas procesar, entender y generar lenguaje humano, facilitando interacciones como reservas de billetes o asistentes virtuales.
- La base del PLN se fundamenta en datos masivos sobre el uso del lenguaje humano, procesados por algoritmos.
Desarrollo y Avances en PLN
Aprendizaje Profundo
- El aprendizaje profundo es una técnica avanzada esencial para el desarrollo actual del PLN.
- Se requiere una gran cantidad de datos específicos para entrenar sistemas de voz en diferentes idiomas.
Ejemplos de Éxitos Tecnológicos
- En 2017, Microsoft logró un sistema de reconocimiento de voz que transcribía mejor que humanos usando 200 millones de palabras.
- Un sistema anglo-chino alcanzó traducciones al nivel de personas bilingües con más de 18 millones de frases.
Desigualdad Lingüística Global
Distribución Desigual de Recursos
- Monojit Choudhury estudia cómo los recursos lingüísticos están distribuidos desigualmente entre los idiomas.
- Solo cuatro idiomas (árabe, chino, inglés y español) tienen la mayoría de los recursos disponibles; el 90% restante carece casi totalmente.
Consecuencias Sociales
- Esta desigualdad crea un ciclo donde los idiomas con recursos reciben más atención tecnológica mientras que otros quedan rezagados.
Iniciativas para Reducir la Brecha Digital
Proyecto Ellora
- Microsoft investiga métodos innovadores para crear más datos y tecnologías accesibles sin grandes recursos.
Ejemplo Práctico: Gondi
- El gondi es hablado por tres millones en India pero carece completamente de recursos tecnológicos.
- CGNet Swara trabaja para dar visibilidad a esta lengua mediante periodismo comunitario accesible desde móviles.
Colaboraciones e Impacto Comunitario
Creación Colaborativa
- Bajo el Proyecto Ellora, se unieron ONGs e instituciones académicas para traducir libros infantiles al gondi.
Resultados Tangibles
Aplicaciones de Tecnología Lingüística para Comunidades Marginadas
Uso de la Lengua Gondi y Traducción
- La lengua gondi se utiliza en una aplicación que permite a los usuarios acceder a noticias e información en su idioma, facilitando la traducción de textos del hindi al gondi.
- Esta iniciativa genera datos paralelos que ayudarán a construir sistemas de traducción para el gondi, beneficiando a la comunidad gond en todo el mundo.
Desafíos Económicos y Acceso Digital
- Se plantea la pregunta sobre cómo las comunidades lingüísticas pueden ganarse la vida utilizando herramientas digitales que son comunes para otros.
Plataforma Karya: Conectando Comunidades
- Vivek Seshdari y Manu Chopra desarrollaron Karya, una plataforma diseñada para facilitar tareas digitales a comunidades con pocos recursos, buscando crear empleo digno.
- Karya permite que personas en áreas rurales y urbanas pobres se conecten al mundo digital y encuentren oportunidades laborales.
Experiencia en Amale: Recolección de Datos
- En Amale, una aldea aislada sin acceso a tecnología moderna, se recolectaron datos del maratí usando Karya, revelando lecciones valiosas sobre orgullo lingüístico y valor comunitario.
- La participación activa del pueblo en la recolección de datos fomentó un sentido de comunidad y promovió su lengua local mediante narración de historias.
Reflexiones sobre Tecnología y Comunidad
- La importancia radica en centrar las intervenciones tecnológicas alrededor de las necesidades humanas; cualquier tecnología debe priorizar a los usuarios.
Aprendizajes del Proyecto VideoKheti
- Un proyecto anterior llamado VideoKheti mostró que es crucial entender el contexto cultural al desarrollar tecnologías; errores como ruidos ambientales afectaron resultados.
Necesidad de Inversiones Lingüísticas
- Los idiomas menos representados requieren inversiones significativas para beneficiarse adecuadamente de la tecnología del lenguaje.
¿Cómo la perseverancia puede llevar al éxito?
La importancia de los errores y la perseverancia
- El proceso interactivo permite aprender de los errores rápidamente, lo que puede conducir a un gran éxito si se mantiene la perseverancia.
- Se enfatiza que no rendirse es crucial para alcanzar metas y objetivos.
Historia inspiradora de Patricia O’Connor e Ysola Best
- En los años 90, estas dos mujeres aborígenes australianas intentaron aprender su lengua nativa, el yugambeh, pero fueron desalentadas por expertos que afirmaron que estaba muerta.
- A pesar del rechazo inicial, decidieron no rendirse y buscaron apoyo en su comunidad para recuperar tradiciones orales y literatura.
Fundación del Museo Yugambeh
- Gracias a sus esfuerzos, fundaron el Museo Yugambeh, que se convirtió en un centro cultural y lingüístico vital para su comunidad.