Kalika Bali: The giant leaps in language technology -- and who's left behind | TED

Kalika Bali: The giant leaps in language technology -- and who's left behind | TED

Introducción a la Tecnología del Lenguaje

Presentación de Kalika Bali

  • Kalika Bali es lingüista y tecnóloga, con 20 años de experiencia en educación y tecnología del lenguaje.
  • Su objetivo es hacer que la tecnología supere las barreras del idioma, trabajando en Microsoft Research Labs en India.

Conceptos Clave del Procesamiento del Lenguaje Natural (PLN)

  • El PLN permite a las máquinas procesar, entender y generar lenguaje humano, facilitando interacciones como reservas de billetes o asistentes virtuales.
  • La base del PLN se fundamenta en datos masivos sobre el uso del lenguaje humano, procesados por algoritmos.

Desarrollo y Avances en PLN

Aprendizaje Profundo

  • El aprendizaje profundo es una técnica avanzada esencial para el desarrollo actual del PLN.
  • Se requiere una gran cantidad de datos específicos para entrenar sistemas de voz en diferentes idiomas.

Ejemplos de Éxitos Tecnológicos

  • En 2017, Microsoft logró un sistema de reconocimiento de voz que transcribía mejor que humanos usando 200 millones de palabras.
  • Un sistema anglo-chino alcanzó traducciones al nivel de personas bilingües con más de 18 millones de frases.

Desigualdad Lingüística Global

Distribución Desigual de Recursos

  • Monojit Choudhury estudia cómo los recursos lingüísticos están distribuidos desigualmente entre los idiomas.
  • Solo cuatro idiomas (árabe, chino, inglés y español) tienen la mayoría de los recursos disponibles; el 90% restante carece casi totalmente.

Consecuencias Sociales

  • Esta desigualdad crea un ciclo donde los idiomas con recursos reciben más atención tecnológica mientras que otros quedan rezagados.

Iniciativas para Reducir la Brecha Digital

Proyecto Ellora

  • Microsoft investiga métodos innovadores para crear más datos y tecnologías accesibles sin grandes recursos.

Ejemplo Práctico: Gondi

  • El gondi es hablado por tres millones en India pero carece completamente de recursos tecnológicos.
  • CGNet Swara trabaja para dar visibilidad a esta lengua mediante periodismo comunitario accesible desde móviles.

Colaboraciones e Impacto Comunitario

Creación Colaborativa

  • Bajo el Proyecto Ellora, se unieron ONGs e instituciones académicas para traducir libros infantiles al gondi.

Resultados Tangibles

Aplicaciones de Tecnología Lingüística para Comunidades Marginadas

Uso de la Lengua Gondi y Traducción

  • La lengua gondi se utiliza en una aplicación que permite a los usuarios acceder a noticias e información en su idioma, facilitando la traducción de textos del hindi al gondi.
  • Esta iniciativa genera datos paralelos que ayudarán a construir sistemas de traducción para el gondi, beneficiando a la comunidad gond en todo el mundo.

Desafíos Económicos y Acceso Digital

  • Se plantea la pregunta sobre cómo las comunidades lingüísticas pueden ganarse la vida utilizando herramientas digitales que son comunes para otros.

Plataforma Karya: Conectando Comunidades

  • Vivek Seshdari y Manu Chopra desarrollaron Karya, una plataforma diseñada para facilitar tareas digitales a comunidades con pocos recursos, buscando crear empleo digno.
  • Karya permite que personas en áreas rurales y urbanas pobres se conecten al mundo digital y encuentren oportunidades laborales.

Experiencia en Amale: Recolección de Datos

  • En Amale, una aldea aislada sin acceso a tecnología moderna, se recolectaron datos del maratí usando Karya, revelando lecciones valiosas sobre orgullo lingüístico y valor comunitario.
  • La participación activa del pueblo en la recolección de datos fomentó un sentido de comunidad y promovió su lengua local mediante narración de historias.

Reflexiones sobre Tecnología y Comunidad

  • La importancia radica en centrar las intervenciones tecnológicas alrededor de las necesidades humanas; cualquier tecnología debe priorizar a los usuarios.

Aprendizajes del Proyecto VideoKheti

  • Un proyecto anterior llamado VideoKheti mostró que es crucial entender el contexto cultural al desarrollar tecnologías; errores como ruidos ambientales afectaron resultados.

Necesidad de Inversiones Lingüísticas

  • Los idiomas menos representados requieren inversiones significativas para beneficiarse adecuadamente de la tecnología del lenguaje.

¿Cómo la perseverancia puede llevar al éxito?

La importancia de los errores y la perseverancia

  • El proceso interactivo permite aprender de los errores rápidamente, lo que puede conducir a un gran éxito si se mantiene la perseverancia.
  • Se enfatiza que no rendirse es crucial para alcanzar metas y objetivos.

Historia inspiradora de Patricia O’Connor e Ysola Best

  • En los años 90, estas dos mujeres aborígenes australianas intentaron aprender su lengua nativa, el yugambeh, pero fueron desalentadas por expertos que afirmaron que estaba muerta.
  • A pesar del rechazo inicial, decidieron no rendirse y buscaron apoyo en su comunidad para recuperar tradiciones orales y literatura.

Fundación del Museo Yugambeh

  • Gracias a sus esfuerzos, fundaron el Museo Yugambeh, que se convirtió en un centro cultural y lingüístico vital para su comunidad.
Channel: TED
Video description

Visit http://TED.com to get our entire library of TED Talks, transcripts, translations, personalized talk recommendations and more. Thousands of languages thrive across the globe, yet modern speech technology -- with all of its benefits -- supports just over a hundred. Computational linguist Kalika Bali dreams of a day when technology acts as a bridge instead of a barrier, working passionately to build new and inclusive systems for the millions who speak low-resource languages. In this perspective-shifting talk, she outlines what happens when a language is omitted from the digital landscape -- and what can be gained when communities keep pace with the future. The TED Talks channel features the best talks and performances from the TED Conference, where the world's leading thinkers and doers give the talk of their lives in 18 minutes (or less). Look for talks on Technology, Entertainment and Design -- plus science, business, global issues, the arts and more. You're welcome to link to or embed these videos, forward them to others and share these ideas with people you know. Become a TED Member: http://ted.com/membership Follow TED on Twitter: http://twitter.com/TEDTalks Like TED on Facebook: http://facebook.com/TED Subscribe to our channel: http://youtube.com/TED TED's videos may be used for non-commercial purposes under a Creative Commons License, Attribution–Non Commercial–No Derivatives (or the CC BY – NC – ND 4.0 International) and in accordance with our TED Talks Usage Policy (https://www.ted.com/about/our-organization/our-policies-terms/ted-talks-usage-policy). For more information on using TED for commercial purposes (e.g. employee learning, in a film or online course), please submit a Media Request at https://media-requests.ted.com