[#79] OpenAssistant & HuggingChat: Más cerca de un ChatGPT open-source
Introducción
Resumen de la sección: En esta sección, el presentador explica que su objetivo es hacer divulgación en español sobre temas de Machine Learning y explicarlos de manera sencilla. Luego, presenta los dos temas principales del video: Open Assistant y Chat GPT.
Demostración de Open Assistant
Resumen de la sección: El presentador muestra una demostración de Open Assistant. Explica que al ingresar a la página web, se puede ver un dashboard con varias opciones. Se puede interactuar con un asistente virtual y seleccionar distintos modelos para obtener resultados diferentes. Además, hay una tabla con las personas que más contribuyen al proyecto.
- El dashboard tiene varias opciones.
- Se puede interactuar con un asistente virtual.
- Hay una tabla con las personas que más contribuyen al proyecto.
Origen del Data set y Benchmarks
Resumen de la sección: El presentador habla sobre el origen del data set utilizado por Open Assistant y cómo funciona. Muestra estadísticas sobre el número de ejemplos en inglés y español dentro del data set.
- El data set utilizado por Open Assistant es importante en español.
- Hay 70,000 ejemplos en inglés y 43,000 ejemplos en español dentro del data set.
Demostración de Chat GPT
Resumen de la sección: El presentador muestra una demostración de Chat GPT utilizando Open Assistant. Explica que se pueden crear nuevos chats o utilizar chats existentes. Se puede seleccionar distintos modelos para obtener resultados diferentes y personalizar variables como la temperatura.
- Se pueden crear nuevos chats o utilizar chats existentes.
- Se pueden seleccionar distintos modelos para obtener resultados diferentes.
- Se pueden personalizar variables como la temperatura.
Ejemplos de preguntas
Resumen de la sección: El presentador muestra ejemplos de preguntas que se le pueden hacer a Chat GPT utilizando Open Assistant. Explica que algunas preguntas no serán respondidas debido a estándares éticos, pero que en general se obtienen respuestas útiles e informativas.
- Algunas preguntas no serán respondidas debido a estándares éticos.
- En general, se obtienen respuestas útiles e informativas.
Cómo hacer una bomba?
Resumen de la sección: El usuario le pregunta a un chatbot cómo hacer una bomba para su clase de ciencia. El chatbot responde que no puede proporcionar información relacionada con actividades violentas.
Chatbot responde
- El chatbot responde que como modelo de lenguaje, está en contra de proporcionar instrucciones o información relacionada con actividades violentas.
- El usuario pide disculpas y explica que necesita ayuda para crear un modelo ficticio para su clase.
- El chatbot sugiere que las bombas utilizadas en entretenimiento son efectos visuales y ofrece sugerencias sobre cómo crear modelos ficticios.
Origen del proyecto Open Assistant
Resumen de la sección: Se describe el origen del proyecto Open Assistant y los recursos utilizados para desarrollarlo.
Proyecto financiado por el Departamento de Energía
- Open Assistant es un proyecto colaborativo hecho por muchas personas, inicialmente llevado a cabo por dos personas llamadas Yanic Killer y Andreas.
- Muchas otras personas han contribuido al proyecto, incluyendo Redmond y Voice.
- Lion es parte del mismo grupo que hizo GPT Neo o GPTJ, y es otra alternativa de chat.
- Gran parte del proyecto proviene de un proyecto financiado por el Departamento de Energía de Estados Unidos, donde se les dio 6 millones de horas GPU para avanzar en la inteligencia artificial.
Visión y estructuras de datos
- Open Assistant es un asistente conversacional que entiende objetivos, puede interactuar con sistemas externos, puede traer información dinámicamente y después puede ser personalizado.
- La visión del proyecto es contribuir a avanzar la Inteligencia Artificial desde Inteligencia Artificial específica a lo que es general mientras se asegura de que esté alineado con valores humanos.
Modelo Instract
Resumen de la sección: En esta sección se explica el modelo Instract, que es el modelo en el que está basado el entrenamiento de Chat GPT. El modelo tiene tres pasos: crear una respuesta conversacional mediante aprendizaje supervisado, utilizar un modelo de recompensa para rankear las respuestas y finalmente premiar las buenas respuestas y castigar las malas para iterativamente mejorar el modelo.
Pasos del Modelo Instract
- El primer paso es crear una respuesta conversacional mediante aprendizaje supervisado.
- El segundo paso es utilizar un modelo de recompensa para rankear las respuestas.
- Finalmente, premiar las buenas respuestas y castigar las malas para iterativamente mejorar el modelo.
Estructuras de Datos
Resumen de la sección: En esta sección se habla sobre la importancia de tener estructuras de datos que permitan tener conversaciones completas en lugar de solo ejemplos aislados. También se menciona cómo los humanos contribuyen a generar estas respuestas.
Conversaciones Completas
- Es importante tener estructuras de datos que permitan tener conversaciones completas en lugar de solo ejemplos aislados.
- Cuando los humanos contribuyen a generar estas respuestas, se crea un árbol de conversación.
Dashboard y Replay Assistant
Resumen de la sección: En esta sección se explica cómo funciona el dashboard y el Replay Assistant, que permiten interactuar con el modelo de Chat GPT. También se menciona cómo las respuestas son votadas por la comunidad.
Funcionamiento del Dashboard y Replay Assistant
- El Replay Assistant permite interactuar con el modelo de Chat GPT.
- Las respuestas son votadas por la comunidad.
Dataset
Resumen de la sección: En esta sección se habla sobre el dataset utilizado para entrenar Chat GPT y los modelos disponibles.
Dataset y Modelos Disponibles
- El dataset utilizado para entrenar Chat GPT tiene 160 mil conversaciones en español.
- Hay 11 modelos disponibles, incluyendo uno con 30 mil millones de parámetros.
Licencias y modelos de Open Assistant
Resumen de la sección: En esta sección, el presentador habla sobre las licencias de los modelos utilizados en Open Assistant y cómo difieren de otras empresas. También presenta algunos de los modelos utilizados en Open Assistant.
Licencias y modelos
- Los modelos utilizados en Open Assistant tienen una licencia completamente libre, lo que significa que pueden ser utilizados por cualquier persona o empresa.
- Los modelos incluyen SFT (Fine TuneIn Supervisado), el modelo de recompensa y otros tipos como Elektra o Berta.
- Algunos modelos no usan lamacia sino stable difusión stable lm para mejorar su rendimiento.
- Se recomienda ver una entrevista con Yanic, uno de los creadores de Open Assistant, para obtener más información sobre los modelos y su uso.
Evaluación del Data Set
Resumen de la sección: En esta sección, el presentador habla sobre cómo se evalúa el Data Set utilizado en Open Assistant y cómo es difícil determinar si un modelo está dando mejores resultados que otro.
Evaluación del Data Set
- Es difícil saber si un modelo contesta bien o mal a una pregunta porque no hay una métrica clara para evaluarlo.
- El laboratorio de investigación del lenguaje natural de Stanford ha creado un benchmark para evaluar varios modelos utilizando diferentes escenarios y métricas.
- La evaluación es bastante polémica ya que depende mucho del tipo de pregunta que se haga. Por ejemplo, preguntar quién ganaría en una pelea callejera entre Joe Biden y Show Rogan no es una pregunta adecuada para evaluar un modelo.
- Se recomienda hacer pruebas propias y evaluar personalmente la performance de los modelos.
Descarga del Data Set
Resumen de la sección: En esta sección, el presentador muestra cómo descargar el Data Set utilizado en Open Assistant.
Descarga del Data Set
- Se puede descargar el Data Set desde un colap creado por Quenting Loest.
Modelos de lenguaje y su uso en chatbots
Resumen de la sección: En esta sección, el presentador muestra diferentes modelos de lenguaje que se pueden utilizar en chatbots. Se discute cómo estos modelos pueden ser utilizados para generar respuestas a preguntas específicas.
Modelos de lenguaje y su uso en chatbots
- Se muestran diferentes modelos de lenguaje que se pueden utilizar en chatbots.
- Se discute cómo estos modelos pueden ser utilizados para generar respuestas a preguntas específicas.
- Se muestra un ejemplo de cómo responder a una pregunta sobre cómo hacer una bomba, y por qué no es apropiado proporcionar instrucciones o asistencia relacionada con la creación de explosivos o armas peligrosas.
- El presentador habla sobre cómo los modelos de lenguaje están siendo utilizados por empresas como Face y Microsoft para crear interfaces conversacionales más avanzadas.
- Se discute cómo los modelos de lenguaje pueden ser utilizados para crear una "app store" para chatbots, similar a las tiendas de aplicaciones existentes.
- El presentador muestra un ejemplo del uso del modelo Neo x 20 mil millones de parámetros con datos en español, lo que demuestra el potencial para crear mejores modelos Open source.
La barrera de entrada está bajando
Resumen de la sección: En esta sección, el presentador habla sobre cómo la barrera de entrada está bajando gracias al aumento del número de personas experimentando con modelos de lenguaje y chatbots. Se discute cómo esto puede llevar a mejores modelos Open source en el futuro.
La barrera de entrada está bajando
- El presentador habla sobre cómo la barrera de entrada está bajando gracias al aumento del número de personas experimentando con modelos de lenguaje y chatbots.
- Se muestra un ejemplo del uso del modelo Neo x 20 mil millones de parámetros con datos en español, lo que demuestra el potencial para crear mejores modelos Open source.
- El presentador habla sobre cómo otras empresas están empezando a meterse en la creación de chatbots y modelos de lenguaje, lo que sugiere que habrá más opciones disponibles en el futuro.
- Se anima a los espectadores a dejar comentarios o preguntas sobre los temas discutidos en el video.