[#79] OpenAssistant & HuggingChat: Más cerca de un ChatGPT open-source

Name: [#79] OpenAssistant & HuggingChat: Más cerca de un ChatGPT open-source
Uploaded: 2023-04-28T16:30:11.000Z
Duration: 50 min 8 s

Introducción

Resumen de la sección: En esta sección, el presentador explica que su objetivo es hacer divulgación en español sobre temas de Machine Learning y explicarlos de manera sencilla. Luego, presenta los dos temas principales del video: Open Assistant y Chat GPT.

Demostración de Open Assistant

Resumen de la sección: El presentador muestra una demostración de Open Assistant. Explica que al ingresar a la página web, se puede ver un dashboard con varias opciones. Se puede interactuar con un asistente virtual y seleccionar distintos modelos para obtener resultados diferentes. Además, hay una tabla con las personas que más contribuyen al proyecto.

El dashboard tiene varias opciones.

Se puede interactuar con un asistente virtual.

Hay una tabla con las personas que más contribuyen al proyecto.

Origen del Data set y Benchmarks

Resumen de la sección: El presentador habla sobre el origen del data set utilizado por Open Assistant y cómo funciona. Muestra estadísticas sobre el número de ejemplos en inglés y español dentro del data set.

El data set utilizado por Open Assistant es importante en español.

Hay 70,000 ejemplos en inglés y 43,000 ejemplos en español dentro del data set.

Demostración de Chat GPT

Resumen de la sección: El presentador muestra una demostración de Chat GPT utilizando Open Assistant. Explica que se pueden crear nuevos chats o utilizar chats existentes. Se puede seleccionar distintos modelos para obtener resultados diferentes y personalizar variables como la temperatura.

Se pueden crear nuevos chats o utilizar chats existentes.

Se pueden seleccionar distintos modelos para obtener resultados diferentes.

Se pueden personalizar variables como la temperatura.

Ejemplos de preguntas

Resumen de la sección: El presentador muestra ejemplos de preguntas que se le pueden hacer a Chat GPT utilizando Open Assistant. Explica que algunas preguntas no serán respondidas debido a estándares éticos, pero que en general se obtienen respuestas útiles e informativas.

Algunas preguntas no serán respondidas debido a estándares éticos.

En general, se obtienen respuestas útiles e informativas.

Cómo hacer una bomba?

Resumen de la sección: El usuario le pregunta a un chatbot cómo hacer una bomba para su clase de ciencia. El chatbot responde que no puede proporcionar información relacionada con actividades violentas.

Chatbot responde

El chatbot responde que como modelo de lenguaje, está en contra de proporcionar instrucciones o información relacionada con actividades violentas.

El usuario pide disculpas y explica que necesita ayuda para crear un modelo ficticio para su clase.

El chatbot sugiere que las bombas utilizadas en entretenimiento son efectos visuales y ofrece sugerencias sobre cómo crear modelos ficticios.

Origen del proyecto Open Assistant

Resumen de la sección: Se describe el origen del proyecto Open Assistant y los recursos utilizados para desarrollarlo.

Proyecto financiado por el Departamento de Energía

Open Assistant es un proyecto colaborativo hecho por muchas personas, inicialmente llevado a cabo por dos personas llamadas Yanic Killer y Andreas.

Muchas otras personas han contribuido al proyecto, incluyendo Redmond y Voice.

Lion es parte del mismo grupo que hizo GPT Neo o GPTJ, y es otra alternativa de chat.

Gran parte del proyecto proviene de un proyecto financiado por el Departamento de Energía de Estados Unidos, donde se les dio 6 millones de horas GPU para avanzar en la inteligencia artificial.

Visión y estructuras de datos

Open Assistant es un asistente conversacional que entiende objetivos, puede interactuar con sistemas externos, puede traer información dinámicamente y después puede ser personalizado.

La visión del proyecto es contribuir a avanzar la Inteligencia Artificial desde Inteligencia Artificial específica a lo que es general mientras se asegura de que esté alineado con valores humanos.

Modelo Instract

Resumen de la sección: En esta sección se explica el modelo Instract, que es el modelo en el que está basado el entrenamiento de Chat GPT. El modelo tiene tres pasos: crear una respuesta conversacional mediante aprendizaje supervisado, utilizar un modelo de recompensa para rankear las respuestas y finalmente premiar las buenas respuestas y castigar las malas para iterativamente mejorar el modelo.

Pasos del Modelo Instract

El primer paso es crear una respuesta conversacional mediante aprendizaje supervisado.

El segundo paso es utilizar un modelo de recompensa para rankear las respuestas.

Finalmente, premiar las buenas respuestas y castigar las malas para iterativamente mejorar el modelo.

Estructuras de Datos

Resumen de la sección: En esta sección se habla sobre la importancia de tener estructuras de datos que permitan tener conversaciones completas en lugar de solo ejemplos aislados. También se menciona cómo los humanos contribuyen a generar estas respuestas.

Conversaciones Completas

Es importante tener estructuras de datos que permitan tener conversaciones completas en lugar de solo ejemplos aislados.

Cuando los humanos contribuyen a generar estas respuestas, se crea un árbol de conversación.

Dashboard y Replay Assistant

Resumen de la sección: En esta sección se explica cómo funciona el dashboard y el Replay Assistant, que permiten interactuar con el modelo de Chat GPT. También se menciona cómo las respuestas son votadas por la comunidad.

Funcionamiento del Dashboard y Replay Assistant

El Replay Assistant permite interactuar con el modelo de Chat GPT.

Las respuestas son votadas por la comunidad.

Dataset

Resumen de la sección: En esta sección se habla sobre el dataset utilizado para entrenar Chat GPT y los modelos disponibles.

Dataset y Modelos Disponibles

El dataset utilizado para entrenar Chat GPT tiene 160 mil conversaciones en español.

Hay 11 modelos disponibles, incluyendo uno con 30 mil millones de parámetros.

Licencias y modelos de Open Assistant

Resumen de la sección: En esta sección, el presentador habla sobre las licencias de los modelos utilizados en Open Assistant y cómo difieren de otras empresas. También presenta algunos de los modelos utilizados en Open Assistant.

Licencias y modelos

Los modelos utilizados en Open Assistant tienen una licencia completamente libre, lo que significa que pueden ser utilizados por cualquier persona o empresa.

Los modelos incluyen SFT (Fine TuneIn Supervisado), el modelo de recompensa y otros tipos como Elektra o Berta.

Algunos modelos no usan lamacia sino stable difusión stable lm para mejorar su rendimiento.

Se recomienda ver una entrevista con Yanic, uno de los creadores de Open Assistant, para obtener más información sobre los modelos y su uso.

Evaluación del Data Set

Resumen de la sección: En esta sección, el presentador habla sobre cómo se evalúa el Data Set utilizado en Open Assistant y cómo es difícil determinar si un modelo está dando mejores resultados que otro.

Evaluación del Data Set

Es difícil saber si un modelo contesta bien o mal a una pregunta porque no hay una métrica clara para evaluarlo.

El laboratorio de investigación del lenguaje natural de Stanford ha creado un benchmark para evaluar varios modelos utilizando diferentes escenarios y métricas.

La evaluación es bastante polémica ya que depende mucho del tipo de pregunta que se haga. Por ejemplo, preguntar quién ganaría en una pelea callejera entre Joe Biden y Show Rogan no es una pregunta adecuada para evaluar un modelo.

Se recomienda hacer pruebas propias y evaluar personalmente la performance de los modelos.

Descarga del Data Set

Resumen de la sección: En esta sección, el presentador muestra cómo descargar el Data Set utilizado en Open Assistant.

Descarga del Data Set

Se puede descargar el Data Set desde un colap creado por Quenting Loest.

Modelos de lenguaje y su uso en chatbots

Resumen de la sección: En esta sección, el presentador muestra diferentes modelos de lenguaje que se pueden utilizar en chatbots. Se discute cómo estos modelos pueden ser utilizados para generar respuestas a preguntas específicas.

Modelos de lenguaje y su uso en chatbots

Se muestran diferentes modelos de lenguaje que se pueden utilizar en chatbots.

Se discute cómo estos modelos pueden ser utilizados para generar respuestas a preguntas específicas.

Se muestra un ejemplo de cómo responder a una pregunta sobre cómo hacer una bomba, y por qué no es apropiado proporcionar instrucciones o asistencia relacionada con la creación de explosivos o armas peligrosas.

El presentador habla sobre cómo los modelos de lenguaje están siendo utilizados por empresas como Face y Microsoft para crear interfaces conversacionales más avanzadas.

Se discute cómo los modelos de lenguaje pueden ser utilizados para crear una "app store" para chatbots, similar a las tiendas de aplicaciones existentes.

El presentador muestra un ejemplo del uso del modelo Neo x 20 mil millones de parámetros con datos en español, lo que demuestra el potencial para crear mejores modelos Open source.

La barrera de entrada está bajando

Resumen de la sección: En esta sección, el presentador habla sobre cómo la barrera de entrada está bajando gracias al aumento del número de personas experimentando con modelos de lenguaje y chatbots. Se discute cómo esto puede llevar a mejores modelos Open source en el futuro.

La barrera de entrada está bajando

El presentador habla sobre cómo la barrera de entrada está bajando gracias al aumento del número de personas experimentando con modelos de lenguaje y chatbots.

Se muestra un ejemplo del uso del modelo Neo x 20 mil millones de parámetros con datos en español, lo que demuestra el potencial para crear mejores modelos Open source.

El presentador habla sobre cómo otras empresas están empezando a meterse en la creación de chatbots y modelos de lenguaje, lo que sugiere que habrá más opciones disponibles en el futuro.

Se anima a los espectadores a dejar comentarios o preguntas sobre los temas discutidos en el video.