Crea tu Propio Sistema de IA GRATIS y en LOCAL

Name: Crea tu Propio Sistema de IA GRATIS y en LOCAL
Uploaded: 2024-10-13T15:00:50.000Z
Duration: 28 min 30 s

¿Cómo utilizar una Inteligencia Artificial local y gratuita?

Introducción a la IA local

El video aborda cómo usar una inteligencia artificial (IA) sin costo, desarrollando proyectos y automatizaciones de manera local.

Se mencionan cuatro componentes necesarios: un modelo local (LLM), software, un sistema para trabajar con agentes y automatizaciones, y un lugar para almacenar datos.

Componentes necesarios

Modelo de Lenguaje Local

Se propone utilizar Olama como modelo de lenguaje que permite ejecutar modelos de forma local.

Olama ofrece acceso a varios modelos open source, incluyendo Llama 3.2 y Gema de Microsoft.

Embeddings

Los embeddings son cruciales para procesar documentos en la IA; convierten texto en vectores numéricos que la IA puede entender.

Este proceso implica transformar palabras en vectores, facilitando así la interacción con el modelo.

Software para Automatización

Uso de n8n

Se sugiere n8n como el software ideal para crear agentes y automatizaciones locales sin costo.

Bases Vectoriales

Para gestionar los embeddings se recomienda Krant, que permite almacenar vectores eficientemente.

Almacenamiento y Aislamiento del Entorno

Importancia de Docker

Se destaca el uso de Docker para aislar entornos, permitiendo ejecutar la IA sin interferir con otras aplicaciones del sistema.

Docker facilita la instalación y migración entre diferentes ordenadores, lo cual es esencial para mantener un entorno controlado.

Conclusión sobre Instalación

Guía de Instalación y Configuración de n8n

Proceso de Descarga e Instalación

Se debe descargar el software para MAC, Windows o Linux. Después de crear una cuenta, la interfaz inicial estará vacía debido a que no se ha instalado el programa.

La instalación de Docker, Olama y n8n es sencilla gracias al kit de inicio autoalojado proporcionado en GitHub por el equipo de n8n.

Para clonar el repositorio, se utiliza el comando git clone. Si no se tiene Git instalado, se puede descargar fácilmente desde su sitio web.

Comandos Esenciales para la Instalación

Una vez clonado el repositorio, hay que acceder a la carpeta del kit de inicio y ejecutar comandos específicos para instalar en Docker según el sistema operativo (NVIDIA, Mac o Windows sin NVIDIA).

El primer comando es git clone, seguido por cd self-hosted-ai-starter-kit para entrar en la carpeta correspondiente antes de ejecutar los comandos necesarios para Docker.

Proceso de Instalación en Docker

Al ejecutar los comandos en Docker, la primera instalación puede tardar considerablemente (hasta 50 minutos), ya que implica descargar modelos y otros componentes esenciales.

Los modelos pueden ocupar varios gigabytes; por lo tanto, es normal que la primera instalación sea más lenta. En instalaciones posteriores será más rápida.

Creación y Configuración Inicial en n8n

Al acceder a localhost después de la instalación, se debe crear una cuenta. Es importante recordar las credenciales para futuros inicios de sesión.

Aunque algunos usuarios pueden ver flujos de trabajo preexistentes si es su primera vez usando n8n, otros comenzarán desde cero.

Iniciando un Flujo de Trabajo

Para comenzar un flujo nuevo, se añade un paso inicial como "mensaje por chat". Luego se conecta a un agente mediante "Advanced AI Agents".

Se necesita tener instalado un modelo específico (como Olama 3.1). Para instalar nuevos modelos desde la librería Olama, hay que copiar e introducir comandos específicos en Docker.

Instalación Adicional Necesaria

La instalación del modelo puede llevar tiempo similar al proceso inicial debido a su tamaño. Es esencial tener paciencia durante esta fase.

Además del modelo principal (3.1), también es necesario instalar embeddings adicionales que no vienen preinstalados con base; esto requiere seguir pasos similares a los anteriores.

Instalación y Uso de Embeddings en Olam

Introducción a los Embeddings

Se mencionan varios tipos de embeddings, destacando el "mxb" como uno de los más comunes y recomendados para su uso en Olam.

Para instalar el embedding, se debe utilizar un comando específico que no viene preinstalado. Una vez instalado, aparecerá en n8n.

Configuración del Modelo

Es importante seleccionar el modelo adecuado al usar embeddings; si se utiliza un modelo de chat, no tiene sentido añadir ciertos embeddings ya que podría generar errores.

Se opta por una configuración sencilla utilizando "Windows buffer Memory" y un "vector Store" para subir documentos.

Selección del Modelo y Embedding

Al seleccionar el modelo en n8n, se escoge el "olama model", asegurando que esté correctamente configurado antes de realizar preguntas al chat.

Se menciona la importancia de cambiar la configuración a "conversational agent" para obtener respuestas adecuadas del modelo.

Rendimiento Local vs. Servidores Externos

Los modelos locales pueden tener un rendimiento inferior al trabajar con español comparado con inglés, pero ofrecen ventajas significativas como la seguridad y privacidad de datos.

Utilizar modelos localmente evita costos asociados a tokens o APIs, lo cual es beneficioso aunque puede resultar más lento.

Comunidad y Aprendizaje

Se destaca la creación de una comunidad gratuita que está creciendo rápidamente, así como planes para establecer una segunda comunidad de pago enfocada en aprender sobre inteligencia artificial y herramientas relacionadas.