Crea tu Propio Sistema de IA GRATIS y en LOCAL
¿Cómo utilizar una Inteligencia Artificial local y gratuita?
Introducción a la IA local
- El video aborda cómo usar una inteligencia artificial (IA) sin costo, desarrollando proyectos y automatizaciones de manera local.
- Se mencionan cuatro componentes necesarios: un modelo local (LLM), software, un sistema para trabajar con agentes y automatizaciones, y un lugar para almacenar datos.
Componentes necesarios
Modelo de Lenguaje Local
- Se propone utilizar Olama como modelo de lenguaje que permite ejecutar modelos de forma local.
- Olama ofrece acceso a varios modelos open source, incluyendo Llama 3.2 y Gema de Microsoft.
Embeddings
- Los embeddings son cruciales para procesar documentos en la IA; convierten texto en vectores numéricos que la IA puede entender.
- Este proceso implica transformar palabras en vectores, facilitando así la interacción con el modelo.
Software para Automatización
Uso de n8n
- Se sugiere n8n como el software ideal para crear agentes y automatizaciones locales sin costo.
Bases Vectoriales
- Para gestionar los embeddings se recomienda Krant, que permite almacenar vectores eficientemente.
Almacenamiento y Aislamiento del Entorno
Importancia de Docker
- Se destaca el uso de Docker para aislar entornos, permitiendo ejecutar la IA sin interferir con otras aplicaciones del sistema.
- Docker facilita la instalación y migración entre diferentes ordenadores, lo cual es esencial para mantener un entorno controlado.
Conclusión sobre Instalación
Guía de Instalación y Configuración de n8n
Proceso de Descarga e Instalación
- Se debe descargar el software para MAC, Windows o Linux. Después de crear una cuenta, la interfaz inicial estará vacía debido a que no se ha instalado el programa.
- La instalación de Docker, Olama y n8n es sencilla gracias al kit de inicio autoalojado proporcionado en GitHub por el equipo de n8n.
- Para clonar el repositorio, se utiliza el comando
git clone. Si no se tiene Git instalado, se puede descargar fácilmente desde su sitio web.
Comandos Esenciales para la Instalación
- Una vez clonado el repositorio, hay que acceder a la carpeta del kit de inicio y ejecutar comandos específicos para instalar en Docker según el sistema operativo (NVIDIA, Mac o Windows sin NVIDIA).
- El primer comando es
git clone, seguido porcd self-hosted-ai-starter-kitpara entrar en la carpeta correspondiente antes de ejecutar los comandos necesarios para Docker.
Proceso de Instalación en Docker
- Al ejecutar los comandos en Docker, la primera instalación puede tardar considerablemente (hasta 50 minutos), ya que implica descargar modelos y otros componentes esenciales.
- Los modelos pueden ocupar varios gigabytes; por lo tanto, es normal que la primera instalación sea más lenta. En instalaciones posteriores será más rápida.
Creación y Configuración Inicial en n8n
- Al acceder a localhost después de la instalación, se debe crear una cuenta. Es importante recordar las credenciales para futuros inicios de sesión.
- Aunque algunos usuarios pueden ver flujos de trabajo preexistentes si es su primera vez usando n8n, otros comenzarán desde cero.
Iniciando un Flujo de Trabajo
- Para comenzar un flujo nuevo, se añade un paso inicial como "mensaje por chat". Luego se conecta a un agente mediante "Advanced AI Agents".
- Se necesita tener instalado un modelo específico (como Olama 3.1). Para instalar nuevos modelos desde la librería Olama, hay que copiar e introducir comandos específicos en Docker.
Instalación Adicional Necesaria
- La instalación del modelo puede llevar tiempo similar al proceso inicial debido a su tamaño. Es esencial tener paciencia durante esta fase.
- Además del modelo principal (3.1), también es necesario instalar embeddings adicionales que no vienen preinstalados con base; esto requiere seguir pasos similares a los anteriores.
Instalación y Uso de Embeddings en Olam
Introducción a los Embeddings
- Se mencionan varios tipos de embeddings, destacando el "mxb" como uno de los más comunes y recomendados para su uso en Olam.
- Para instalar el embedding, se debe utilizar un comando específico que no viene preinstalado. Una vez instalado, aparecerá en n8n.
Configuración del Modelo
- Es importante seleccionar el modelo adecuado al usar embeddings; si se utiliza un modelo de chat, no tiene sentido añadir ciertos embeddings ya que podría generar errores.
- Se opta por una configuración sencilla utilizando "Windows buffer Memory" y un "vector Store" para subir documentos.
Selección del Modelo y Embedding
- Al seleccionar el modelo en n8n, se escoge el "olama model", asegurando que esté correctamente configurado antes de realizar preguntas al chat.
- Se menciona la importancia de cambiar la configuración a "conversational agent" para obtener respuestas adecuadas del modelo.
Rendimiento Local vs. Servidores Externos
- Los modelos locales pueden tener un rendimiento inferior al trabajar con español comparado con inglés, pero ofrecen ventajas significativas como la seguridad y privacidad de datos.
- Utilizar modelos localmente evita costos asociados a tokens o APIs, lo cual es beneficioso aunque puede resultar más lento.
Comunidad y Aprendizaje
- Se destaca la creación de una comunidad gratuita que está creciendo rápidamente, así como planes para establecer una segunda comunidad de pago enfocada en aprender sobre inteligencia artificial y herramientas relacionadas.