¡Novedad en ChatGPT! o3 y o4 mini 🤯 Ahora razona usando HERRAMIENTAS e IMÁGENES
Actualización de Chat GPT: Nuevos Modelos Razonadores
Introducción a los nuevos modelos
- OpenAI ha actualizado Chat GPT, incorporando nuevos modelos razonadores que pueden razonar con imágenes y utilizar diversas herramientas, como la generación y ejecución de código.
- Se han presentado dos nuevos modelos: O3 y O4 Mini High, disponibles en el menú desplegable de Chat GPT.
Capacidades mejoradas
- Los nuevos modelos ofrecen capacidades que desbloquean un conjunto de casos de uso innovadores, superando las limitaciones de versiones anteriores.
- Estos modelos no solo piensan a partir de instrucciones, sino que también buscan información en internet y utilizan funciones avanzadas como el intérprete de código para generar visualizaciones.
Funcionalidades multimodales
- La incorporación de capacidades multimodales permite a los modelos analizar imágenes junto con el razonamiento textual, ampliando su funcionalidad.
- Por ejemplo, ahora pueden manipular imágenes usando Python para tareas específicas, como recortar o transformar imágenes según lo requerido.
Ejemplo práctico
- Un caso ilustrativo muestra cómo Chat GPT puede analizar un documento científico y buscar información adicional en internet para proporcionar respuestas precisas.
- En una demostración sobre física, se utilizó un póster antiguo donde el modelo buscó datos relevantes que no estaban presentes en el documento original.
Exploración del conocimiento
- El modelo O3 fue capaz de navegar por la web para encontrar hallazgos recientes relacionados con un proyecto específico sobre física.
- A pesar de no tener todos los datos necesarios en el póster original, el modelo logró extrapolar resultados y comparar con literatura actualizada.
Capacidades y Herramientas de los Modelos de CHGPT
Introducción a las Capacidades de los Modelos
- Los modelos de CHGPT han sido entrenados para seleccionar y utilizar herramientas adecuadas, lo que representa un cambio significativo en su aplicación.
- Se ha observado que estos modelos pueden saturar ciertos benchmarks, especialmente en matemáticas complejas, codificación y ciencia.
Resultados en Matemáticas
- En el concurso AMI, los nuevos modelos alcanzan un 99% de precisión, mostrando una mejora notable respecto a sus predecesores.
- Un ejemplo práctico muestra cómo el modelo resuelve problemas matemáticos complejos utilizando un enfoque inicial desordenado que luego refina para obtener una solución más elegante.
Comparación con Modelos Anteriores
- Estos nuevos modelos no solo superan a sus predecesores en pruebas estándar, sino que también incorporan capacidades agénticas y la habilidad de usar herramientas dentro de Chat GPT.
- A pesar del rendimiento superior, se destaca la competencia con otros agentes especializados como Deep Resars.
Ejemplos Prácticos y Casos de Uso
- Usuarios han comenzado a mostrar ejemplos curiosos sobre las nuevas capacidades del modelo en Twitter.
- Un usuario logró identificar un restaurante chino simplemente analizando el menú gracias a la capacidad del modelo para razonar sobre imágenes.
Análisis Avanzado de Imágenes
- El modelo puede realizar análisis segmentados precisos sobre imágenes, permitiendo aislar partes relevantes para resolver tareas específicas.
- Un ejemplo extremo incluye la solicitud a O3 para hacer zoom repetidamente hasta encontrar texto escrito a mano en una imagen.
Creatividad y Generación Multimedia
- Aunque O3 no puede generar vídeos directamente, puede crear representaciones gráficas basadas en solicitudes creativas inusuales.
- Se presentan ejemplos donde se le pide al modelo programar juegos interactivos como el juego de la serpiente o simulaciones físicas complejas con resultados satisfactorios.
¿Cómo se posicionan los nuevos modelos de OpenAI?
Simulación y Benchmarking
- La simulación presentada muestra un comportamiento lógico, donde los resultados terminan en la parte inferior del hexágono, lo que indica una buena calidad en la simulación.
- En cuanto a los benchmarks, el modelo O3 se destaca como líder en la mayoría de ellos, aunque el modelo Gemini 2.5 Pro supera al O3 en el benchmark de vista.
- Se concluye que OpenAI ha recuperado su posición de liderazgo con una familia de modelos competitivos y efectivos.
Utilidad y Capacidades de IA
- La utilidad de la inteligencia artificial está aumentando no solo por la mejora en la inteligencia de los modelos, sino también por su capacidad para integrar diferentes habilidades.
- Se enfatiza la importancia del procesamiento multimodal y las capacidades de razonamiento que permitirán una mejor integración en herramientas agénticas.