¡Novedad en ChatGPT! o3 y o4 mini 🤯 Ahora razona usando HERRAMIENTAS e IMÁGENES

Name: ¡Novedad en ChatGPT! o3 y o4 mini 🤯 Ahora razona usando HERRAMIENTAS e IMÁGENES
Uploaded: 2025-04-17T11:17:24.000Z
Duration: 26 min 26 s

Actualización de Chat GPT: Nuevos Modelos Razonadores

Introducción a los nuevos modelos

OpenAI ha actualizado Chat GPT, incorporando nuevos modelos razonadores que pueden razonar con imágenes y utilizar diversas herramientas, como la generación y ejecución de código.

Se han presentado dos nuevos modelos: O3 y O4 Mini High, disponibles en el menú desplegable de Chat GPT.

Capacidades mejoradas

Los nuevos modelos ofrecen capacidades que desbloquean un conjunto de casos de uso innovadores, superando las limitaciones de versiones anteriores.

Estos modelos no solo piensan a partir de instrucciones, sino que también buscan información en internet y utilizan funciones avanzadas como el intérprete de código para generar visualizaciones.

Funcionalidades multimodales

La incorporación de capacidades multimodales permite a los modelos analizar imágenes junto con el razonamiento textual, ampliando su funcionalidad.

Por ejemplo, ahora pueden manipular imágenes usando Python para tareas específicas, como recortar o transformar imágenes según lo requerido.

Ejemplo práctico

Un caso ilustrativo muestra cómo Chat GPT puede analizar un documento científico y buscar información adicional en internet para proporcionar respuestas precisas.

En una demostración sobre física, se utilizó un póster antiguo donde el modelo buscó datos relevantes que no estaban presentes en el documento original.

Exploración del conocimiento

El modelo O3 fue capaz de navegar por la web para encontrar hallazgos recientes relacionados con un proyecto específico sobre física.

A pesar de no tener todos los datos necesarios en el póster original, el modelo logró extrapolar resultados y comparar con literatura actualizada.

Capacidades y Herramientas de los Modelos de CHGPT

Introducción a las Capacidades de los Modelos

Los modelos de CHGPT han sido entrenados para seleccionar y utilizar herramientas adecuadas, lo que representa un cambio significativo en su aplicación.

Se ha observado que estos modelos pueden saturar ciertos benchmarks, especialmente en matemáticas complejas, codificación y ciencia.

Resultados en Matemáticas

En el concurso AMI, los nuevos modelos alcanzan un 99% de precisión, mostrando una mejora notable respecto a sus predecesores.

Un ejemplo práctico muestra cómo el modelo resuelve problemas matemáticos complejos utilizando un enfoque inicial desordenado que luego refina para obtener una solución más elegante.

Comparación con Modelos Anteriores

Estos nuevos modelos no solo superan a sus predecesores en pruebas estándar, sino que también incorporan capacidades agénticas y la habilidad de usar herramientas dentro de Chat GPT.

A pesar del rendimiento superior, se destaca la competencia con otros agentes especializados como Deep Resars.

Ejemplos Prácticos y Casos de Uso

Usuarios han comenzado a mostrar ejemplos curiosos sobre las nuevas capacidades del modelo en Twitter.

Un usuario logró identificar un restaurante chino simplemente analizando el menú gracias a la capacidad del modelo para razonar sobre imágenes.

Análisis Avanzado de Imágenes

El modelo puede realizar análisis segmentados precisos sobre imágenes, permitiendo aislar partes relevantes para resolver tareas específicas.

Un ejemplo extremo incluye la solicitud a O3 para hacer zoom repetidamente hasta encontrar texto escrito a mano en una imagen.

Creatividad y Generación Multimedia

Aunque O3 no puede generar vídeos directamente, puede crear representaciones gráficas basadas en solicitudes creativas inusuales.

Se presentan ejemplos donde se le pide al modelo programar juegos interactivos como el juego de la serpiente o simulaciones físicas complejas con resultados satisfactorios.

¿Cómo se posicionan los nuevos modelos de OpenAI?

Simulación y Benchmarking

La simulación presentada muestra un comportamiento lógico, donde los resultados terminan en la parte inferior del hexágono, lo que indica una buena calidad en la simulación.

En cuanto a los benchmarks, el modelo O3 se destaca como líder en la mayoría de ellos, aunque el modelo Gemini 2.5 Pro supera al O3 en el benchmark de vista.

Se concluye que OpenAI ha recuperado su posición de liderazgo con una familia de modelos competitivos y efectivos.

Utilidad y Capacidades de IA

La utilidad de la inteligencia artificial está aumentando no solo por la mejora en la inteligencia de los modelos, sino también por su capacidad para integrar diferentes habilidades.

Se enfatiza la importancia del procesamiento multimodal y las capacidades de razonamiento que permitirán una mejor integración en herramientas agénticas.