Las innovaciones en el campo de la inteligencia artificial (IA) son constantes y cada vez más avanzadas. OpenAI acaba de presentar un nuevo modelo llamado “o1”, conocido de forma coloquial como “Strawberry”. Desembarca con la promesa de abordar problemas más complejos que sus antecesores, haciendo gala de una capacidad de razonamiento superior.
La ventaja con respecto al modelo anterior es que fue el primero de una nueva serie entrenada para simular un proceso de pensamiento similar al humano, lo que constituye un hito significativo en la evolución de los grandes modelos de lenguaje.
“Entrenamos a estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder, como haría cualquier persona. Con el entrenamiento, aprenden a perfeccionar su proceso de pensamiento, probar distintas estrategias y reconocer sus errores”, dice la empresa.
Para alcanzar esta condición fue sometido a una nueva forma de entrenamiento, basado en el aprendizaje por refuerzo. Esto significa que GPT o1 ha sido entrenado a base de recompensas cuando ha alcanzado los objetivos y penalizaciones cuando no lo ha conseguido.
Lo cierto es que este modelo, aunque introduce un salto bastante importante en las ambiciones de la compañía estadounidense de recrear productos cada vez más sofisticados, no posee las características de búsqueda inmediata que hacen útil a ChatGPT.
El rendimiento de esta poderosa actualización, según lo expone OpenAI, es similar al razonamiento que alcanzan los estudiantes de doctorado en tareas de física, química y biología.
En un examen clasificatorio para la Olimpiada Internacional de Matemáticas (IMO), GPT-4o sólo resolvió correctamente el 13% de los problemas, mientras que el modelo de razonamiento obtuvo un 83%. Sus habilidades de codificación fueron evaluadas en concursos y alcanzaron el percentil 89 en las competiciones Codeforces.
Lo que implica que sus capacidades de razonamiento mejoradas pueden ser especialmente provechosas cuando un investigador se enfrentas a problemas complejos en ciencia, codificación, matemáticas y campos similares.
Así, los genetistas pueden utilizar o1 para anotar datos de secuenciación celular, los físicos para generar complicadas fórmulas matemáticas necesarias para la óptica cuántica y los desarrolladores de todos los campos para crear y ejecutar flujos de trabajo de varios pasos.
o1: cómo probar la nueva inteligencia artificial de OpenAI
El nuevo modelo de IA de la compañía aterriza a partir de hoy en ChatGPT. Pero este lanzamiento tiene varias particularidades. En primer lugar, que estamos ante una versión preliminar, por lo que su desarrollo todavía está muy activo. En segundo lugar, que será una opción de pago limitada.
Desde el menú desplegable de ChatGPT se podrá elegir el modelo que uno prefiera. En aquel recuadro también aparecerá el OpenAI o1-mini, un modelo más rápido principalmente destinado a tareas de programación. En todos los casos, cabe remarcar que o1 no será capaz de navegar por la web y analizar imágenes para ofrecer respuestas.
Otro dato importante es que o1 y o1-mini también estarán disponibles en la API de OpenAI, lo que permitirá a los desarrolladores impulsar aplicaciones con estos modelos.
Los precios para acceder a estos modelos son bastante diferentes. Mientras que 01 tiene un valor de 60 dólares por 1 millón de tokens de salida, 01-mini tiene un precio de 12 dólares por 1 millón de tokens de salida.
SL