¿OpenAI se está quedando atrás en la ‘carrera armamentista’ de la inteligencia artificial?





Describir el desarrollo de la IA como una “carrera armamentista” puede parecer innecesariamente grandilocuente, pero hay una razón por la cual este término se ha vuelto de uso común. Resume la velocidad y la intensidad con la que las empresas están desarrollando e implementando sistemas de IA. Todos tienen que moverse rápido porque sus rivales se mueven rápido y nadie quiere quedarse atrás.

El 2 de diciembre de 2025, se informó ampliamente que Sam Altman había emitido un Código Rojo en una nota interna. El lanzamiento de Gemini 3 por parte de Google (incluidos Gemini 3 Pro y 3 Deep Think) el 18 de noviembre, y el lanzamiento de Claude Opus 4.5 por parte de Anthropic el 24 de noviembre, llevaron a la especulación de que ChatGPT de OpenAI estaba perdiendo su ventaja. The Atlantic publicó un artículo el 9 de diciembre diciendo que OpenAI se estaba “quedando atrás en la carrera de la IA”, declarando que “OpenAI no ha tenido una ventaja estable o incluso convincente en los principales puntos de referencia de la IA durante muchos meses”. Sin embargo, dos días es mucho tiempo en actualizaciones de inteligencia artificial porque el 11 de diciembre, OpenAI lanzó la versión 5.2 y, de repente, ChatGPT vuelve a estar en lo más alto.

Entonces, ¿ChatGPT es el mejor modelo de IA que existe? Como era de esperar, las cosas son mucho más complicadas que eso. OpenAI afirma que GPT-5.2 es mejor en trabajos de conocimiento profesional, como proyectos de varios pasos, presentaciones y hojas de cálculo. El lanzamiento más reciente de Gemini de Google tuvo que ver con la multimodalidad y la comprensión de los matices, mientras que a Claude de Anthropic se le da bien la codificación agente y la corrección de errores. Y como los diferentes sistemas de IA son buenos en diferentes cosas, ningún modelo es mejor en todo.

¿Qué tan bien le está yendo a ChatGPT en los puntos de referencia?

Cuando se trata de clasificar modelos de IA, se habla mucho de puntos de referencia. A la gente le gusta poner números a las cosas, por lo que los investigadores y las empresas de IA elaboran pruebas estandarizadas para medir y calificar qué tan bien se desempeña un sistema de IA en tareas particulares. Los puntos de referencia no están exentos de limitaciones. Las puntuaciones altas no significan necesariamente una mejor experiencia de usuario, y los modelos se pueden optimizar para superar las pruebas a expensas de ser más útiles. Sin embargo, los puntos de referencia siguen siendo los mejores datos que tenemos para comparar objetivamente los modelos de IA.

En GPQA Diamond, una compleja prueba de razonamiento basada en la ciencia, ChatGPT 5.2 Pro obtuvo una puntuación del 93,2%, que es mejor que cualquier otro modelo de IA. Gemini 3 Pro ocupa el segundo lugar con un 91,9%. En el punto de referencia ARC-AGI 2, ChatGPT obtuvo peores resultados. Esta prueba utiliza acertijos visuales que pretenden ser intuitivos para los humanos pero complicados para la IA, un poco como esos acertijos CAPTCHA que demuestran que no eres un robot. Puedes probar los rompecabezas tú mismo aquí. Aquí Claude Opus 4.5 supera significativamente a todos sus rivales.

Otro punto de referencia, el último examen de la humanidad (HLE), utiliza problemas abiertos de nivel experto con los que incluso los humanos más inteligentes luchan. Está destinado a ser el último examen académico significativo que los humanos puedan establecer para la IA. Una vez que la IA funcione consistentemente mejor que los humanos aquí, será más inteligente que nosotros y ya no podremos establecer pruebas significativas para medir la inteligencia artificial. La IA con mejor rendimiento en HLE en este momento es Gemini 3 Pro con un 45,8%. OpenAI afirma que ChatGPT 5.2 Pro obtiene una puntuación del 36,6%, lo que supone una mejora con respecto a la puntuación del 35,2% de GPT-5, pero aún lo sitúa en tercer lugar detrás de Gemini y una IA de código abierto menos conocida, Kimi K2 Thinking, que obtiene una puntuación del 44,9%.

Entonces, ¿OpenAI está en problemas?

En muchos puntos de referencia, ChatGPT de OpenAI se encuentra constantemente entre los cinco primeros modelos de IA y, en algunas especialidades, ocupa el primer lugar. Así que decir que se está quedando atrás parece un poco exagerado. Es decir, hasta que consideras cuánto más por delante solía estar de sus rivales. A lo largo de 2023 y la mayor parte de 2024, era mucho más probable que tomara la delantera en todos los puntos de referencia. Y hay otras formas de calificar los modelos de IA además de los puntos de referencia, como LMArena, una plataforma pública donde los usuarios comparan de forma anónima modelos de IA cara a cara.

El favorito general en LMArena al momento de escribir este artículo es Gemini 3 Pro, con ChatGPT en octavo lugar. En 2023, ChatGPT solía ocupar el primer lugar de manera constante en la plataforma (entonces llamada Chatbot Arena). A mediados de 2024, todavía encabezaba la lista. Sin embargo, a finales de 2024, ChatGPT se enfrentó a la competencia de Gemini, que tomó la delantera por primera vez. A lo largo de 2025, las grandes empresas de IA han ido superándose unas a otras, a menudo tomando la delantera después de un nuevo lanzamiento, solo para ser eclipsadas por la siguiente actualización de un rival.

Empresas como Google y Microsoft tienen una ventaja sobre OpenAI, ya que pueden incorporar Gemini y Copilot en herramientas que la gente ya está utilizando en un intento por aumentar la adopción de la IA. Sin embargo, cuando se trata de números de usuarios, los rivales de OpenAI tienen un largo camino por recorrer antes de acercarse a las cifras de OpenAI. ChatGPT tiene 5.600 millones de visitas mensuales y representa alrededor del 60% de todo el uso de IA. Su participación de mercado es mayor que la de Gemini, Claude, Grok, Copilot y todas las demás herramientas de inteligencia artificial juntas. Si bien puede que no sea necesariamente el favorito de los expertos en tecnología, a la mayoría de las personas en realidad no les importan los puntos de referencia. El puesto número uno de ChatGPT entre los usuarios habituales sigue siendo indiscutible.