Sin embargo, solo pasaron minutos para que Elon Musk respondiera que su modelo Grok era mejor que la nueva herramienta de OpenAI, y que antes de fin de año anunciaría su evolución.

Hoy en día hay varias herramientas de IA en el mercado mundial, dominado principalmente por empresas provenientes de Estados Unidos, China, Francia y Reino Unido.

Además de GPT-5 se puede contar a Grok, Claude, LLaMA, Mistral, DeepSeek, entre tantos otros modelos de lenguaje, cada uno con diferentes características. Pero, siguendo la línea de Musk, ¿cuál es el mejor modelo de IA?, ¿qué necesita para ser mejor que otros?

“Eso de mejor es un término muy relativo: decir cuál mejor o cuál es peor. Lo que sí existe son algunas pruebas que se hacen a los modelos”, explicó Wester Zela, especialista en inteligencia artificial.

En comunicación con El Comercio, Zela explicó que estos modelos son sometidos a pruebas de razonamiento matemático, lógico y verbal, como si se trataran de exámenes de admisión. “Entonces, dependiendo para qué lo quieres utilizar, dependiendo del área de conocimiento, y usando algunos pruebas, tú puedes decir pues si es mejor o es peor” , indicó.

Además… Transformers Entender los actuales LLM nos debe remontar a unos ocho años. Explica Wester Zela que "el fundamento técnico que está detrás de estos LLM se se llama Transformers", que es un tipo de algoritmo desarrollado por Google. LO que hace es procesar y comprender una secuencia de datos. "A partir de ahí pues las empresas como OpenAI y el resto de empresas y universidades pues utilizaron esos algoritmos con muchas modificaciones", detalló el especialista en IA.

Pero también existen formas de medición, o benchmarks, que dan puntuaciones a los modelos de inteligencia artificial. Se trata de unos estándares que buscan medir el rendimiento de los modelos, generalmente establecidos por empresas que someten a estrés haciéndole preguntas, y a partir de las respuestas se genera un comparativo.

Amador Rivera, docente de Centrum PUCP, indicó que hoy puede ser que GPT-5 destaque más pero quizá esto cambie una vez salga Grok5, el modelo anunciado por Elon Musk. “Esto es una batalla de todos los días, y seguramente este va a sobresalir en algunos otros aspectos más. Y eso es importante tenerlo en cuenta. Ahora, la batalla está entre ChatGPT, Grok, Gemini, y entre Claude” , detalló.

La carrera de la IA

Cuando se habla de ChatGPT se habla de un producto de OpenAI, y ese producto funciona en base a modelos de lenguaje. Para este caso, el más desarrollado es GPT-5. Zela indicó que este nuevo modelo “parece estar más orientado a dar buenos o mejores resultados con respecto a lo que es programación” .

Según la misma empresa, GPT-5 es más inteligente y ofrece respuestas más útiles en matemáticas, ciencias, finanzas, derecho y mucho más. Puede resolver tareas complejas de principio a fin. GPT significa Generative Pre-trained Transformer, y es lo que está detrás de las aplicaciones de inteligencia artificial.

Otro de los modelos mencionados es Grok. Este es desarrollado por xAI, empresa del multimillonario Elon Musk. Aunque existe desde el 2023, este año ha tenido un repunte con su modelo Grok-4.

“Es bastante potente, bastante rápido su nivel de crecimiento. Pero tiene algo por lo cual ha sido criticado: en algún momento su modelo ha elogiado a Hitler, ha utilizado lenguaje ofensivo, ha mostrado contenido sexual y siempre provocando polémica”, dijo Rivera sobre este modelo.

Sam Altman (izq), CEO de OpenAI, y Elon Musk, dueño de xAI, en un enfrentamiento por el mejor modelo de IA. (Foto: AFP)

Otros modelos que están en competencia son Gemini 2.5 Pro, que pertenece a Google Deepmind y da vida a Gemini. Hasta hace unos meses era considerado el mejor de todos, según detalla un informe de Xataka, y destacó en mediciones de Humanity’s Last Exam, GPQA diamond, AIME 2025, LiveCodeBench v5 y SWE-bench verified.

Meta, la empresa de Mark Zuckerberg, tampoco se queda atrás y tiene su modelo LLaMA 3.1, con el que busca competir con GPT-4, predecesor del modelo GPT-5 de OpenAI. También se debe contar a Claude Opus 4.1, el modelo desarrollado por Anthropic. Por otro lado, Mistral AI también ofrece una gran variedad de modelos entre los que destaca Mistral Large 2.1.

Pero un punto aparte merece DeepSeek, la empresa china que en verano de este 2025 sorprendió el mercado mundial por lograr lo mismo que otras empresas de IA, pero con menos inversión. Trabaja con modelos como DeepSeek R1.

“La china DeepSeek ya dejó de ser una competencia fuerte porque pasó de moda. Igual sigue jugando, pero este ChatGPT tiene el 60% del mercado , así que difícilmente puede ser destronada, pero sí hay un crecimiento consistente de Grok-4″, indicó Amador Rivera. También es cuestionado por su sesgo al depender del gobierno de China.

Cómo entrenar a tu IA

Una de las claves para que un modelo de LLM sea mejor que otro es el entrenamiento.

“Que sea mejor o peor, no solamente depende del algoritmo, de la configuración de ese algoritmo, sino también de los datos que se utilizan para su entrenamiento. Si usted utiliza, por ejemplo, muchos más datos de programación, más conocimiento, más información y programación, obviamente tu modelo va a estar mejor preparado”, explicó Wester Zela sobre el trabajo con los modelos.

GPT-5, el modelo de IA más avanzado que ha desarrollado OpenAI. / OPENAI

Sin embargo, no toda información es importante para lo que se busca en un modelo de IA. Detalló que las marcas antes mencionadas trabajan con información proveniente de Internet, y que para una empresa el trabajo es diferente.

Es decir, si tú quieres obtener buenos resultados en tu empresa, en tu organización, tienes que pasarle datos de tu empresa al modelo de IA, y puede ser información sensible. “Entonces, ningún modelo entrenado, GPT-5, ni GPT-6, ni GPT-10, pues te vas a responder mejor que un modelo personalizado a tu organización. Y ese es el gran fallo que muchas veces no se toman en cuenta”, indicó Zela sobre la forma cómo trabajar con los modelos de IA.

Otro factor importante es la reducción de las alucinaciones, que se puede considerar como los errores o respuestas incorrectas que da un modelo de IA. En este caso, indica Rivera que puede deberse incluso en la generación de prompts, o instrucciones para el asistente de IA.

“Cuando haces un prompt básico, sencillo, sin contexto, como una herramienta de inteligencia artificial es un adivinador de palabras, te va a adivinar cualquier cosa. Entonces, si tú le das contexto, le das tono, semántica, rol, hace que te dé un resultado más consistente y el nivel de alucinación sea mucho muchísimo menor" , detalló sobre el trabajo con un chatbot.

Es así como avanza la carrera por el mejor modelo extenso de lenguaje (LLM); sin embargo, y como se ha visto, por más inteligente que pueda ser, su mejor resultado depende también del uso que le den las personas.