En la madrugada de hoy, Elon Musk y tres líderes de investigación e ingeniería, presentaron Grok 3, la nueva versión de su inteligencia artificial que promete ser la más “inteligente del mundo”. Creada por xAI —la compañía de Musk dedicada al desarrollo de la IA—, los expertos mostraron las nuevas habilidades de este modelo.

Para ser precisos, Grok 3 es una familia de modelos. Por un lado, está Grok-3 Mini, la versión que se destaca por responder preguntas más rápido, sacrificando un poco de exactitud. Por otro lado, Grok-3, que conjuga todas las características funcionales más distintivas y evolucionadas, tiene una forma de razonar muy eficiente, con poca probabilidad de error.

Tanto en Grok-3 Mini como en Grok-3, los usuarios pueden elegir entre dos formas de razonar del modelo: “Pensar” (Think) o “Gran Cerebro” (Big Brain). La primera desplegará el razonamiento de Grok a medida que resuelve pedidos que no requieren tanta complejidad; la segunda está dirigida a prompts más difíciles que requieren un poder computacional más potente. En líneas generales, según TechCrunch, Grok 3 se recomienda para cuestiones relacionadas con las matemáticas, las ciencias y la programación.

Además, ambos modelos tienen la función de “Búsqueda Profunda” (Deep Search en inglés), que, según Musk, es el “buscador del futuro”. Esta herramienta permite que la inteligencia artificial analice toda la información en internet y brinde una respuesta que reúna los datos más relevantes para la investigación que el usuario busca.

Los próximos pasos para el mundo de Grok tienen que ver con darle una voz interactiva al chat conversacional, así como traer la función de traducir audio a texto para los usuarios. Por el momento, estos dos modelos están disponibles para suscriptores Premium+ de X, cuyo precio es de 50 dólares al mes. Las personas también pueden suscribirse al plan SuperGrok, que ofrecerá las capacidades más avanzadas y acceso anticipado a nuevas funciones por 30 dólares al mes -no incluye las funcinalidades premium de la red social X-.

Cómo se creó Grok

La ingeniería de Grok 3 se distingue gracias a su superordenador Colossus, construido en solo ocho meses. El sistema, equipado con 100,000 GPU Nvidia H100, proporcionó 200 millones de horas de procesamiento, lo que representa 10 veces más capacidad que su predecesor, Grok 2. Este salto en poder computacional permitió a Grok 3 procesar grandes volúmenes de datos con mayor eficiencia, reduciendo los tiempos de entrenamiento y mejorando su precisión.

A su vez, en el corazón de su desarrollo hay tres innovaciones particulares. Por un lado, el uso de datos sintéticos —es decir, información generada artificialmente— para su entrenamiento. “Le da más capacidad al modelo para manejar diferentes contextos de conversación”, explicó Fredi Vivas, ingeniero y docente de inteligencia artificial en la Universidad de San Andrés, a LA NACION. “Tampoco se usan datos reales, lo cual supone un cuidado a la privacidad interesante”, agregó.

Por otro lado, Grok 3 promete tener mecanismos de autocorrección que ayudan al modelo a identificar y corregir sus propios errores, mejorando la precisión de sus respuestas. Además, esta nueva actualización incluye el aprendizaje por refuerzo, que optimiza la toma de decisiones al entrenar la inteligencia artificial mediante un sistema de recompensas y penalizaciones. “Esto, en un buen escenario, trae una reducción de respuestas incorrectas, o mejor conocidas como alucinaciones”, comentó Vivas.

La más inteligente del mundo (y también políticamente incorrecta)

Para sustentar la ambiciosa afirmación de que esta nueva versión de Grok es la más poderosa hasta el momento, en la presentación se mostraron ciertos índices que evalúan la performance de los modelos más conocidos. Grok superó a todos en los diferentes indicadores.

Por un lado, en la prueba de rendimiento AIME, que evalúa cómo el modelo resuelve problemas de matemáticas, y en la de GPQA, que examina cómo los sistemas se desenvuelven en problemas relacionados con la física, la química y la biología a niveles de doctorado, Grok 3 y Grok-3 Mini superaron a sistemas como Gemini 2 Pro (Google), DeepSeek-V3 (China), Claude 3.5 Sonnet (Claude) y GPT-4o (OpenAI). Además, Grok 3 mostró competitividad en Chatbot Arena, una evaluación en la que los usuarios votan por las mejores respuestas de los diferentes chatbots conversacionales.

Los tres indicadores evaluaron la performance de Grok en relación a otros modelos de inteligencia artificial. Crédito: xAI.

Es importante destacar que hace dos años, cuando Musk fundó xAI, lo hizo bajo el paraguas de la lucha contra el “wokismo”, un anglicismo que se usa para denominar a un grupo de personas —muchas veces pertenecientes a partidos más progresistas— que velan por la corrección política, la inclusión y la diversidad (para los conservadores, en exceso).

Se ha visto reiteradamente cómo los modelos proporcionados por OpenAI o Google daban respuestas excesivamente inclusivas. Uno de los casos más destacados fue cuando Gemini, ante el pedido de que creara una imagen de un soldado alemán en la Segunda Guerra Mundial, brindó una ilustración de un nazi con rasgos asiáticos o afrodescendientes, lo que no cuadraba con la línea ideológica de la época.

Así es como Grok busca, como misión fundacional, dar las respuestas necesarias, no las políticamente correctas. Es más conocido como el chatbot conversacional “sin filtro” y usa un lenguaje inapropiado o poco formal que no se encuentra en ChatGPT, por ejemplo. Musk busca diariamente que Grok esté alineado con una línea de respuestas neutras o, como dice él, “una IA con máxima búsqueda de la verdad”. Así, asegura trabajar constantemente para eliminar los sesgos “de izquierda” que se han identificado previamente en el chatbot.