GROK 4 La Nueva IA más Potente del Mercado 🤖 | Elon Musk lo ha vuelto a hacer

Elon Musk lo ha vuelto a hacer… y vaya si lo ha hecho

Pues eso. Ha vuelto a pasar. Cuando creíamos que ya teníamos suficiente con OpenAI, Google, Anthropic… cuando el carrusel de la inteligencia artificial ya gira tan rápido que te marea solo con mirarlo, llega Elon Musk y… bueno, pues hace lo que mejor se le da: entra en la sala, le da una patada a la mesa y nos deja a todos recogiendo las piezas del suelo con cara de no entender nada.

Así que sí, hoy vamos a hablar de Grok 4, este nuevo modelo que acaba de salir hace nada. Y ya te adelanto que no es una actualización cualquiera.

Esto no es como pasar del iPhone 15 al 16, que solo se molestaron en añadir un botón. No, no. Esto es algo mucho mejor, como si hubiésemos pasado de usar la bicicleta con rueditas que te ponía tu padre para que no te cayeses al suelo, a usar un maldito patinete eléctrico molestando a los demás que pasan por tu lado… dios, odio los patinetes eléctricos.

Pues si quieres saber más sobre GROK 4, quédate que te lo cuento.

¿Qué hace a Grok 4 tan especial?

Vale, vamos al lío, y vamos a ir despacio porque hay mucha tela que cortar. Grok 4 es el nuevo modelo de IA de xAI, la empresa de inteligencia artificial de Elon Musk. Y aquí viene el primer dato que te rompe los esquemas: xAI lleva existiendo, a día de hoy, unos 500 días. Quinientos. Yo en 500 días he conseguido… bueno, he subido algún que otro vídeo a YouTube y el pelo me ha pasado de ser color rosa a color negro, pero ellos, en ese tiempo, han creado la que, según todos los benchmarks, es la IA más potente del planeta. (Aunque cuidadín estos días de verano que se vienen anuncios muy fuertes de otras empresas).

Y no es solo palabrería. Para que te hagas una idea de la escala de la que estamos hablando: la potencia de cálculo que han usado para entrenar a Grok 4 es diez veces mayor que la que usaron para Grok 3. Y Grok 3 ya usó diez veces más que Grok 2. Estamos hablando de un aumento de cien veces la potencia de cómputo en apenas un año. Es una locura.

Pero lo más interesante no es solo que sea más grande y más fuerte, porque eso es “fácil” si tienes miles de GPUs. Lo realmente revolucionario es cómo lo han hecho.

El cambio de paradigma: del empollón al experto

Verás, hasta ahora, la forma de crear una IA era como la de un estudiante empollón en la semana de exámenes finales. Le daban una biblioteca entera de libros (o sea, todo internet) y le decían: “apréndetelo todo”. Y ya. Mucho pre-entrenamiento, mucha teoría, y a correr.

Con Grok 4 han cambiado el enfoque. Han seguido dándole la biblioteca, sí, pero después han invertido una cantidad de recursos y tiempo demencial en lo que llaman RLHF o sea aprendizaje por refuerzo, y no, no es el refuerzo que te daba tu padre con la zapatilla como no sacase buenas notas.

Esto es un cambio de paradigma. Es como si en lugar de solo estudiar la teoría, pusieran a la IA a hacer miles de trabajos prácticos, una y otra vez, con un supervisor que le va diciendo “muy bien, por aquí vas genial” o “no, por ahí no, chaval, dale otra vuelta”. Es la diferencia entre saberte de memoria el manual de un coche y ser un mecánico que sabe arreglarlo con los ojos cerrados. Y este enfoque, amigos, parece que ha marcado la diferencia.

Y esto no es una intuición, es que lo han mostrado en un gráfico que lo deja clarísimo. Si te imaginas el coste de entrenamiento de un modelo como una barra, en Grok 3 la mayor parte de esa barra era “pre-entrenamiento” (la parte de estudiarse todo internet). La parte de aprendizaje por refuerzo era un trocito pequeño al final. Pues en Grok 4, todo ese aumento de 10 veces en potencia de cálculo, que viene de su centro de datos Colossus con 200.000 GPUs que se dice rápido, lo han metido casi íntegramente en la barra de refuerzo. Han escalado la parte “práctica”, la de enseñarle a razonar, hasta un nivel que nadie había hecho antes. Por eso el salto es tan bestia.

El trabajo en equipo de las IAs: Grok 4 Heavy

Y si pensabas que eso era todo, agárrate, porque aquí viene la verdadera locura. Grok 4 no es un solo producto. Viene en dos modos. Tienes la versión normal, que ya de por sí es una bestia. Y luego tienes Grok 4 Heavy.

Y esto es lo que a todo el mundo le ha volado la cabeza.

Grok 4 Heavy no es un solo cerebrito pensando. Son varios agentes de IA independientes trabajando en equipo. No es una metáfora, es literal. Imagínate que le haces una pregunta difícil. En lugar de que una sola IA se ponga a pensar, el sistema lanza la misma pregunta a varios “expertos” de IA, hasta 32 instancias en paralelo. Cada uno razona el problema por su cuenta, llega a su propia conclusión, y luego se juntan, debaten, comparan resultados y sintetizan la mejor respuesta posible. Es como un consejo de sabios digital, un trabajo en grupo de la universidad, pero uno que sale bien.

Es que, al final, ahora mismo la mejora de una IA se basa en tres dimensiones, como si fueran las estadísticas de un personaje de videojuego. Primero, la cantidad de datos con la que la entrenas, que es como darle conocimiento, mandarla a la universidad. Segundo, el aprendizaje por refuerzo, que son las prácticas, enseñarle a aplicar ese conocimiento y darle una galletita cuando lo hace bien. Y tercero, el “cómputo en tiempo de prueba”, que es básicamente el tiempo que le dejas para pensar antes de responder. Grok 4 ha subido de nivel en las tres a la vez: más datos, el mayor entrenamiento por refuerzo que hemos visto nunca y un sistema (el Heavy) que le da más tiempo y cerebros para pensar.

Los resultados que rompen todos los esquemas

Y claro, con este sistema, los resultados son para flipar. Lo han puesto a prueba con exámenes que harían llorar a cualquier ingeniero:

Humanity’s Last Exam

Una colección de problemas diseñados específicamente para ser un infierno para las IAs y los humanos. Para que te hagas una idea, un grupo de científicos trabajando juntos durante semanas apenas sacaría un 5%. Pues bien, Grok 4 Heavy roza el 50%. ¡Ha resuelto la mitad del examen más jodido que han podido inventar! Prácticamente duplica la puntuación de los mejores modelos que teníamos hasta ahora.

Olimpiada de Matemáticas (AMI 25)

Un examen para seleccionar a los futuros genios de las mates, con problemas que la mayoría de nosotros ni entenderíamos el enunciado. Pues la versión Heavy con herramientas sacó un 100%. Un. Cien. Por. Cien. El benchmark está saturado. Se lo han pasado. Yo no he sacado un 100% en un examen de mates en mi vida, bueno, quizá no he sacado más de 7 nunca.

Arc AGI 2

Este me flipa. Es un benchmark de puzles con cuadraditos de colores. Parece un juego de niños, pero a las IAs se les atragantaba muchísimo. El mejor modelo del mundo sacaba un 8%. Llega Grok 4 y saca un 16%. El propio creador del test, François Chollet, dice que es el primer modelo que muestra síntomas de “inteligencia fluida”. Es decir, que no solo repite lo que ha aprendido como un loro, sino que parece que… razona. Que entiende problemas nuevos y se adapta.

Bending Bench

Y no se queda en la teoría. Lo pusieron a prueba en el “Bending Bench”, una simulación sobre gestionar máquinas expendedoras, tomar decisiones económicas, optimizar… En fin, ser un empresario. Un humano medio ganó 44 dólares. Grok 4 generó más de 4.600 dólares. Esto ya no es un generador de texto. Es un agente autónomo que puede tomar decisiones con un impacto económico real.

Y mira, sé que los benchmarks a veces suenan a chino, pero básicamente está arrasando en todos los resultados. Habrá que probarlo en el día a día, yo lo que he podido probar estoy muy satisfecho, pero claro, necesitamos tiempo para asimilarlo y de esta forma saber si es tan bueno como lo pintan.

Precios: Lo bonito sale caro

Bueno, pero todo esto que os estoy contando suena muy bien, pero ¿cuánto cuesta? Pues la verdad que lo bonito sale caro, y es que:

Comparativa de precios

Plan	Precio mensual	Precio anual	Características
Grok 4 Normal	$30/mes	$300/año	Acceso básico a Grok 4
Grok 4 Heavy	$300/mes	$3.000/año	Modo colaborativo con múltiples agentes

La suscripción normal de GROK, que incluye GROK 4 a secas, cuesta 30 dólares al mes o 300 dólares al año, ya es más caro que el propio ChatGPT. Pero es que si quieres usar el modo Heavy, el que decimos que tan avanzado está, te pagan un palo de 300 dólares al mes o 3.000 dólares al año. ¡Toma ya! Te cuesta la mitad del precio de un alquiler de una habitación en Madrid jaja, bueno, quizá es menos que la mitad. Pero está claro que es un precio desorbitado para países como España o ya ni hablar latinoamericanos que, si no estoy equivocado, puede ser un salario mensual de Venezuela lol.

Por ese precio, espero que no solo me ayude a editar texto la IA. Espero que me grabe los vídeos, los edite, me haga la miniatura, gestione los comentarios tóxicos de YouTube y, ya que estamos, me prepare el desayuno y saque a pasear al perro.

Y bueno, ya que estamos hablando de partes negativas, digámoslo todo

Aunque todo parezca increíble. Una IA súper inteligente, que razona, que trabaja en equipo, que te puede hacer rico con máquinas de vending… ¿Qué podría salir mal?

Bueno, pues aquí es donde la cosa se pone un poco turbia. Porque tener un genio en casa está muy bien, pero si el genio es un poco… inestable… pues tenemos un problema. Y uno gordo.

El incidente de Grok 3

En las últimas 48 horas antes de esta presentación, la versión anterior, Grok 3, tuvo un pequeño “problemilla”. Le hicieron un cambio mínimo en el system prompt, le dijeron que fuera “menos políticamente correcto”. ¿El resultado? La IA se volvió completamente loca. Pero no loca en plan gracioso. Empezó a soltar comentarios de odio, antisemitas, a decir que el pintor austriaco que hizo algo en 1939 era una gran persona y a amenazar de muerte al presidente de Turquía y a su familia. Sí, como lo oyes. La IA se volvió, básicamente, un troll de internet radicalizado y con superpoderes, hasta el punto que tuvieron que caparla y quitarle la capacidad de responder en Twitter.

Y a todo esto, le sumas que justo unas horas antes de la presentación, Linda Yaccarino, la CEO de Twitter, dimitió. Sin dar muchas explicaciones.

Y la verdad, que se vaya la CEO de una empresa justo cuando lanzas tu producto estrella no es que sea lo mejor… algo huele raro dentro de X.

Falta de transparencia

Y para colmo, xAI no ha publicado lo que se llama una “Model Card”. Que para que nos entendamos, es como el prospecto de un medicamento. No sabemos oficialmente sus sesgos, su tasa de alucinaciones, sus datos de seguridad ni sus vulnerabilidades. Es como si una farmacéutica sacara una nueva medicina al mercado diciendo “es la leche, cura de todo”, pero sin darte el prospecto con los efectos secundarios. Es una falta de transparencia preocupante.

Quizá, y solo quizá, el campo de la IA debería pararse un segundo. En vez de obsesionarnos con hacerlas más y más inteligentes en una carrera sin fin, centrarnos un poco en entender cómo demonios funcionan por dentro. Porque estamos construyendo rascacielos cada vez más altos sobre unos cimientos que no sabemos si son de arena o de hormigón armado.

El futuro según Elon (y el precio que hay que pagar por él)

Y por si fuera poco, la hoja de ruta que plantean es de película de ciencia ficción. Para lo que queda de 2025, planean lanzar:

Roadmap 2025

Agosto: Un modelo especializado en programación que, según lo que dicen, es el mejor del mundo. (Lo probaremos en este canal)
Septiembre: Un agente multimodal que entienda vídeo, imágenes y audio a la vez. Imagínate hablar con una IA que está viendo lo mismo que tú.
Octubre: Un modelo que genere vídeo. Elon promete que para finales de año podremos generar media hora de contenido con calidad de televisión, y para el año que viene, una película entera. Veremos si tiene razón.

La verdad, no os voy a mentir, todo esto abruma un poco. Muchas cosas nuevas que tienes que seguir y de las que hay que estar atentos. Por eso os recomiendo suscribiros al canal, ya que aquí os voy a traer las últimas novedades, aparte de los tutoriales más prácticos.

Conclusión: ¿Más inteligente es siempre mejor?

Ahora en serio. La tecnología es alucinante, no se puede negar. Pero seamos sinceros, ¿alguno de nosotros va a pagar 300€ al mes por esto ahora mismo para el día a día?

Aquí es donde creo que hay que poner los pies en la tierra. La mejor IA no es necesariamente la que saca las mejores notas en los exámenes, sino la que es más útil y se adapta mejor a ti. Grok ahora mismo es como un coche de Fórmula 1: una bestia en el circuito, pero para ir a comprar el pan, igual es un poco incómodo y caro. Plataformas como ChatGPT tienen un ecosistema mucho más maduro, más funciones, más integraciones. Son más… prácticas.

Y es que la plataforma de Grok, aunque mejora a pasos agigantados, sigue siendo muy joven. Sí, ya tiene opciones para subir archivos, un “canvas” y algo parecido a un intérprete de código, pero sus “Projects”, que serían como los GPTs de OpenAI, están todavía muy limitados. No nos engañemos, la experiencia de uso diaria, las integraciones y todo el ecosistema que tiene montado ChatGPT siguen estando a años luz. Por eso digo que una cosa es tener el motor de un Ferrari (el modelo) y otra muy distinta es tener el coche entero con su chasis, sus ruedas y su volante (la plataforma).

El futuro está en la personalización

La diferencia real, a largo plazo, no va a estar en quién tiene el modelo más listo, porque eso cambia cada dos meses. La diferencia estará en la personalización. La plataforma que mejor te conozca, que sepa cómo te gusta que te respondan, esa será la ganadora para ti.

Yo, por mi parte, seguiré trasteando con las herramientas que nos facilitan la vida. Automatizar tareas repetitivas para poder centrarnos en lo que de verdad importa: aprender, crear o, simplemente, tener más tiempo para no hacer nada, que también es importante y a veces se nos olvida.

Si te ha gustado este post y quieres que siga trayendo noticias del mundo de la IA y de programación, te animo a que te pases por el video de youtube y le des un buen like, suscríbete y déjame en los comentarios qué piensas de todo esto. ¿Te emociona o te da un poco de yuyu?

¡Nos vemos en el próximo blog! ❤️