NVIDIA ha desvelado su nueva plataforma de inteligencia artificial, Vera Rubin, un sistema integrado por siete chips distintos que ya se encuentra en fase de producción total y que ha sumado a los principales actores del sector, desde Anthropic y OpenAI hasta Meta y Mistral AI, junto con todos los grandes proveedores de nube. El mensaje, lanzado durante la conferencia GTC de la compañía, es claro: la empresa no da tregua en la carrera por la infraestructura de la IA. Según explicó su consejero delegado, Jensen Huang, esta plataforma promete hasta diez veces más rendimiento en inferencia por vatio y una décima parte del coste por token en comparación con los sistemas Blackwell, que empezaron a distribuirse recientemente. Huang lo calificó como un “salto generacional” que inaugurará “la mayor expansión de infraestructura de la historia”.
El alcance de Vera Rubin trasciende el centro de datos. AWS, Google Cloud, Microsoft Azure y Oracle ya ofrecerán esta plataforma, y más de ochenta socios fabricantes desarrollan sistemas a partir de ella. La arquitectura combina la CPU Vera, la GPU Rubin, el switch NVLink 6, la SuperNIC ConnectX-9, la DPU BlueField-4, el switch Ethernet Spectrum-6 y el acelerador de inferencia Groq 3 LPU, organizados en cinco sistemas a escala de rack que funcionan como un supercomputador unificado.
El rack estrella, NVL72, integra 72 GPUs Rubin y 36 CPUs Vera conectadas mediante NVLink 6. NVIDIA afirma que permite entrenar modelos de mezcla de expertos using solo una cuarta parte de las GPUs necesarias con Blackwell, lo que, de confirmarse, transformaría la economía de los sistemas de IA de vanguardia. Por su parte, el rack de CPU Vera alberga 256 procesadores refrigerados por líquido, capaz de sostener más de 22.500 entornos concurrentes, diseñados específicamente para el razonamiento autónomo y el aprendizaje por refuerzo. El rack Groq 3 LPX se centra en la baja latencia para modelos de billones de parámetros, mientras que el rack BlueField-4 STX proporciona lo que la compañía llama “memoria de contexto”, y el Spectrum-6 SPX Ethernet une todo con una eficiencia óptica cinco veces superior.
El hilo conductor de los anuncios es la apuesta decidida de NVIDIA por la “IA agentica”: sistemas que razonan de forma autónoma durante horas o días, ejecutan código, utilizan herramientas externas y mejoran continuamente. Esto exige un equilibrio completamente nuevo entre potencia de cálculo, memoria, almacenamiento y red. Para abordarlo, la compañía lanzó su Agent Toolkit, que incluye OpenShell, un runtime de código abierto para aplicar medidas de seguridad y privacidad a agentes autónomos. Empresas como Adobe, Salesforce, SAP o Siemens ya lo están integrando. También presentó NemoClaw, un stack que permite instalar modelos Nemotron y OpenShell en un solo comando, y Dynamo 1.0, descrito como el primer “sistema operativo” para inferencia a escala industrial, que ya ha sido adoptado por gigantes de la nube y compañías como Pinterest o PayPal.
Paralelamente, NVIDIA anunció la Coalición Nemotron, una colaboración global con laboratorios de IA como Mistral AI o el equipo liderado por la exdirectiva de OpenAI Mira Murati para desarrollar modelos frontera de código abierto entrenados en DGX Cloud. La compañía amplió significativamente su propia cartera de modelos, con Nemotron 3 Ultra (eficiencia cinco veces mayor en Blackwell), Nemotron 3 Omni (multimodal) y Nemotron 3 VoiceChat, además de previewar GR00T N2, un modelo de robótica que duplica el éxito en tareas nuevas.
La presencia de NVIDIA en sectores más allá de la tecnología es notable. En el ámbito sanitario, Roche desplegará más de 3.500 GPUs Blackwell, acelerando el diseño de fármacos y el uso de gemelos digitales. En automoción, BYD, Geely, Isuzu y Nissan desarrollan vehículos de nivel 4 sobre la plataforma Drive Hyperion, y la ampliación de la alianza con Uber prevé el lanzamiento de servicios en 28 ciudades para 2028. También presentó la primera plataforma física de IA para robots quirúrgicos, basada en el mayor conjunto de datos sanitarios del mundo. Y hasta el espacio: el módulo espacial Vera Rubin ofrece hasta 25 veces más capacidad de inferencia orbital que la GPU H100, con socios como Axiom Space o Planet Labs.
En un movimiento más discreto pero estratégico, NVIDIA lanzó DGX Station, un sistema de sobremesa con el chip Grace Blackwell Ultra que permite ejecutar modelos de hasta un billón de parámetros desde una oficina, con opciones de aireado para industrias reguladas. Snowflake, Microsoft Research o la Universidad de Cornell ya lo utilizan. Asimismo, DGX Spark permite agrupar hasta cuatro unidades en un “centro de datos de escritorio”.
La compañía también profundizó en aplicaciones verticales. Junto a Adobe, desarrollará modelos Firefly de nueva generación y una solución de gemelos digitales 3D en Omniverse. Más ambicioso aún es el diseño de referencia DSX AI Factory, un plano para construir edificios completos optimizados para generar “tokens de inteligencia”, maximizando tokens por vatio y conectándose a redes eléctricas para liberar capacidad atrapada. Nscale y Caterpillar ya construyen una de las mayores fábricas de IA en Virginia Occidental con este diseño.
La visión de NVIDIA es impresionante en escala y coherencia: abarca desde silicio personalizado hasta aplicaciones en descubrimiento de fármacos, conducción autónoma o computación orbital. Sin embargo, queda por ver si las afirmaciones de rendimiento se validan en benchmarks independientes y si la tesis de la IA agentica se materializa como principal carga de trabajo. Además, el papel cada vez más amplio de NVIDIA como proveedor de modelos y software plantea interrogantes sobre la dependencia de sus clientes.
Competidores como AMD, Google TPU o Amazon Trainium no se detienen, pero ninguno presentó en GTC un ecosistema tan amplio con el respaldo de CEOs de Anthropic y OpenAI, ni siete chips nuevos en producción simultánea. La capacidad de NVIDIA para presentar una visión integral de futuro sigue siendo su mayor ventaja, más allá de los detalles técnicos. En la intersección entre hardware, software y aplicaciones, la compañía ha trazado un mapa que, con sus luces y sombras, define gran parte de la agenda tecnológica de los próximos años.



GIPHY App Key not set. Please check settings