in

La fábrica de inteligencia artificial de Nvidia se estrella con la realidad.

La industria de la inteligencia artificial (IA) se encuentra en un momento crucial. La narrativa de Nvidia sobre su "fábrica de IA" enfrenta un chequeo de realidad en el evento Transform 2025. Durante un panel sobre inferencia, fabricantes alternativos de chips cuestionaron directamente el dominio de Nvidia, exponiendo una contradicción fundamental: ¿cómo puede la inferencia de IA ser una "fábrica" komoditizada y al mismo tiempo tener márgenes brutos del 70%?

Jonathan Ross, CEO de Groq, expresó su opinión de manera contundente: "La fábrica de IA es solo una forma de marketing para hacer que la IA suene menos aterradora". Sean Lie, CTO de Cerebras, un competidor, también fue directo: "No creo que Nvidia se preocupe por tener a todos los proveedores de servicios luchando por cada último centavo mientras ellos están cómodos con el 70%".

La inversión en infraestructura y el futuro de la arquitectura de la IA empresarial están en juego. Para los CISOs y líderes de IA actualmente inmersos en negociaciones semanales con OpenAI y otros proveedores para obtener más capacidad, el panel expuso verdades incómodas sobre por qué sus iniciativas de IA siguen encontrando obstáculos.

La crisis de capacidad de la que nadie habla

Cualquiera que sea un gran usuario de estos modelos de IA sabe que puede ir a OpenAI o a quien sea, y no podrán servir suficientes tokens. Hay reuniones semanales entre algunos de los mayores usuarios de IA y sus proveedores de modelos para tratar de persuadirlos a que asignen más capacidad. Luego, hay reuniones semanales entre esos proveedores de modelos y sus proveedores de hardware.

Los participantes del panel también señalaron que la escasez de tokens expone una falla fundamental en la analogía de la fábrica. La manufactura tradicional responde a las señales de demanda agregando capacidad. Sin embargo, cuando las empresas requieren 10 veces más capacidad de inferencia, descubren que la cadena de suministro no puede flexibilizarse. Los GPU requieren plazos de entrega de dos años. Los centros de datos necesitan permisos y acuerdos de energía. La infraestructura no fue construida para un escalado exponencial, lo que obliga a los proveedores a racionar el acceso a través de límites de API.

Según Dylan Patel, fundador de SemiAnalysis, Anthropic pasó de $2000 millones a $3000 millones en ARR en solo seis meses. Cursor pasó de prácticamente cero a $500 millones en ARR. OpenAI superó los $10,000 millones. Sin embargo, las empresas aún no pueden obtener los tokens que necesitan.

Por qué el pensamiento de fábrica rompe la economía de la IA

El concepto de "fábrica de IA" de Jensen Huang implica estandarización, comoditización y ganancias de eficiencia que reducen los costos. Pero el panel reveló tres formas fundamentales en que esta metáfora se desmorona:

Primero, la inferencia no es uniforme. "Incluso hoy, para la inferencia de, digamos, DeepSeek, hay una serie de proveedores a lo largo de la curva de cómo de rápido proporcionan a qué costo", señaló Patel.

Segundo, la calidad varía enormemente. Ross hizo un paralelismo histórico con Standard Oil: "Cuando Standard Oil comenzó, el petróleo tenía una calidad variable. Podías comprar petróleo de un proveedor y podría incendiar tu casa". El mercado de inferencia de IA actual enfrenta variaciones de calidad similares, con proveedores que utilizan diversas técnicas para reducir costos que inadvertidamente comprometen la calidad de la salida.

Tercero, y lo más crítico, la economía se invierte. "Una de las cosas inusuales de la IA es que no puedes gastar más para obtener mejores resultados", explicó Ross.

El imperativo para los compradores empresariales

Esto crea imperativos inmediatos para los compradores empresariales:

  • Establecer benchmarks de calidad antes de seleccionar proveedores.
  • Auditar a los socios de inferencia existentes para detectar optimizaciones no divulgadas.
  • Aceptar que la fijación de precios premium para la fidelidad total del modelo es ahora una característica permanente del mercado.

La paradoja del token de $1 millón

El momento más revelador llegó cuando el panel discutió la fijación de precios. Lie destacó una verdad incómoda para la industria: "Si estos millones de tokens son tan valiosos como creemos que pueden ser, ¿verdad? Eso no se trata de mover palabras. No cobras $1 por mover palabras. Pago a mi abogado $800 por hora para escribir un memorándum de dos páginas".

Esta observación corta el corazón del problema de descubrimiento de precios de la IA. La industria está compitiendo para impulsar los costos de tokens por debajo de $1.50 por millón mientras afirma que estos tokens transformarán todos los aspectos del negocio.

El cambio en el rendimiento

Cerebras y Groq no solo están compitiendo en precio; también están compitiendo en rendimiento. Están cambiando fundamentalmente lo que es posible en términos de velocidad de inferencia. "Con la tecnología de escala de oblea que hemos construido, estamos permitiendo un rendimiento 10 veces, a veces 50 veces, más rápido que incluso los GPU más rápidos de hoy", dijo Lie.

Este no es un mejora incremental. Está permitiendo casos de uso completamente nuevos. "Tenemos clientes que tienen flujos de trabajo agénicos que podrían tardar 40 minutos, y quieren que estas cosas se ejecuten en tiempo real", explicó Lie.

El verdadero cuello de botella: energía y centros de datos

Mientras que todos se centran en la oferta de chips, el panel reveló la restricción real que está limitando la implementación de la IA. "La capacidad del centro de datos es un gran problema. Realmente no puedes encontrar espacio en el centro de datos en EE. UU.", dijo Patel. "La energía es un gran problema".

El desafío de infraestructura va más allá de la fabricación de chips a restricciones de recursos fundamentales. Como explicó Patel, "TSMC en Taiwán es capaz de hacer chips por más de $200 millones, ¿verdad? No es ni… la velocidad a la que escalan es ridícula".

Pero la producción de chips no significa nada sin infraestructura. "La razón por la que vemos estos grandes acuerdos en el Medio Oriente, y parcialmente por qué ambas empresas tienen grandes presencias en el Medio Oriente, es la energía", reveló Patel.

La realidad de la infraestructura que las empresas no pueden ignorar

El panel reveló una verdad fundamental: la metáfora de la fábrica de IA no solo es incorrecta, sino también peligrosa. Las empresas que construyen estrategias en torno a la fijación de precios de inferencia de commodities y entrega estandarizada están planificando un mercado que no existe.

El mercado real opera con tres duras realidades:

  • La escasez de capacidad crea inversiones de poder, donde los proveedores dictan términos y las empresas ruegan por asignaciones.
  • La variación de calidad, la diferencia entre el 95% y el 100% de precisión, determina si sus aplicaciones de IA tienen éxito o fallan catastróficamente.
  • Las restricciones de infraestructura, no la tecnología, establecen los límites vinculantes en la transformación de la IA.

El camino a seguir para los CISOs y líderes de IA requiere abandonar completamente el pensamiento de fábrica. Bloquear la capacidad de energía ahora. Auditar a los proveedores de inferencia para detectar degradación oculta de la calidad. Construir relaciones con proveedores basadas en ventajas arquitectónicas, no en ahorros marginales de costos. Lo más importante, aceptar que pagar márgenes del 70% por una inferencia fiable y de alta calidad puede ser su inversión más inteligente.

La alternativa, los fabricantes de chips en Transform no solo desafiaron la narrativa de Nvidia. Revelaron que las empresas enfrentan una elección: pagar por la calidad y el rendimiento, o unirse a las reuniones de negociación semanales. El consenso del panel fue claro: el éxito requiere coincidir cargas de trabajo específicas con la infraestructura adecuada en lugar de perseguir soluciones únicas para todos.

¿Qué opinas?

Escrito por Redacción - El Semanal

El Semanal: Tu fuente de noticias, tendencias y entretenimiento. Conéctate con lo último en tecnología, cultura, economía y más. Historias que importan, contadas de manera dinámica y accesible. ¡Únete a nuestra comunidad!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Dylan Harper deslumbra en la alfombra roja del draft de la NBA con zapatos de punta envenenada

Julez Smith se tiñe de rosa para desfile de 3.Paradis en pasarela ahora