Kevin Riedl

10 min de lectura · 01 Jul 2026

Dario Le Declaró la Guerra al Código Abierto. La Guerra Real Es Por Tu Factura de IA.

Dario Amodei no se limitó a criticar la IA de código abierto. Anthropic se movió para que se prohibiera una parte de ella. La empresa acusó a los laboratorios chinos de robar sus capacidades y pidió a Washington que interviniera. En el episodio del 1 de julio del programa 20VC x SaaStr, Harry Stebbings, Jason Lemkin y Rory O'Driscoll desarmaron el argumento, y la parte interesante no es la geopolítica. Es lo que la pelea revela sobre quién controla el coste de la inteligencia de los LLM, y con qué rapidez se le está escapando ese control de las manos.

Esta es nuestra lectura como ingenieros que movemos cargas de trabajo de clientes entre estos modelos para vivir, no una opinión sobre la política EE. UU. y China. La tesis es simple: la guerra del código abierto es una guerra por poder sobre los precios. Sigue el dinero y se vuelve obvio.

¿Pagando precios frontier por trabajo de commodity?

 Reserva Consultoría Gratuita

¿De qué acusó Anthropic a China en realidad?

La acusación es destilación: entrenar un modelo con las salidas de otro más fuerte. En febrero de 2026 Anthropic señaló a DeepSeek, Moonshot AI y MiniMax, alegando que usaron a Claude para extraer capacidades de una forma que rompía sus términos de servicio. El 24 de junio escaló, acusando a Alibaba de lo que llamó el mayor ataque de destilación conocido contra ella hasta la fecha: unos 28,8 millones de intercambios ejecutados a través de miles de cuentas fraudulentas.

Lee la redacción con cuidado. Anthropic admite que la destilación en sí es un método de entrenamiento ampliamente usado y legítimo. La queja va sobre cómo se hizo: la violación de los términos de servicio y las cuentas fraudulentas, no la técnica. Esa distinción importa, porque la solución que Anthropic empuja es mucho más amplia que el supuesto delito. Ha instado al Congreso a tomar medidas contra la destilación por parte de rivales chinos y ha enmarcado todo el asunto como seguridad nacional: la IA china barata, según el argumento, reduce la ventaja de EE. UU. y podría acelerar la IA militar y cibernética de un adversario.

Si quieres la mecánica de por qué la destilación y el fine-tuning hacen que un modelo fuerte sea tan fácil de clonar, ese es el corazón técnico de la disputa. El punto de negocio es que la técnica es ahora lo bastante barata como para que ningún laboratorio pueda mantener una ventaja de calidad duradera.

La lectura proteccionista: ¿es esto seguridad, o un foso?

El contraargumento de Rory O'Driscoll en el programa fue el más afilado. Hay una hipocresía real en que un laboratorio frontier de EE. UU., cuyos propios modelos se entrenaron con web raspada y propiedad intelectual de terceros, invoque el robo cuando un competidor aprende de sus salidas. Y el remedio propuesto se parece menos a una política de seguridad y más a un foso cavado con regulación.

Su analogía fue la que más caló: bloquear modelos de pesos abiertos de bajo coste para proteger la economía de un laboratorio frontier es como prohibir los clones del PC de IBM en los años 80 para apuntalar la cotización de IBM. La clonación fue lo que arrastró el precio de la computación a la baja y puso una máquina en cada escritorio. Llamarlo robo no lo detuvo entonces, y no lo detendrá ahora. En sus palabras, es «una tontería como una casa».

La lectura más plausible del movimiento de Anthropic, y a la que el panel volvía una y otra vez, es un trueque regulatorio en lugar de una postura de principios: aceptar algunas restricciones en el lado doméstico a cambio de una prohibición federal de los modelos chinos destilados. Eso es análisis, no un hecho confirmado. Pero encaja con los incentivos. Cuando el precio por unidad de tu producto cae rápido, la forma más barata de defender el margen no es construir un producto mejor. Es hacer ilegal el sustituto más barato.

Kevin Riedl

"Cuando el precio de un producto se desploma, la forma más barata de defender el margen es hacer ilegal el sustituto más barato. Eso es una pelea de política, no de producto, y los compradores deberían tratarla así."

Coinbase ya hizo el experimento

Mientras Anthropic discute sobre las reglas, una empresa cotizada acaba de mostrar qué pasa cuando ignoras el drama y optimizas. A finales de junio, el CEO de Coinbase, Brian Armstrong, dijo que la firma recortó su gasto interno en IA en alrededor del 50 por ciento mientras el uso de tokens seguía subiendo. Lo logró sin poner un tope a un solo ingeniero. Las palancas fueron exactamente las que trabajamos con clientes:

  • Mejores defaults, no topes de uso. Coinbase puso por defecto modelos de pesos abiertos, en concreto las clases GLM y Kimi, dejando a los ingenieros libres de elegir un modelo frontier cuando la tarea lo pedía. La mayoría nunca llegaba a sus viejos topes de todos modos, así que bajar el precio por defecto le ganó a vigilar el uso.
  • Routing por tarea. Los prompts se preprocesan y se enrutan al modelo más barato que puede hacer el trabajo, considerando precio y aciertos de caché.
  • Caching. La mayor palanca de todas. Coinbase subió su tasa de acierto de caché de alrededor del 5 por ciento a cerca del 60 por ciento.

Este es el mismo manual que exponemos en cómo recortar los costes de tokens LLM en 2026: cachea lo que se repite, enruta la mayoría fácil a un modelo barato, y reserva el modelo frontier para la cola difícil. La capa de router que hace esto seguro la comparamos en nuestro desglose de gateways y routers LLM, y los modelos de pesos abiertos en los que Coinbase se apoyó son exactamente los que evaluamos en el duelo de LLM de pesos abiertos.

El panel se dividió sobre lo que significaba. Lemkin descartó el post de Armstrong como «redes sociales performativas», su punto era que recortar coste importa poco si el ingreso de arriba está plano. Rory lo leyó como gestión de costes básica que todo ejecutivo consciente del efectivo copiará para frenar tarifas de modelo desbocadas. Ambos tienen razón, y esa tensión es toda la historia de la IA empresarial ahora mismo.

El ajuste de cuentas del ROI que nadie quiere nombrar

He aquí el patrón incómodo detrás del debate de Coinbase. Las empresas están volcando millones en tokens de IA y publicando las mismas tasas de crecimiento que publicaban antes. Añadir gasto no ha movido la línea de arriba. Los consejos se han dado cuenta, y ha empezado la resistencia contra el imprudente «token maxing». Los CFO quieren una línea clara desde el gasto en IA hasta una entrega más rápida o un ahorro duro en la línea de abajo, y la mayoría todavía no la puede trazar.

Eso no es un argumento contra la IA. Es un argumento a favor de medirla. Un precio por token más barato no significa nada si tu producto hace cientos de llamadas por tarea, que es por lo que insistimos en la diferencia entre coste por token y coste por tarea. Y los proyectos que fracasan en silencio rara vez fracasan por la calidad del modelo. Fracasan por el scope, las evals y la integración, los modos de fallo que recorremos en por qué se cancelan los proyectos de agentes de IA. Si no puedes medir la mejora, recortar la factura a la mitad como Coinbase es el primer movimiento racional, porque al menos el ahorro es real.

Hacia dónde va el dinero de verdad

Otros dos datos de la semana hacen el mismo argumento desde el lado del capital: los inversores premian ahora la disciplina y la generación de caja, no la quema de tokens.

  • Kalshi persigue una valoración de 40.000 millones de dólares. El mercado de predicciones está levantando capital a aproximadamente el doble de su ronda anterior, sobre la base de más de 2.000 millones de dólares en ingresos anualizados y unos 178.000 millones en volumen de trading anualizado. Vale la pena corregir un poco de hype, eso sí: una salida a bolsa no es inminente. El CEO Tarek Mansour ha descartado un listing antes de 2027, siendo finales de 2027 o 2028 la ventana realista.
  • Bending Spoons es la salida a bolsa más inteligente del año. El operador milanés salió a cotizar en el Nasdaq el 1 de julio, con un precio de 29 dólares, y cerró su primer día casi un 40 por ciento arriba, en torno a 40,50 dólares, una capitalización cercana a los 25.700 millones de dólares, más del doble de su última marca privada. No llegó ahí con crecimiento orgánico de usuarios. Compra plataformas pegajosas pero de bajo rendimiento, entre ellas AOL, Vimeo, WeTransfer, Eventbrite y Evernote, luego sube precios, elimina redundancias y reescribe el software.

En el programa, Lemkin argumentó que este manual de roll-up viene a por el SaaS B2B maduro: adquirir una plataforma pegajosa y de bajo rendimiento, inyectar operadores hambrientos, arreglar la retención y capturar el arbitraje de ingresos. Los nombres que lanzó, Marketo, Asana, PagerDuty, son su especulación sobre objetivos futuros, no empresas que Bending Spoons posea. La señal de fondo es lo que importa para cualquiera que presupueste IA: los mercados públicos están poniendo precio a la rentabilidad y la disciplina operativa, no al crecimiento a cualquier coste. La misma lógica que hace atractivo un roll-up hace de una factura de IA sin medir un pasivo.

Qué significa esto para un comprador de la UE

No tienes que elegir bando en una pelea de política EE. UU. y China para actuar. Los movimientos que recortan tu factura están disponibles hoy, decida lo que decida Washington:

  • Trata los pesos abiertos como una opción de primera clase. La brecha de calidad en trabajo real de coding y reasoning se ha cerrado en gran medida, a una fracción de los precios frontier. Coinbase lo probó en producción.
  • Resuelve la governance con hosting, no con evasión. La pregunta real con un modelo chino de pesos abiertos no es la calidad, es dónde corre la inferencia y dónde aterrizan los datos. Córrelo self-hosted en infraestructura de la UE y mantienes la ventaja de precio sin enviar datos al extranjero. Lo presupuestamos en self-hosting de LLM en la UE y mapeamos las opciones de compliance en residencia de datos en la UE para apps de IA.
  • Enruta por defecto, escala según necesidad. Modelo barato primero, modelo frontier solo cuando un chequeo de confianza falla. Sigue la tasa de escalado como un KPI.

Si una prohibición federal llega a aterrizar, se aplica al acceso desde EE. UU., no a un modelo de pesos abiertos self-hosted corriendo en un servidor en Fráncfort. La soberanía sobre tu propio stack es la cobertura. Montar eso, el routing, las evals, la decisión de hosting, es exactamente el trabajo de nuestros engagements de habilitación de IA.

Preguntas Frecuentes

¿Qué es la destilación de modelos, y es legal?
La destilación entrena un modelo más pequeño o más nuevo con las salidas de uno más fuerte. La propia Anthropic llama a la técnica ampliamente usada y legítima. Su queja contra los laboratorios chinos va sobre el método de acceso, una supuesta violación de los términos de servicio y cuentas fraudulentas, no la técnica en sí. Hoy no existe una ley general contra la destilación.
¿Coinbase recortó de verdad su gasto en IA un 50 por ciento?
Sí. A finales de junio de 2026 el CEO Brian Armstrong dijo que el gasto interno en IA cayó alrededor del 50 por ciento incluso mientras el uso de tokens subía, logrado mediante defaults de pesos abiertos, routing por tarea y subir la tasa de acierto de caché de cerca del 5 por ciento al 60 por ciento, sin poner tope a los ingenieros.
¿Son seguros los modelos chinos de pesos abiertos para que los use una empresa de la UE?
La calidad es competitiva para la mayoría del trabajo de coding y reasoning. La pregunta real es la governance: dónde corre la inferencia y dónde aterrizan tus datos. Self-hostear un modelo de pesos abiertos en infraestructura de la UE mantiene la ventaja de coste conservando los datos en la UE. Usar una API no europea plantea una pregunta de residencia de datos que debes responder primero.
¿Deberíamos cambiar nuestro modelo por defecto a pesos abiertos?
Para cargas de alto volumen y sensibles al coste, pruébalo. Enruta la mayoría fácil a un modelo barato de pesos abiertos y escala a un modelo frontier solo cuando un chequeo de confianza falle. Nunca cambies solo por un titular de benchmark. Pruébalo en tu propio eval, porque un modelo que falla 1 de cada 10 tareas no es más barato.
¿Kalshi está a punto de salir a bolsa a 40.000 millones de dólares?
Kalshi está levantando capital a una valoración de aproximadamente 40.000 millones de dólares, cerca del doble de su ronda previa, pero una salida a bolsa no es inminente. El CEO Tarek Mansour ha descartado un listing antes de 2027, siendo finales de 2027 o 2028 la ventana más probable.

Reflexiones finales

La guerra del código abierto es una guerra de precios vestida con una chaqueta de seguridad nacional. Cuando el precio de un producto cae así de rápido, la forma más barata de defender el margen es hacer ilegal el sustituto, y eso es una pelea de política, no de producto.

Los compradores no tienen que esperar al resultado. Coinbase ya mostró el movimiento: defaults de pesos abiertos, routing inteligente y caching agresivo recortaron la factura a la mitad sin pérdida de acceso. Los proyectos que fracasan no son los que eligieron un modelo más barato, son los que nunca midieron la mejora. Trata los pesos abiertos como una opción de primera clase, resuelve la governance con hosting en la UE en lugar de con evasión, y enruta por defecto. La soberanía sobre tu propio stack es la única cobertura que sobrevive decida lo que decida Washington.

¿Quieres una auditoría de coste de tu stack de IA antes de que lo pregunte tu consejo?

 Reserva Consultoría Gratuita
Kevin Riedl

10 min de lectura · 01 Jul 2026