Lista de comprobación de due diligence técnica para MVP de IA antes de financiar
La due diligence técnica de un MVP de IA examina las mismas capas que cualquier revisión de software (código, infraestructura, seguridad, equipo) más un conjunto de comprobaciones específicas de IA que un generalista pasa por alto: ¿tiene un conjunto de evaluación y evals de regresión, están versionados los prompts y los modelos, registra cada llamada al modelo, qué ocurre cuando el modelo falla, cuánto cuesta de verdad una inferencia, y tiene los derechos sobre los datos con los que entrena o recupera. Lo único que separa un MVP de IA financiable de una demo es la evidencia. Los inversores tratan cada vez más una suite de evals privada y versionada como la prueba de que su IA funciona. "Lo probamos a mano" no supera ese listón. Esta es la lista que debe pasarse a sí mismo antes de que se la pasen a usted.
Esta es una visión de ingeniería dirigida a fundadores, con las preguntas del inversor hechas explícitas. Las fechas regulatorias son válidas a mediados de 2026; una en particular es una trampa si planifica en torno a un retraso que no ha ocurrido, señalado más abajo.
¿Quiere una DD técnica independiente antes de su ronda?
Reservar consulta gratuitaPor qué evidencia, no una demo
Dos hallazgos independientes marcan el listón. Un estudio de Stanford sobre herramientas de IA jurídica creadas a medida, del tipo que se vende como preciso, midió aun así alucinaciones en más del 17 por ciento de las consultas de referencia en algunos productos y en más del 34 por ciento en otros. Y un informe vinculado al MIT, muy citado en 2025, halló que alrededor del 95 por ciento de los pilotos empresariales de IA generativa no produjeron un impacto medible en la cuenta de resultados. La lección para un fundador que levanta capital es rotunda: una demo que funciona no prueba casi nada, y el inversor lo sabe. Lo que mueve una ronda es la evidencia medida de que su sistema funciona, no regresiona y es económica y legalmente sólido a escala.
Las comprobaciones específicas de IA que un generalista pasa por alto
Este es el núcleo del artículo y la parte que una revisión de software genérica se salta. Para cada una: qué comprobar, por qué importa y la señal de alarma.
- Un conjunto de evaluación. Un dataset dorado versionado más una rúbrica de puntuación. Los tests unitarios le dicen verde o rojo; no pueden decirle si una respuesta fue correcta o fiel a la fuente. Señal de alarma: "revisamos las salidas a ojo", sin conjunto dorado, sin cifras.
- Evals de regresión como puerta de CI. La suite de evals se ejecuta en cada cambio de prompt o de modelo antes del deploy. El mismo prompt da una salida distinta cuando cambia la versión del modelo o la entrada, y un arreglo para un caso rompe en silencio otro. Señal de alarma: los cambios de prompt van directos a producción.
- Observabilidad de las llamadas al modelo. Trazado de cada llamada al modelo, con contabilidad de tokens y coste y captura del prompt y la respuesta. No puede depurar una mala respuesta que no puede reconstruir. Señal de alarma: "usamos el panel del proveedor" como toda la historia.
- Versionado de prompts y modelos. Los prompts son artefactos versionados y el modelo está fijado, no llamado como "latest", que se autoactualiza sin avisar. Señal de alarma: prompts codificados en línea, modelo apuntando a latest.
- Un fallback cuando el modelo falla. Reintentos, un modelo o proveedor secundario, degradación elegante. Su disponibilidad ahora está limitada por una API de terceros. Señal de alarma: un proveedor, un modelo, sin timeout ni ruta degradada, de modo que una caída del proveedor es una caída total.
- Economía unitaria por inferencia. Coste modelado por llamada, luego por acción, y luego dentro del margen bruto. Los flujos agénticos despliegan una acción en cientos de llamadas. Señal de alarma: ninguna métrica de coste por acción y un margen que se asume "tipo SaaS".
- Derechos sobre los datos de entrenamiento y recuperación. Procedencia documentada y una licencia o permiso por fuente. La pregunta ya no es "¿es uso legítimo?" sino "¿puede probar de dónde vino cada dato y que se obtuvo de forma lícita?". Señal de alarma: datos extraídos de origen desconocido, un corpus de RAG sin derechos de uso.
- Una tasa de alucinación medida más guardarraíles. Una tasa de error sobre un benchmark del dominio, más anclaje por recuperación y validación de la salida. Señal de alarma: ninguna tasa medida y "RAG arregla las alucinaciones" afirmado como si estuviera resuelto.
- Elección de modelo y dependencia. Una justificación para API propietaria frente a pesos abiertos, y una capa de abstracción que le permita cambiar de proveedor. Señal de alarma: acoplado de forma rígida al SDK de un solo proveedor, con una economía que solo funciona al precio subvencionado de hoy.
Los artefactos de traspaso que un MVP de IA financiable tiene listos
Si existen, la due diligence es rápida y su valoración se mantiene. Si viven solo en la cabeza de un fundador, cada hueco se convierte en un descuento.
| Artefacto | Por qué le importa a la due diligence | Señal de alarma si falta |
|---|---|---|
| Diagrama de arquitectura (fechado, nombra dependencias externas) | Prueba si soporta 10x y revela el riesgo de persona clave | La arquitectura vive solo en la cabeza de un fundador |
| Mapa de flujo de datos (sigue los datos, no los servicios) | Muestra qué terceros tocan qué datos; exposición al RGPD | Exposición de privacidad desconocida que hereda el inversor |
| Informes de eval (harness versionado, resultados por modelo y prompt) | Cómo se verifica un supuesto foso de IA en vez de creerlo | Sin evidencia objetiva de que el modelo funciona o no regresionará |
| Registro de modelos y prompts | Reproducibilidad y rollback de cualquier salida | El comportamiento en producción no se puede reproducir |
| Runbook y respuesta a incidentes | Reduce la dependencia de persona clave, evidencia base de cumplimiento | Riesgo de caída no medido |
| SBOM (SPDX o CycloneDX, regenerado en CI) | Saca a la luz contaminación copyleft y CVEs sin parchear | Exposición desconocida a licencias y vulnerabilidades |
| Cadena de titularidad de la PI (cesiones de fundadores y contratistas) | El clásico matadeals; pagar una factura no transfiere la PI | Un colaborador que se fue y nunca cedió un módulo central |
| Informe de seguridad (pen test reciente, SOC 2 o ISO 27001 si aplica) | Estándar en 2026, y desbloquea las ventas a empresas | Exposición a brechas desconocida |
Datos, privacidad y procedencia
Para un MVP de IA en la UE, aquí es donde se revalúan los acuerdos. La due diligence comprueba su registro de actividades de tratamiento (RGPD Artículo 30), una base jurídica para entrenar con datos personales (Artículos 6 y 9, con una evaluación de interés legítimo archivada), una evaluación de impacto sobre protección de datos antes de un tratamiento de alto riesgo (Artículo 35) y acuerdos de tratamiento de datos con los subencargados. Tenga en cuenta algo que los fundadores pasan por alto: una API de modelo que ingiere los prompts de sus usuarios es un subencargado, así que necesita un DPA y una configuración de no entrenamiento y retención cero, no condiciones de consumo. La Opinión 28/2024 del EDPB también advierte de que un modelo entrenado con datos personales no es automáticamente anónimo, de modo que datos de entrenamiento ilícitos pueden contaminar el producto desplegado. Sobre el EU AI Act, la fecha vinculante vigente para la mayoría de las obligaciones de alto riesgo y transparencia es el 2 de agosto de 2026. En 2026 circulaba una propuesta para aplazarla, pero no está promulgada, y un plan de cumplimiento que apueste por el aplazamiento es en sí mismo una señal de alarma.
Lo que los inversores señalan de verdad
Desde el lado del inversor y del comprador, y estas fuentes son partes interesadas, así que pondérelas como tales, las señales recurrentes son: un envoltorio fino sobre un solo modelo sin profundidad de flujo de trabajo; un foso débil (los duraderos hoy son datos propietarios o con permiso, integraciones y contexto persistente, no el modelo base); el margen bruto tras el coste de inferencia, ya que la inferencia es un coste variable real que rompe la suposición de margen SaaS; retención frágil cuando los costes de cambio son bajos; y, cada vez más, la ausencia de evals continuos privados. En cuanto a la adquisición en concreto, espere cláusulas de retención sobre los ingenieros de IA clave e indemnizaciones ligadas a las declaraciones sobre la procedencia de los datos. El ángulo del vibe-coding de todo esto, seguridad, propiedad de la PI y qué comprueba un comprador en el código generado por IA, es una lista propia en nuestro artículo sobre due diligence de Lovable, Bolt y Replit, y la disciplina de evals que sustenta los puntos uno y dos está en cuándo merece la pena construir evals de LLM.

"Una demo prueba que puede obtener una buena respuesta una vez. Un conjunto de evals prueba que obtiene buenas respuestas de forma consistente y que se dará cuenta cuando dejen de serlo. Los inversores dejaron de impresionarse con lo primero y empezaron a pedir lo segundo. Ese cambio es todo el juego en la due diligence de IA."
Preguntas frecuentes
¿Qué es la due diligence técnica para una startup de IA?
¿Qué comprueban los inversores en un MVP de IA?
¿Qué evidencia de evals necesito antes de una ronda?
¿En qué se diferencia la due diligence de IA de la de software normal?
¿Necesito un SBOM para la due diligence?
¿Qué es la cadena de titularidad de la PI y por qué mata acuerdos?
¿Cómo afecta el RGPD a la due diligence de IA en la UE?
¿Se aplica ya el EU AI Act a mi MVP?
Due diligence técnica en Austria, ¿hay algo diferente?
¿Cómo pruebo que mi producto de IA no es solo un envoltorio de GPT?
Reflexiones finales
La due diligence técnica de un MVP de IA no es una revisión de código genérica con la palabra IA añadida. Las capas que deciden su ronda son las específicas de IA: evals que prueban que la cosa funciona y no regresionará, versionado que hace reproducible cualquier salida, economía de inferencia honesta y derechos limpios sobre sus datos.
La buena noticia es que todo eso es más barato de arreglar antes de la due diligence que de explicar durante ella. Construya el conjunto de evals, fije los modelos, registre las llamadas, firme la cadena de titularidad de la PI y tenga los artefactos listos en una carpeta. Hágalo y la due diligence se vuelve un trámite. Sáltelo y cada hueco se convierte en un descuento sobre su valoración.
¿Quiere el conjunto de evals y los artefactos listos antes de levantar capital?
Reservar consulta gratuita