TECNOLOGÍAS

Hallucination

Cuando un LLM produce una salida fluida y confiada que es simplemente falsa, lo cual es una consecuencia directa de cómo funciona el modelo y no se puede eliminar por completo, solo reducir.

Última revisión: 2026-06-02 porKevin Riedl wiki ↗

Una alucinación es cuando un modelo genera algo que suena correcto y es incorrecto: una cita inventada, una API inventada, un hecho plausible pero falso. No es un fallo que puedas parchear. Un LLM predice texto probable, y una respuesta fluida que suena confiada es estadísticamente probable, sea o no cierta. El modelo no tiene una sensación interna de “no lo sé”, así que llena el hueco con algo que encaja en el patrón.

Como es estructural, el encuadre honesto es la reducción del riesgo, no la eliminación. La mayor palanca es la fundamentación: dale al modelo los hechos reales en tiempo de ejecución mediante recuperación (RAG) para que responda a partir de texto fuente real en lugar de su conjetura del momento de entrenamiento. Restringe los formatos de salida para que haya menos margen para improvisar. Pide al modelo que cite fuentes que puedas comprobar. Y, de forma crítica, evalúa, construye un conjunto de pruebas de preguntas reales, mide con qué frecuencia el sistema se equivoca y trata ese número como una métrica de calidad que sigues como cualquier otra.

Aquí es donde la IA se encuentra con el QA, y la mayoría de los equipos se lo saltan. Lanzar una funcionalidad de LLM sin un arnés de evaluación es lanzar código no probado y llamarlo terminado. Necesitas conocer tu tasa de fallos antes de que tus usuarios la encuentren por ti. Lo tratamos como innegociable bajo Software Quality Assurance.

El ángulo de la confianza es todo el juego en dominios regulados o de alto riesgo. Una alucinación en un chatbot que recomienda una película es un encogimiento de hombros. La misma alucinación en una salida financiera, legal o médica es un riesgo. Ajusta las barreras de seguridad al coste de equivocarse, y nunca dejes que una respuesta fluida sustituya a una verificada.

// FAQ

Preguntas frecuentes

Preguntas frecuentes

Porque predicen texto probable, no verdad verificada. Una respuesta fluida y confiada es estadísticamente probable, sea o no correcta, y el modelo no tiene una señal incorporada de ’no lo sé’, así que llena el hueco.
No. Son estructurales a cómo funcionan los LLM. Las reduces con fundamentación (recuperación), salidas restringidas, citas de fuentes y evaluación, pero siempre queda una tasa residual. Gestiónala, no supongas que ha desaparecido.
Fundamenta las respuestas en datos reales mediante RAG, restringe el formato de salida, exige citas comprobables y ejecuta un arnés de evaluación que mida tu tasa de fallos en preguntas reales. Ajusta la fuerza de las barreras al coste de equivocarse.