TECNOLOGÍAS

Hallucination

Cuando un LLM produce una salida fluida y confiada que es simplemente falsa. Consecuencia directa de cómo funciona el modelo: no se elimina, solo se reduce.

Última revisión: 2026-06-02 porKevin Riedl wiki ↗

Una alucinación es cuando un modelo genera algo que suena correcto y es incorrecto: una cita inventada, una API inventada, un hecho plausible pero falso. No es un fallo que puedas parchear. Un LLM predice texto probable, y una respuesta fluida que suena confiada es estadísticamente probable, sea o no cierta. El modelo no tiene una sensación interna de «no lo sé», así que llena el hueco con algo que encaja en el patrón.

Como es estructural, el encuadre honesto es la reducción del riesgo, no la eliminación. La mayor palanca es la fundamentación: dale al modelo los hechos reales en tiempo de ejecución mediante recuperación (RAG ) para que responda a partir de texto fuente real en lugar de su conjetura del momento de entrenamiento. Ten en cuenta que el fine-tuning es la palanca equivocada aquí, ya que moldea el comportamiento en lugar de suministrar hechos. Restringe los formatos de salida para que haya menos margen para improvisar. Pide al modelo que cite fuentes que puedas comprobar. Y, de forma crítica, evalúa, construye un conjunto de pruebas de preguntas reales, mide con qué frecuencia el sistema se equivoca y trata ese número como una métrica de calidad que sigues como cualquier otra.

Aquí es donde la IA se encuentra con el QA, y la mayoría de los equipos se lo saltan. Lanzar una funcionalidad de LLM sin un arnés de evaluación es lanzar código no probado y llamarlo terminado. Necesitas conocer tu tasa de fallos antes de que tus usuarios la encuentren por ti. Lo tratamos como innegociable bajo Software Quality Assurance .

Ejemplo de por qué el arnés de evaluación es innegociable: un equipo lanza un asistente de documentos legales tras probarlo a mano con una docena de preguntas, todas las cuales se veían geniales. En producción cita con confianza una cláusula que no existe en el contrato subido, un usuario actúa sobre ella, y ahora hay un riesgo real. El arnés que lo habría atrapado es poco glamuroso: unos pocos cientos de preguntas reales con respuestas correctas conocidas, ejecutadas en cada cambio, produciendo un solo número, el porcentaje que el sistema acertó mal. Sin él no conoces tu tasa de fallos, lo que significa que tus usuarios la descubren por ti, una mala respuesta cada vez. Con él, puedes decidir si la tasa es aceptable para lo que está en juego antes de lanzar.

El ángulo de la confianza es todo el juego en dominios regulados o de alto riesgo. Una alucinación en un chatbot que recomienda una película es un encogimiento de hombros. La misma alucinación en una salida financiera, legal o médica es un riesgo. Ajusta las barreras de seguridad al coste de equivocarse, y nunca dejes que una respuesta fluida sustituya a una verificada.

¿Por qué alucinan los LLM? +

Porque predicen texto probable, no verdad verificada. Una respuesta fluida y confiada es estadísticamente probable, sea o no correcta, y el modelo no tiene una señal incorporada de «no lo sé», así que llena el hueco.

¿Se pueden corregir las alucinaciones por completo? +

No. Son estructurales a cómo funcionan los LLM. Las reduces con fundamentación (recuperación), salidas restringidas, citas de fuentes y evaluación, pero siempre queda una tasa residual. Gestiónala, no supongas que ha desaparecido.

¿Cómo se reducen las alucinaciones en producción? +

Fundamenta las respuestas en datos reales mediante RAG, restringe el formato de salida, exige citas comprobables y ejecuta un arnés de evaluación que mida tu tasa de fallos en preguntas reales. Ajusta la fuerza de las barreras al coste de equivocarse.

Preguntas frecuentes