Hallucination
Cuando un LLM produce una salida fluida y confiada que es simplemente falsa, lo cual es una consecuencia directa de cómo funciona el modelo y no se puede eliminar por completo, solo reducir.
Una alucinación es cuando un modelo genera algo que suena correcto y es incorrecto: una cita inventada, una API inventada, un hecho plausible pero falso. No es un fallo que puedas parchear. Un LLM predice texto probable, y una respuesta fluida que suena confiada es estadísticamente probable, sea o no cierta. El modelo no tiene una sensación interna de “no lo sé”, así que llena el hueco con algo que encaja en el patrón.
Como es estructural, el encuadre honesto es la reducción del riesgo, no la eliminación. La mayor palanca es la fundamentación: dale al modelo los hechos reales en tiempo de ejecución mediante recuperación (RAG) para que responda a partir de texto fuente real en lugar de su conjetura del momento de entrenamiento. Restringe los formatos de salida para que haya menos margen para improvisar. Pide al modelo que cite fuentes que puedas comprobar. Y, de forma crítica, evalúa, construye un conjunto de pruebas de preguntas reales, mide con qué frecuencia el sistema se equivoca y trata ese número como una métrica de calidad que sigues como cualquier otra.
Aquí es donde la IA se encuentra con el QA, y la mayoría de los equipos se lo saltan. Lanzar una funcionalidad de LLM sin un arnés de evaluación es lanzar código no probado y llamarlo terminado. Necesitas conocer tu tasa de fallos antes de que tus usuarios la encuentren por ti. Lo tratamos como innegociable bajo Software Quality Assurance.
El ángulo de la confianza es todo el juego en dominios regulados o de alto riesgo. Una alucinación en un chatbot que recomienda una película es un encogimiento de hombros. La misma alucinación en una salida financiera, legal o médica es un riesgo. Ajusta las barreras de seguridad al coste de equivocarse, y nunca dejes que una respuesta fluida sustituya a una verificada.