TECHNOLOGIE

Hallucination

Wenn ein LLM flüssige, überzeugte Ausgaben erzeugt, die schlicht falsch sind. Eine direkte Folge der Funktionsweise des Modells, nicht vollständig beseitigbar, nur reduzierbar.

Zuletzt geprüft: 2026-06-02 vonKevin Riedl wiki ↗

Eine Halluzination ist, wenn ein Modell etwas erzeugt, das richtig klingt und falsch ist: eine erfundene Quelle, eine ausgedachte API, ein plausibler, aber falscher Fakt. Es ist kein Fehler, den man wegpatchen kann. Ein LLM sagt wahrscheinlichen Text voraus, und eine flüssige, überzeugt klingende Antwort ist statistisch wahrscheinlich, egal ob sie zufällig stimmt. Das Modell hat kein inneres Gespür für “das weiß ich nicht”, also füllt es die Lücke mit etwas, das ins Muster passt.

Weil es strukturell ist, lautet die ehrliche Einordnung Risikoreduktion, nicht Beseitigung. Der größte Hebel ist Erdung: Gib dem Modell die tatsächlichen Fakten zur Laufzeit per Retrieval (RAG), damit es aus echtem Quelltext antwortet statt aus seiner Trainings-Vermutung. Schränke Ausgabeformate ein, damit weniger Raum zum Improvisieren bleibt. Lass das Modell Quellen nennen, die du prüfen kannst. Und entscheidend: evaluiere, baue ein Testset echter Fragen, miss wie oft das System falsch liegt, und behandle diese Zahl als Qualitätskennzahl, die du wie jede andere verfolgst.

Hier trifft KI auf QA, und die meisten Teams überspringen das. Ein LLM-Feature ohne Evaluations-Harness auszuliefern heißt, ungetesteten Code auszuliefern und es fertig zu nennen. Du musst deine Fehlerrate kennen, bevor deine Nutzer sie für dich finden. Das behandeln wir als nicht verhandelbar unter Software Quality Assurance.

Der Vertrauensaspekt ist in regulierten oder risikoreichen Domänen das ganze Spiel. Eine Halluzination in einem Chatbot, der einen Film empfiehlt, ist ein Achselzucken. Dieselbe Halluzination in Finanz-, Rechts- oder medizinischer Ausgabe ist ein Risiko. Passe die Leitplanken an die Kosten des Irrtums an, und lass nie eine flüssige Antwort eine geprüfte ersetzen.

// FAQ

Häufige Fragen

Häufige Fragen

Weil sie wahrscheinlichen Text vorhersagen, nicht geprüfte Wahrheit. Eine flüssige, überzeugte Antwort ist statistisch wahrscheinlich, egal ob korrekt, und das Modell hat kein eingebautes Signal für ‘das weiß ich nicht’, also füllt es die Lücke.
Nein. Sie sind strukturell für die Funktionsweise von LLMs. Du reduzierst sie mit Erdung (Retrieval), eingeschränkten Ausgaben, Quellenangaben und Evaluation, aber eine Restrate bleibt immer. Manage sie, nimm nicht an, sie sei weg.
Erde Antworten in echten Daten per RAG, schränke das Ausgabeformat ein, verlange prüfbare Quellen und betreibe einen Evaluations-Harness, der deine Fehlerrate an echten Fragen misst. Passe die Stärke der Leitplanken an die Kosten des Irrtums an.