Halluzinationen — wenn KI Fakten erfindet
Wie man sie erkennt, warum sie entstehen und mit welchen Leitplanken man sie im Griff behält.
Eine Halluzination liegt vor, wenn ein LLM Informationen generiert, die faktisch falsch oder erfunden sind — aber überzeugend und plausibel formuliert.
Das Modell lügt nicht absichtlich. Es kennt den Unterschied zwischen wahr und falsch nicht. Das Gefährliche: Die Antworten klingen oft sehr überzeugend. Das Modell nutzt den richtigen Fachjargon, gibt Details an und formuliert selbstsicher — auch wenn alles erfunden ist.
Typische Beispiele
- Erfundene wissenschaftliche Studien mit realistisch klingenden Autoren
- Nicht existierende Gesetze oder Gerichtsentscheidungen
- Falsche historische Fakten oder Jahreszahlen
- Erfundene Zitate von realen Personen
- Nicht existierende Bücher, Artikel oder Websites
Warum halluzinieren LLMs?
LLMs verstehen Text nicht wirklich — sie erkennen statistische Muster. Es gibt mehrere Gründe für Halluzinationen:
1. Mustervervollständigung
Das Modell vervollständigt Muster aus den Trainingsdaten. Es ergänzt plausibel klingende Fortsetzungen — egal ob wahr.
2. Unvollständige Daten
Wenn das Modell zu einem Thema wenig Daten hat, füllt es Lücken mit plausiblem Text, statt „ich weiß es nicht" zu sagen.
3. Überoptimierung durch RLHF
Durch Reinforcement Learning from Human Feedback werden LLMs auf hilfreiche Antworten trainiert. Das führt dazu, dass sie lieber etwas erfinden, als nichts zu sagen.
4. Hohe Temperature
Bei höheren Temperature-Werten wählt das Modell auch unwahrscheinlichere Tokens — das erhöht das Halluzinationsrisiko.
Arten von Halluzinationen
Faktische Halluzinationen
Falsche Fakten, Zahlen, Daten oder Ereignisse. Beispiel: „Die Schlacht von Waterloo fand 1820 statt." Tatsächlich: 1815.
Konfabulationen
Erfundene Details, die den Kontext reicher machen sollen. Beispiel: „Einstein sagte in einem Interview 1950: …" Das Interview existiert nicht.
Quellenerfindungen
Nicht existierende Studien, Bücher oder Artikel. Beispiel: „Laut Studie von Müller et al. (2023) in Nature…" Die Studie existiert nicht.
Reale Konsequenzen
Anwalt nutzt ChatGPT für Gerichtsdokumente
2023, USA: Ein Anwalt reichte Gerichtsdokumente ein, die ChatGPT erstellt hatte. Das Modell zitierte sechs nicht existierende Gerichtsentscheidungen — mit plausiblen Namen, Jahreszahlen und Fallnummern. Der Anwalt prüfte die Quellen nicht. Resultat: Geldstrafe und öffentliche Rüge.
Akademische Arbeiten mit erfundenen Quellen
Studierende nutzen LLMs für Literaturrecherchen. Das Modell erfindet wissenschaftliche Paper mit realistischen Autorennamen. Wenn diese nicht geprüft werden, landen erfundene Quellen in Abschlussarbeiten.
Medizinische Fehlinformationen
LLMs können falsche Dosierungen, nicht existierende Medikamente oder gefährliche Behandlungsempfehlungen generieren — formuliert wie von einem Arzt. Ohne Fact-Checking potenziell lebensgefährlich.
Wie erkennt man Halluzinationen?
Fünf Warnsignale, die Sie stutzig machen sollten:
- Überzeugende Details ohne Quellen — sehr spezifische Zahlen, Namen, Daten, aber keine Quellenangabe.
- Zu perfekte Antworten — wenn die Antwort exakt zu Ihrer Frage passt, selbst bei obskuren Themen.
- Widersprüche bei Nachfragen — fragen Sie nach Details. Ändert das Modell seine Aussage?
- Fehlende Unsicherheits-Marker — echte Experten sagen „wahrscheinlich", „oft". Absolute Aussagen sind verdächtig.
- Quellen nicht auffindbar — wenn genannte Quellen in Google Scholar oder ähnlichen nicht existieren.
Wie vermeidet man sie?
1. Explizit nach Quellen fragen
Was sagt die Forschung über X?
Nenne mir drei wissenschaftliche Studien zu X mit Autoren, Titel und Jahr. Wenn du keine kennst, sag das.
2. Unsicherheit einfordern
Markiere unsichere Aussagen mit [?]. Wenn du etwas nicht weißt, sage „Ich bin mir nicht sicher".
3. Temperature senken
Bei faktischen Abfragen: Temperature 0,0 – 0,3 für deterministischere, weniger „kreative" Antworten.
4. RAG nutzen
Geben Sie dem Modell Zugriff auf echte Dokumente und Datenbanken. Es zieht Informationen dann aus verifizierten Quellen, statt zu halluzinieren.
5. Immer manuell verifizieren
Die wichtigste Regel: Verlassen Sie sich nie blind auf LLM-Outputs. Prüfen Sie Fakten, Quellen und Zahlen manuell — besonders bei wichtigen Entscheidungen.
Wann sind Halluzinationen besonders gefährlich?
Hochrisiko-Bereiche
- Medizin & Gesundheit — falsche Dosierungen oder Diagnosen können lebensgefährlich sein
- Recht & Justiz — erfundene Gesetze oder Urteile führen zu rechtlichen Problemen
- Finanzen — falsche Steuerberatung oder Investment-Tipps haben finanzielle Konsequenzen
- Wissenschaft — erfundene Studien verfälschen den akademischen Diskurs
- Journalismus — Fake-Quellen beschädigen Glaubwürdigkeit
- Bildung — Lernende behalten falsche Fakten, die schwer zu korrigieren sind
Regel: Je höher das Risiko einer falschen Information, desto strenger muss Ihr Fact-Checking sein.
Quellen
- Mata vs. Avianca (2023). US-District-Court-Fall zum Anwalt, der ChatGPT-generierte nicht-existente Präzedenzfälle zitierte.
- OpenAI: Model Behavior Guidelines — Hallucination and Uncertainty. Technische Dokumentation zu RLHF-Nebeneffekten.
- Google DeepMind / Anthropic: Studien zu „calibration of uncertainty" in Large Language Models. 2024/25.
- NIST AI Risk Management Framework: Generative AI Profile. Juli 2024. Kapitel zu Halluzinations-Risiken.
Halluzinationen in Ihrem KI-Einsatz vermeiden.
Im Erstgespräch schauen wir uns die konkreten KI-Workflows Ihres Teams an — und bauen Fact-Check-Leitplanken ein, die im Alltag tragen.