DE EN
Grundlagen 8 Min. Lesezeit Februar 2026

Halluzinationen — wenn KI Fakten erfindet

Wie man sie erkennt, warum sie entstehen und mit welchen Leitplanken man sie im Griff behält.

Halluzination bei KI — kritisches Prüfen von KI-Ausgaben
Plausibel klingt nicht wahr. Das gefährlichste an Halluzinationen ist ihre überzeugende Form.

Eine Halluzination liegt vor, wenn ein LLM Informationen generiert, die faktisch falsch oder erfunden sind — aber überzeugend und plausibel formuliert.

Das Modell lügt nicht absichtlich. Es kennt den Unterschied zwischen wahr und falsch nicht. Das Gefährliche: Die Antworten klingen oft sehr überzeugend. Das Modell nutzt den richtigen Fachjargon, gibt Details an und formuliert selbstsicher — auch wenn alles erfunden ist.

Typische Beispiele

Warum halluzinieren LLMs?

LLMs verstehen Text nicht wirklich — sie erkennen statistische Muster. Es gibt mehrere Gründe für Halluzinationen:

1. Mustervervollständigung

Das Modell vervollständigt Muster aus den Trainingsdaten. Es ergänzt plausibel klingende Fortsetzungen — egal ob wahr.

2. Unvollständige Daten

Wenn das Modell zu einem Thema wenig Daten hat, füllt es Lücken mit plausiblem Text, statt „ich weiß es nicht" zu sagen.

3. Überoptimierung durch RLHF

Durch Reinforcement Learning from Human Feedback werden LLMs auf hilfreiche Antworten trainiert. Das führt dazu, dass sie lieber etwas erfinden, als nichts zu sagen.

4. Hohe Temperature

Bei höheren Temperature-Werten wählt das Modell auch unwahrscheinlichere Tokens — das erhöht das Halluzinationsrisiko.

Zwei Varianten: Halluzination mit falsch-selbstsicheren Aussagen vs. korrekte, belegte Information
Fakten-Check als Pflicht. Unsicherheits-Marker explizit einfordern.

Arten von Halluzinationen

Faktische Halluzinationen

Falsche Fakten, Zahlen, Daten oder Ereignisse. Beispiel: „Die Schlacht von Waterloo fand 1820 statt." Tatsächlich: 1815.

Konfabulationen

Erfundene Details, die den Kontext reicher machen sollen. Beispiel: „Einstein sagte in einem Interview 1950: …" Das Interview existiert nicht.

Quellenerfindungen

Nicht existierende Studien, Bücher oder Artikel. Beispiel: „Laut Studie von Müller et al. (2023) in Nature…" Die Studie existiert nicht.

Reale Konsequenzen

Anwalt nutzt ChatGPT für Gerichtsdokumente

2023, USA: Ein Anwalt reichte Gerichtsdokumente ein, die ChatGPT erstellt hatte. Das Modell zitierte sechs nicht existierende Gerichtsentscheidungen — mit plausiblen Namen, Jahreszahlen und Fallnummern. Der Anwalt prüfte die Quellen nicht. Resultat: Geldstrafe und öffentliche Rüge.

Akademische Arbeiten mit erfundenen Quellen

Studierende nutzen LLMs für Literaturrecherchen. Das Modell erfindet wissenschaftliche Paper mit realistischen Autorennamen. Wenn diese nicht geprüft werden, landen erfundene Quellen in Abschlussarbeiten.

Medizinische Fehlinformationen

LLMs können falsche Dosierungen, nicht existierende Medikamente oder gefährliche Behandlungsempfehlungen generieren — formuliert wie von einem Arzt. Ohne Fact-Checking potenziell lebensgefährlich.

Die Antwort klingt wie ein Experte. Sie ist es nicht.

Wie erkennt man Halluzinationen?

Fünf Warnsignale, die Sie stutzig machen sollten:

  1. Überzeugende Details ohne Quellen — sehr spezifische Zahlen, Namen, Daten, aber keine Quellenangabe.
  2. Zu perfekte Antworten — wenn die Antwort exakt zu Ihrer Frage passt, selbst bei obskuren Themen.
  3. Widersprüche bei Nachfragen — fragen Sie nach Details. Ändert das Modell seine Aussage?
  4. Fehlende Unsicherheits-Marker — echte Experten sagen „wahrscheinlich", „oft". Absolute Aussagen sind verdächtig.
  5. Quellen nicht auffindbar — wenn genannte Quellen in Google Scholar oder ähnlichen nicht existieren.

Wie vermeidet man sie?

1. Explizit nach Quellen fragen

Schwach
Was sagt die Forschung über X?
Besser
Nenne mir drei wissenschaftliche Studien zu X
mit Autoren, Titel und Jahr.
Wenn du keine kennst, sag das.

2. Unsicherheit einfordern

Markiere unsichere Aussagen mit [?].
Wenn du etwas nicht weißt, sage „Ich bin mir nicht sicher".

3. Temperature senken

Bei faktischen Abfragen: Temperature 0,0 – 0,3 für deterministischere, weniger „kreative" Antworten.

4. RAG nutzen

Geben Sie dem Modell Zugriff auf echte Dokumente und Datenbanken. Es zieht Informationen dann aus verifizierten Quellen, statt zu halluzinieren.

5. Immer manuell verifizieren

Die wichtigste Regel: Verlassen Sie sich nie blind auf LLM-Outputs. Prüfen Sie Fakten, Quellen und Zahlen manuell — besonders bei wichtigen Entscheidungen.

Wann sind Halluzinationen besonders gefährlich?

Hochrisiko-Bereiche

Regel: Je höher das Risiko einer falschen Information, desto strenger muss Ihr Fact-Checking sein.

Halluzinationen sind kein Bug. Sie sind der Preis statistischer Sprache — und sie werden durch Disziplin, nicht durch Glauben beherrscht.

Quellen

  1. Mata vs. Avianca (2023). US-District-Court-Fall zum Anwalt, der ChatGPT-generierte nicht-existente Präzedenzfälle zitierte.
  2. OpenAI: Model Behavior Guidelines — Hallucination and Uncertainty. Technische Dokumentation zu RLHF-Nebeneffekten.
  3. Google DeepMind / Anthropic: Studien zu „calibration of uncertainty" in Large Language Models. 2024/25.
  4. NIST AI Risk Management Framework: Generative AI Profile. Juli 2024. Kapitel zu Halluzinations-Risiken.
Nächster Schritt

Halluzinationen in Ihrem KI-Einsatz vermeiden.

Im Erstgespräch schauen wir uns die konkreten KI-Workflows Ihres Teams an — und bauen Fact-Check-Leitplanken ein, die im Alltag tragen.