Fout-claims in AI-content: patronen en controles
AI-content faalt zelden zichtbaar. De fouten klinken plausibel, lezen vlot en glippen door redacties heen. Een nuchter overzicht van de patronen die je kunt herkennen en de controles die werken.
Het kort: 5 praktijk-takeaways
1. Plausibel is geen waar — De gevaarlijkste AI-fouten zijn de fouten zonder rode vlaggen: bestaande bronvormen met verzonnen inhoud, exacte percentages zonder steekproef, vloeiende citaten zonder vindplaats. Train reviewers op deze stijl, niet alleen op evidente onzin.
2. Markeer cijfer, citaat, naam — Drie elementen vragen altijd verificatie: getallen, citaten en eigennamen. Een vijfminutenscan waarin deze drie worden gemarkeerd en getoetst tegen primaire bronnen vangt de meerderheid van hallucinaties op vóór publicatie.
3. Scan op Amerikaanse drift — Trainingsdata leunt zwaar op Engelstalige content. FMLA, HIPAA, IRS, 401(k) en US-functietitels sluipen in Nederlandse teksten. Maak een vaste vervangingslijst en scan elk artikel actief op deze termen.
4. Causaal vs. correlatie — Werkwoorden als ‘leidt tot’ en ‘veroorzaakt’ suggereren bewijs dat zelden bestaat. Toets per claim of het onderliggende onderzoek experimenteel was. Zo niet: herformuleer naar ‘hangt samen met’. Dit kost één minuut en voorkomt structurele misleiding.
5. Eindverantwoordelijke per domein — Juridische, medische en financiële content vraagt om een benoemde reviewer met domeinkennis die aftekent. Generieke redactie is onvoldoende — de fouten zitten juist in details die alleen een expert herkent.
Waar AI dit goed kan — en waar niet
Factchecking is bij uitstek een taak waar AI én tekortschiet én kan helpen. Tekortschieten: hetzelfde model dat content genereert, is geen betrouwbare controleur van die content. Vragen als ‘klopt dit?’ aan een LLM levert vaak een nieuwe hallucinatie op — bevestigend, want het model voorspelt wat plausibel klinkt, niet wat waar is.
Waar AI wél waarde toevoegt in factcheck-workflows: claim-extractie (welke uitspraken zijn toetsbaar?), patroonherkenning (vlagging van Amerikaanse termen, causale werkwoorden, ronde percentages zonder bron), en retrieval tegen vooraf gevalideerde bronnen — niet tegen het open web. Een RAG-opzet die put uit wetsteksten op eur-lex, CBS-data of geverifieerde corporate documenten kan claims wel onderbouwen, omdat de bron buiten het model ligt.
De nuance: automatisering vervangt geen domeinexpert. Een tool kan een risicoscore geven en de zwaarste claims naar boven halen, maar de uiteindelijke afweging — is deze bron primair, dekt hij de claim volledig, geldt hij in deze jurisdictie — blijft mensenwerk. AI als triage, expert als beslisser.
Bron
Dit overzicht is gebaseerd op het volledige artikel van C37: 7 veelvoorkomende fout-claims in AI-content (met voorbeelden en checkmethodes)
Het C37-artikel bevat per fouttype een concreet voorbeeld, de bijbehorende checkmethode en een vijfstaps-redactieworkflow.