Az AI hallucináció — vagyis amikor az LLM magabiztosan állít olyat, ami nem igaz — a vállalati AI-bevezetés legnagyobb kockázata. Egy ChatGPT-funkció, ami egyetlen rossz ÁSZF-választ ad egy ügyfélnek, akár jogi pert is jelenthet. Ebben a cikkben végigvesszük, miért történik, és milyen 5 technikával lehet 90%+-ban kiszűrni.
Miért hallucinál egy LLM?
A nagy nyelvi modellek (LLM-ek) nem "tudnak" dolgokat — szövegvalószínűségeket számolnak. Ha azt kérdezed, hogy "Mi a Cognyra GDPR-tájékoztatójának 5. pontja?", a modell egy plauzibilisen hangzó választ generál — nem ellenőrzi, hogy létezik-e ilyen dokumentum.
Három tipikus hallucináció-típus:
- Tényhallucináció: A modell kitalál egy adatot. "Az Európai Bizottság 2024-es rendelete szerint..." — ami soha nem volt.
- Forráshallucináció: A modell hivatkozik egy nem létező cikkre, tanulmányra, jogszabályra. "X. Y. (2023): A magyar AI-piac elemzése..." — fiktív.
- Logikai hallucináció: A modell érvel egy következtetésre, amely a megadott premisszákból valójában nem következik.
5 technika a hallucináció kiszűrésére
1. RAG (Retrieval-Augmented Generation)
Ez a legfontosabb védelem. Ahelyett hogy az LLM a saját "memóriájából" generálna, előbb keresünk a céges dokumentumokban, és csak a megtalált szövegekre támaszkodva válaszolunk. Részletes magyarázat: Mi az a RAG?
Hatás: a tényhallucinációt 70-80%-kal csökkenti, mert az LLM-nek "el kell árulnia" a forrását.
2. Idézés-kötelezettség (citation enforcement)
A prompt-ban kötelezővé tesszük: "A válaszod minden tényállításához idézz konkrét forrást a megadott kontextusból. Ha nincs hivatkozható forrás, írd: 'Nem találtam információt.'" Ez egy egyszerű, de meglepően hatásos technika.
Hatás: a forráshallucináció gyakorlatilag eltűnik, mert a modell nem talál ki forrást — csak a megadottakból idézhet. A Cognyra-ban ez beépített viselkedés.
3. Confidence-scoring
A retrieval-fázisban mérjük, mennyire releváns a megtalált dokumentum a kérdéshez. Ha a relevancia-pontszám alacsony (pl. cosine similarity < 0.6), figyelmeztetjük a felhasználót: "Ezt a kérdést nem találtam meg pontosan a tudásbázisban. Lehet hogy nem teljes a válaszom."
Hatás: a felhasználó tudja, hogy mikor kell saját maga is ellenőriznie. Ez a "kalibrált bizonytalanság" elv.
4. Self-consistency check
Kritikus kérdéseknél (pl. jogi vagy egészségügyi) ugyanazt a kérdést többször is feltehetjük az LLM-nek (3-5 ismétlés), magasabb hőmérsékleten. Ha a válaszok érdemben különböznek, az hallucináció jele — visszadobjuk a felhasználónak ember-a-loopba.
Hatás: drága (5x több tokent fogyaszt), de a fontosabb döntéseknél megéri.
5. Ember-a-loopban (human-in-the-loop)
Bizonyos kategóriákba eső kérdéseknél (pl. szerződéses kötelezettségvállalás, orvosi tanács, pénzügyi javaslat) ne adjon az AI önálló választ. Helyette a megtalált forrásokat mutassa be egy szakértőnek, aki ellenőrzi és kiadja a végleges választ.
Hatás: a kockázatos területeken nullára csökkenti a hallucináció-hatást, viszont gyorsítja a szakértőt (mert a forrásokat már megtalálta neki).
Mit ne tegyél
Ne hagyatkozz csak a "low temperature"-re
Sokan azt hiszik, ha a temperature paramétert 0-ra állítjuk, az LLM nem hallucinál. Tévedés. Az alacsony temperature csak determinisztikusabb kimenetet ad — ha a modell a "tudásában" hibás, akkor minden alkalommal ugyanazt a hamis választ adja, csak konzisztensen.
Ne fogadj el "magabiztos" kimenetet bizonyítékként
Az LLM-ek meggyőzően írnak. Egy plauzibilisen hangzó válasz gyakran jobban hangzik mint a valódi. Mindig ragaszkodj a forrás-hivatkozáshoz — ha nincs benne, nem tényállítás.
Ne tegyél fel komplex kérdést egy lépésben
"Adj nekem egy stratégiát a magyar AI-piac meghódítására" — egy LLM kitalál egy fél-igazat. Helyette bontsd le: "Mit kommunikál X versenytárs?" → "Milyen szegmensben van rés?" → "Milyen árazási stratégia jellemző?" Minden lépésnél ellenőrizhető forrással válaszolhat.
Cognyra megközelítés
A Cognyra-ban beépítve használjuk a fenti technikákat: RAG (kötelező), idézés-kötelezettség (kötelező), confidence-scoring (low-confidence riasztással), ember-a-loop (audit log minden válaszhoz). Részletek a Biztonság & GDPR és a Funkciók oldalakon.
Olvasd el legközelebb: AI tudásbázis bevezetése egy magyar vállalatnál — konkrét 8 hetes playbook a pilot-tól a termelésbe.