AI hallucináció elkerülése vállalati környezetben

Az AI hallucináció — vagyis amikor az LLM magabiztosan állít olyat, ami nem igaz — a vállalati AI-bevezetés legnagyobb kockázata. Egy ChatGPT-funkció, ami egyetlen rossz ÁSZF-választ ad egy ügyfélnek, akár jogi pert is jelenthet. Ebben a cikkben végigvesszük, miért történik, és milyen 5 technikával lehet 90%+-ban kiszűrni.

Miért hallucinál egy LLM?

A nagy nyelvi modellek (LLM-ek) nem "tudnak" dolgokat — szövegvalószínűségeket számolnak. Ha azt kérdezed, hogy "Mi a Cognyra GDPR-tájékoztatójának 5. pontja?", a modell egy plauzibilisen hangzó választ generál — nem ellenőrzi, hogy létezik-e ilyen dokumentum.

Három tipikus hallucináció-típus:

Tényhallucináció: A modell kitalál egy adatot. "Az Európai Bizottság 2024-es rendelete szerint..." — ami soha nem volt.
Forráshallucináció: A modell hivatkozik egy nem létező cikkre, tanulmányra, jogszabályra. "X. Y. (2023): A magyar AI-piac elemzése..." — fiktív.
Logikai hallucináció: A modell érvel egy következtetésre, amely a megadott premisszákból valójában nem következik.

5 technika a hallucináció kiszűrésére

1. RAG (Retrieval-Augmented Generation)

Ez a legfontosabb védelem. Ahelyett hogy az LLM a saját "memóriájából" generálna, előbb keresünk a céges dokumentumokban, és csak a megtalált szövegekre támaszkodva válaszolunk. Részletes magyarázat: Mi az a RAG?

Hatás: a tényhallucinációt 70-80%-kal csökkenti, mert az LLM-nek "el kell árulnia" a forrását.

2. Idézés-kötelezettség (citation enforcement)

A prompt-ban kötelezővé tesszük: "A válaszod minden tényállításához idézz konkrét forrást a megadott kontextusból. Ha nincs hivatkozható forrás, írd: 'Nem találtam információt.'" Ez egy egyszerű, de meglepően hatásos technika.

Hatás: a forráshallucináció gyakorlatilag eltűnik, mert a modell nem talál ki forrást — csak a megadottakból idézhet. A Cognyra-ban ez beépített viselkedés.

3. Confidence-scoring

A retrieval-fázisban mérjük, mennyire releváns a megtalált dokumentum a kérdéshez. Ha a relevancia-pontszám alacsony (pl. cosine similarity < 0.6), figyelmeztetjük a felhasználót: "Ezt a kérdést nem találtam meg pontosan a tudásbázisban. Lehet hogy nem teljes a válaszom."

Hatás: a felhasználó tudja, hogy mikor kell saját maga is ellenőriznie. Ez a "kalibrált bizonytalanság" elv.

4. Self-consistency check

Kritikus kérdéseknél (pl. jogi vagy egészségügyi) ugyanazt a kérdést többször is feltehetjük az LLM-nek (3-5 ismétlés), magasabb hőmérsékleten. Ha a válaszok érdemben különböznek, az hallucináció jele — visszadobjuk a felhasználónak ember-a-loopba.

Hatás: drága (5x több tokent fogyaszt), de a fontosabb döntéseknél megéri.

5. Ember-a-loopban (human-in-the-loop)

Bizonyos kategóriákba eső kérdéseknél (pl. szerződéses kötelezettségvállalás, orvosi tanács, pénzügyi javaslat) ne adjon az AI önálló választ. Helyette a megtalált forrásokat mutassa be egy szakértőnek, aki ellenőrzi és kiadja a végleges választ.

Hatás: a kockázatos területeken nullára csökkenti a hallucináció-hatást, viszont gyorsítja a szakértőt (mert a forrásokat már megtalálta neki).

Mit ne tegyél

Ne hagyatkozz csak a "low temperature"-re

Sokan azt hiszik, ha a temperature paramétert 0-ra állítjuk, az LLM nem hallucinál. Tévedés. Az alacsony temperature csak determinisztikusabb kimenetet ad — ha a modell a "tudásában" hibás, akkor minden alkalommal ugyanazt a hamis választ adja, csak konzisztensen.

Ne fogadj el "magabiztos" kimenetet bizonyítékként

Az LLM-ek meggyőzően írnak. Egy plauzibilisen hangzó válasz gyakran jobban hangzik mint a valódi. Mindig ragaszkodj a forrás-hivatkozáshoz — ha nincs benne, nem tényállítás.

Ne tegyél fel komplex kérdést egy lépésben

"Adj nekem egy stratégiát a magyar AI-piac meghódítására" — egy LLM kitalál egy fél-igazat. Helyette bontsd le: "Mit kommunikál X versenytárs?" → "Milyen szegmensben van rés?" → "Milyen árazási stratégia jellemző?" Minden lépésnél ellenőrizhető forrással válaszolhat.

Cognyra megközelítés

A Cognyra-ban beépítve használjuk a fenti technikákat: RAG (kötelező), idézés-kötelezettség (kötelező), confidence-scoring (low-confidence riasztással), ember-a-loop (audit log minden válaszhoz). Részletek a Biztonság & GDPR és a Funkciók oldalakon.

Olvasd el legközelebb: AI tudásbázis bevezetése egy magyar vállalatnál — konkrét 8 hetes playbook a pilot-tól a termelésbe.