2026 Foci VB - mit jósolnak különböző AI modellek?
Megkérdeztem 4 AI modellt: ki nyeri a 2026-os foci VB-t? Mindegyik szerint Franciaország, esetleg Spanyolország - de más-más logika mentén.
RAG evaluation, retrieval, AI readiness és dokumentációs kísérletek.
Megkérdeztem 4 AI modellt: ki nyeri a 2026-os foci VB-t? Mindegyik szerint Franciaország, esetleg Spanyolország - de más-más logika mentén.
A legtöbb csapat még mindig kézzel próbálja kiértékelni a RAG rendszereit — pedig egy válasz lehet releváns, de hallucinált, vagy pontos, mégis használhatatlan. Ebben a posztban megmutatom, hogyan segít a RAGAS külön mérni a retrieval, a modell és a teljes pipeline viselkedését, és miért fontosabb sokszor a dataset minősége, mint maga a chunking stratégia.
Egy valós banki Tudástáron teszteltem 4 különböző chunking stratégiát — és meglepő módon nem a “legokosabb” semantic chunking nyert, hanem a legegyszerűbb Fixed Token megoldás. A kísérlet jól megmutatta, hogy retrievalnél nem az számít, melyik algoritmus hangzik intelligensebben, hanem hogy a chunkolás mennyire illeszkedik a tartalom valódi struktúrájához.
Mi történik, amikor egy RAG rendszer hirtelen “elromlik”, pedig senki nem nyúlt a pipeline-hoz? Egy valós példán keresztül mutatom meg, hogyan tudja a háttérben megváltozó corpus teljesen átírni a retrieval viselkedését — és miért kritikus a dokumentumverziók és corpus snapshotok kezelése production környezetben.
Az internet egy furcsa ChatGPT válaszon nevetett — de a háttérben valójában egy klasszikus retrieval probléma állt. Egy egyszerű RAG sandboxban megmutatom, hogyan változott meg teljesen ugyanannak a modellnek a válasza pusztán attól, hogy megkapta a hiányzó kontextust. A tanulság: sok AI hiba nem modellhiba, hanem retrieval probléma.