BlindspotLabs Blog

RAG evaluation, retrieval, AI readiness és dokumentációs kísérletek.

Hogy válasszunk chunking stratégiát?

2026. 04. 28.

Egy valós banki Tudástáron teszteltem 4 különböző chunking stratégiát — és meglepő módon nem a “legokosabb” semantic chunking nyert, hanem a legegyszerűbb Fixed Token megoldás. A kísérlet jól megmutatta, hogy retrievalnél nem az számít, melyik algoritmus hangzik intelligensebben, hanem hogy a chunkolás mennyire illeszkedik a tartalom valódi struktúrájához.

Miért érdemes verziózni a corpus változásokat?

2026. 03. 31.

Mi történik, amikor egy RAG rendszer hirtelen “elromlik”, pedig senki nem nyúlt a pipeline-hoz? Egy valós példán keresztül mutatom meg, hogyan tudja a háttérben megváltozó corpus teljesen átírni a retrieval viselkedését — és miért kritikus a dokumentumverziók és corpus snapshotok kezelése production környezetben.