Generowanie wspomagane wyszukiwaniem[1] (ang.retrieval-augmented generation[2][3], RAG) – technika umożliwiająca modelom GenAI wyszukiwanie i włączanie nowych, zewnętrznych informacji[4][5]. RAG modyfikuje zapytania do dużego modelu językowego (LLM) tak, aby odpowiadał on na pytania użytkowników z uwzględnieniem dodatkowych, dołączonych danych[6]. Umożliwia to LLM-om korzystanie z informacji specyficznych dla danej dziedziny i/lub zaktualizowanych[6][7].
Oprócz zwiększenia jakości zwracanych odpowiedzi, RAG pozwala również LLM-om na uwzględnianie w generowanych treściach odniesień do źródeł, co umożliwia użytkownikom weryfikację informacji poprzez analizę cytowanych dokumentów lub oryginalnych źródeł. Dzięki temu możliwe jest uzyskanie większej wiarygodności i transparentność, ponieważ użytkownicy mogą sprawdzać pobrane treści, aby upewnić się co do ich dokładności, trafności i pochodzenia[8][9].
Termin RAG został po raz pierwszy wprowadzony w 2020 r. przez Meta[10][11]. Istnieją biblioteki umożliwiające wdrożenie technik RAG wraz z ich specyficznymi funkcjonalnościami[12].
Proces
Uproszczony schemat schematu wzbogacania danych z wykorzystaniem LLM
Indexing (pol. indeksowanie) – dodatkowe dane dostarczane do systemu są osadzane i zapisywane w bazie danych[14].
Retrieval (pol. pobieranie) – pobieranie najbardziej odpowiednich dokumentów dla danego zapytania.
Augmentation (pol. uzupełnianie) – przekazanie pobranych informacji do LLMa za pomocą inżynierii podpowiedzi.
Generation (pol. generowanie) – LLM zwraca odpowiedź w oparciu o wzbogacone dane i zapytanie użytkownika[15]. Niektóre modele mogą korzystać z innych technik wzbogacania odpowiedzi[13].
Przypisy
↑Leandro vonL.WerraLeandro vonL., LewisL.TunstallLewisL., ThomasT.WolfThomasT., Przetwarzanie języka naturalnego z wykorzystaniem transformerów: budowanie aplikacji językowych za pomocą bibliotek Hugging Face, GrzegorzG.Werner (tłum.), Gliwice: Helion, 2024, s. 206, ISBN 978-83-289-0711-9 [dostęp 2025-04-16].