🔍 RAG란 무엇인가?

Retriever: 질문(Query)에 대해 벡터 유사도를 이용해 관련 문서를 찾음
Generator (LLM): 검색된 문서들을 기반으로 답변을 생성함

호레 2025. 6. 14. 18:24

**Retrieval-Augmented Generation (RAG)**은 LLM이 응답을 생성할 때, 사전에 학습된 지식만으로 판단하는 것이 아니라 외부에서 관련 정보를 검색하여 참고한 후 응답을 생성하는 방식입니다.

⚙️ RAG 동작 방식 (파이프라인)

문서 사전 처리 (Indexing)
- 문서 → 청크 분할 (chunking)
- 각 청크를 임베딩 → 벡터 DB (예: Chroma, Weaviate, FAISS)에 저장
질의 처리 (Querying)
- 사용자 질문을 임베딩
- 벡터 유사도 기반으로 관련 문서 Top-k 검색
응답 생성
- 검색된 문서를 LLM에게 프롬프트로 전달
- LLM이 정보를 활용하여 자연어 응답 생성

단계기술

문서 임베딩	OpenAI Embedding, HuggingFace Transformers
벡터 DB	Chroma, FAISS, Weaviate, Pinecone
LLM	GPT-4, LLaMA, Claude, Ollama 기반 모델 등
파이프라인 오케스트레이션	LangChain, LlamaIndex, Haystack, n8n