IT기술 관련/A.I 인공지능
🔍 RAG란 무엇인가?
호레
2025. 6. 14. 18:24
반응형
**Retrieval-Augmented Generation (RAG)**은 LLM이 응답을 생성할 때, 사전에 학습된 지식만으로 판단하는 것이 아니라 외부에서 관련 정보를 검색하여 참고한 후 응답을 생성하는 방식입니다.
구성 요소
- Retriever: 질문(Query)에 대해 벡터 유사도를 이용해 관련 문서를 찾음
- Generator (LLM): 검색된 문서들을 기반으로 답변을 생성함
⚙️ RAG 동작 방식 (파이프라인)
- 문서 사전 처리 (Indexing)
- 문서 → 청크 분할 (chunking)
- 각 청크를 임베딩 → 벡터 DB (예: Chroma, Weaviate, FAISS)에 저장
- 질의 처리 (Querying)
- 사용자 질문을 임베딩
- 벡터 유사도 기반으로 관련 문서 Top-k 검색
- 응답 생성
- 검색된 문서를 LLM에게 프롬프트로 전달
- LLM이 정보를 활용하여 자연어 응답 생성
🛠️ 사용 기술 스택 예시
단계기술
문서 임베딩 | OpenAI Embedding, HuggingFace Transformers |
벡터 DB | Chroma, FAISS, Weaviate, Pinecone |
LLM | GPT-4, LLaMA, Claude, Ollama 기반 모델 등 |
파이프라인 오케스트레이션 | LangChain, LlamaIndex, Haystack, n8n |
💡 실전 활용 예시
1. 내부 문서 기반 QA 시스템
- 사내 정책, 기술 문서, 매뉴얼 등을 벡터화하여 직원들이 자연어로 질문 → 자동 응답
2. 고객 지원 챗봇
- 제품 설명서, FAQ 등을 RAG 기반으로 연결해 자동 상담
3. SIEM/보안 로그 분석
- Wazuh, CrowdStrike 등에서 수집한 보안 로그를 벡터화 후 LLM과 연동하여 공격 분석 보고서 생성
4. 법률/의료 문서 해석
- 특정 규제 문서나 진료 기록을 근거로 신뢰 가능한 답변 제공
반응형