IT기술 관련/A.I 인공지능

🔍 RAG란 무엇인가?

호레 2025. 6. 14. 18:24
반응형

**Retrieval-Augmented Generation (RAG)**은 LLM이 응답을 생성할 때, 사전에 학습된 지식만으로 판단하는 것이 아니라 외부에서 관련 정보를 검색하여 참고한 후 응답을 생성하는 방식입니다.

구성 요소

  1. Retriever: 질문(Query)에 대해 벡터 유사도를 이용해 관련 문서를 찾음
  2. Generator (LLM): 검색된 문서들을 기반으로 답변을 생성함

⚙️ RAG 동작 방식 (파이프라인)

  1. 문서 사전 처리 (Indexing)
    • 문서 → 청크 분할 (chunking)
    • 각 청크를 임베딩 → 벡터 DB (예: Chroma, Weaviate, FAISS)에 저장
  2. 질의 처리 (Querying)
    • 사용자 질문을 임베딩
    • 벡터 유사도 기반으로 관련 문서 Top-k 검색
  3. 응답 생성
    • 검색된 문서를 LLM에게 프롬프트로 전달
    • LLM이 정보를 활용하여 자연어 응답 생성

🛠️ 사용 기술 스택 예시

단계기술
문서 임베딩 OpenAI Embedding, HuggingFace Transformers
벡터 DB Chroma, FAISS, Weaviate, Pinecone
LLM GPT-4, LLaMA, Claude, Ollama 기반 모델 등
파이프라인 오케스트레이션 LangChain, LlamaIndex, Haystack, n8n
 

💡 실전 활용 예시

1. 내부 문서 기반 QA 시스템

  • 사내 정책, 기술 문서, 매뉴얼 등을 벡터화하여 직원들이 자연어로 질문 → 자동 응답

2. 고객 지원 챗봇

  • 제품 설명서, FAQ 등을 RAG 기반으로 연결해 자동 상담

3. SIEM/보안 로그 분석

  • Wazuh, CrowdStrike 등에서 수집한 보안 로그를 벡터화 후 LLM과 연동하여 공격 분석 보고서 생성

4. 법률/의료 문서 해석

  • 특정 규제 문서나 진료 기록을 근거로 신뢰 가능한 답변 제공
반응형