RAG (검색 증강 생성)
외부 지식을 검색하여 AI 응답의 정확성을 높이는 기술
#RAG#LLM#벡터DB
RAG란?
RAG(Retrieval-Augmented Generation)는 AI 모델이 답변을 생성하기 전에 외부 데이터베이스에서 관련 정보를 먼저 검색하고, 그 정보를 참고하여 더 정확한 답변을 만들어내는 기술입니다.
비유하자면, RAG는 오픈북 시험을 보는 학생과 같습니다. 기존 LLM이 머릿속 기억에만 의존해 답을 쓰는 학생이라면, RAG는 시험 중에 교과서와 참고자료를 펼쳐보고 정확한 내용을 확인한 뒤 답안을 작성하는 학생입니다.
어떻게 작동하나요?
RAG는 크게 세 단계로 작동합니다.
- 색인(Indexing): 문서들을 작은 조각으로 나누고 벡터 임베딩으로 변환하여 벡터 데이터베이스에 저장합니다.
- 검색(Retrieval): 사용자 질문이 들어오면 의미적으로 유사한 문서 조각을 벡터 DB에서 찾아냅니다.
- 생성(Generation): 검색된 문서를 컨텍스트로 함께 전달하여 LLM이 근거 있는 답변을 생성합니다.
왜 중요한가요?
RAG는 LLM의 대표적 약점인 할루시네이션을 줄여줍니다. 학습 데이터에 없는 최신 정보나 기업 내부 문서 같은 전문 지식도 활용할 수 있어, 기업용 AI 챗봇이나 고객 지원 시스템에서 특히 널리 사용됩니다. 모델 자체를 재학습할 필요 없이 데이터만 업데이트하면 되므로 비용도 절감됩니다.
관련 용어
자연어 처리 (NLP)
에이전트 (AI Agent)
스스로 판단하고 도구를 활용해 작업을 수행하는 자율 AI
자연어 처리 (NLP)
청크 (Chunk)
긴 문서를 검색과 생성 품질을 위해 의미 단위로 나눈 텍스트 조각
자연어 처리 (NLP)
컨텍스트 윈도우 (Context Window)
AI 모델이 한 번에 읽고 처리할 수 있는 입력 토큰의 최대 범위
자연어 처리 (NLP)
토큰 (Token)
AI가 텍스트를 처리하는 최소 단위
자연어 처리 (NLP)
파인튜닝 (Fine-tuning)
사전 학습된 AI 모델을 특정 목적에 맞게 추가 학습시키는 기술
자연어 처리 (NLP)
프롬프트 (Prompt)
AI 모델에게 원하는 결과를 얻기 위해 입력하는 지시문