RAG (검색 증강 생성)

RAG란?

RAG(Retrieval-Augmented Generation)는 AI 모델이 답변을 생성하기 전에 외부 데이터베이스에서 관련 정보를 먼저 검색하고, 그 정보를 참고하여 더 정확한 답변을 만들어내는 기술입니다.

비유하자면, RAG는 오픈북 시험을 보는 학생과 같습니다. 기존 LLM이 머릿속 기억에만 의존해 답을 쓰는 학생이라면, RAG는 시험 중에 교과서와 참고자료를 펼쳐보고 정확한 내용을 확인한 뒤 답안을 작성하는 학생입니다.

어떻게 작동하나요?

RAG는 크게 세 단계로 작동합니다.

색인(Indexing): 문서들을 작은 조각으로 나누고 벡터 임베딩으로 변환하여 벡터 데이터베이스에 저장합니다.
검색(Retrieval): 사용자 질문이 들어오면 의미적으로 유사한 문서 조각을 벡터 DB에서 찾아냅니다.
생성(Generation): 검색된 문서를 컨텍스트로 함께 전달하여 LLM이 근거 있는 답변을 생성합니다.

왜 중요한가요?

RAG는 LLM의 대표적 약점인 할루시네이션을 줄여줍니다. 학습 데이터에 없는 최신 정보나 기업 내부 문서 같은 전문 지식도 활용할 수 있어, 기업용 AI 챗봇이나 고객 지원 시스템에서 특히 널리 사용됩니다. 모델 자체를 재학습할 필요 없이 데이터만 업데이트하면 되므로 비용도 절감됩니다.

RAG란?

어떻게 작동하나요?

왜 중요한가요?

관련 용어