본문으로 건너뛰기
목록으로 돌아가기
자연어 처리 (NLP)

하이브리드 검색 (Hybrid Search)

벡터 검색과 키워드 검색을 결합해 검색 정확도와 재현율을 함께 높이는 방식

#하이브리드 검색#Hybrid Search#벡터 검색#키워드 검색#BM25

하이브리드 검색이란?

하이브리드 검색은 벡터 데이터베이스 기반 의미 검색과 전통적인 키워드 검색(BM25 등)을 함께 사용하는 검색 전략입니다.

의미가 비슷한 문서를 잘 찾는 벡터 검색의 장점과, 고유명사/코드/정확 문구를 잘 찾는 키워드 검색의 장점을 동시에 활용하는 것이 핵심입니다.

왜 중요한가요?

실무 질의는 의미 유사도와 정확 문자열 일치가 동시에 필요합니다.

  • "환불 정책"처럼 표현이 다양한 질문: 벡터 검색이 강함
  • "GPT-4o-mini", "ERR-1042" 같은 정확 식별자: 키워드 검색이 강함

하이브리드 검색은 두 신호를 결합해 한쪽 편향을 줄여, 검색 누락과 노이즈를 함께 낮출 수 있습니다.

운영 팁

초기에는 벡터/키워드 가중치를 고정해 시작하고, 질의 유형별 평가셋으로 가중치를 조정하는 방식이 가장 안정적입니다.

관련 용어