본문으로 건너뛰기
목록으로 돌아가기
AI 인프라/모델 최적화

벡터 데이터베이스 (Vector DB)

AI 임베딩 벡터를 저장하고 유사도 기반으로 검색하는 전문 데이터베이스

#벡터DB#임베딩#검색

벡터 데이터베이스란?

벡터 데이터베이스(Vector Database)는 텍스트, 이미지, 오디오 같은 데이터를 숫자 벡터(임베딩)로 변환하여 저장하고, 의미적 유사도를 기반으로 빠르게 검색할 수 있는 특수한 데이터베이스입니다.

비유하자면, 도서관의 사서가 책 내용의 의미를 이해하는 것과 같습니다. 일반 데이터베이스가 책 제목이나 저자명으로만 검색할 수 있는 도서관이라면, 벡터 데이터베이스는 "우주의 기원에 대한 철학적 논의"라고 질문했을 때 관련된 모든 책을 의미적으로 찾아주는 똑똑한 사서입니다.

어떻게 작동하나요?

  1. 임베딩 변환: AI 모델이 텍스트나 이미지를 수백~수천 차원의 숫자 배열(벡터)로 변환합니다. 의미가 비슷한 데이터는 가까운 벡터값을 갖게 됩니다.
  2. 인덱싱: 벡터들을 효율적으로 검색할 수 있도록 특수한 인덱스 구조로 저장합니다.
  3. 유사도 검색: 쿼리 벡터와 가장 가까운 벡터들을 코사인 유사도 등의 방법으로 찾아냅니다.

대표 서비스

  • Pinecone: 완전 관리형 클라우드 벡터 DB
  • Weaviate: 오픈소스 벡터 검색 엔진
  • ChromaDB: 가벼운 오픈소스 벡터 DB로 프로토타이핑에 적합
  • pgvector: PostgreSQL 확장으로 기존 DB에 벡터 검색 추가

벡터 데이터베이스는 RAG 시스템, 추천 시스템, 의미 기반 검색 등 현대 AI 애플리케이션의 필수 인프라로 자리잡고 있습니다.

관련 용어