벡터 데이터베이스 (Vector DB)
AI 임베딩 벡터를 저장하고 유사도 기반으로 검색하는 전문 데이터베이스
#벡터DB#임베딩#검색
벡터 데이터베이스란?
벡터 데이터베이스(Vector Database)는 텍스트, 이미지, 오디오 같은 데이터를 숫자 벡터(임베딩)로 변환하여 저장하고, 의미적 유사도를 기반으로 빠르게 검색할 수 있는 특수한 데이터베이스입니다.
비유하자면, 도서관의 사서가 책 내용의 의미를 이해하는 것과 같습니다. 일반 데이터베이스가 책 제목이나 저자명으로만 검색할 수 있는 도서관이라면, 벡터 데이터베이스는 "우주의 기원에 대한 철학적 논의"라고 질문했을 때 관련된 모든 책을 의미적으로 찾아주는 똑똑한 사서입니다.
어떻게 작동하나요?
- 임베딩 변환: AI 모델이 텍스트나 이미지를 수백~수천 차원의 숫자 배열(벡터)로 변환합니다. 의미가 비슷한 데이터는 가까운 벡터값을 갖게 됩니다.
- 인덱싱: 벡터들을 효율적으로 검색할 수 있도록 특수한 인덱스 구조로 저장합니다.
- 유사도 검색: 쿼리 벡터와 가장 가까운 벡터들을 코사인 유사도 등의 방법으로 찾아냅니다.
대표 서비스
- Pinecone: 완전 관리형 클라우드 벡터 DB
- Weaviate: 오픈소스 벡터 검색 엔진
- ChromaDB: 가벼운 오픈소스 벡터 DB로 프로토타이핑에 적합
- pgvector: PostgreSQL 확장으로 기존 DB에 벡터 검색 추가
벡터 데이터베이스는 RAG 시스템, 추천 시스템, 의미 기반 검색 등 현대 AI 애플리케이션의 필수 인프라로 자리잡고 있습니다.
관련 용어
AI 인프라/모델 최적화
레이트 리미팅 (Rate Limiting)
짧은 시간에 과도한 요청이 몰릴 때 API 호출량을 제한하는 제어 기법
AI 인프라/모델 최적화
버텍스 AI (Vertex AI)
Google Cloud에서 제공하는 기업용 머신러닝·생성형 AI 통합 플랫폼
AI 인프라/모델 최적화
에이전트 오케스트레이션 (Agent Orchestration)
여러 AI 에이전트와 도구 실행 흐름을 정책에 맞게 조정·통제하는 운영 방식
AI 인프라/모델 최적화
엣지 AI (Edge AI)
클라우드 대신 기기에서 직접 AI를 실행하는 방식
AI 인프라/모델 최적화
주권 AI (Sovereign AI)
데이터·모델·인프라 통제권을 조직이나 국가가 직접 보유하는 AI 운영 전략
AI 인프라/모델 최적화
코봇 (Collaborative Robot)
사람과 같은 작업 공간에서 협업하도록 설계된 안전 중심 산업용 로봇