클라우드 AI (Cloud AI)
외부 AI 서비스 제공자의 API를 통해 모델을 사용하는 방식
#클라우드 AI#클라우드AI#Cloud AI#AI API#관리형 모델
클라우드 AI란?
클라우드 AI는 OpenAI, Anthropic, Google 같은 제공사의 API를 통해 모델을 호출해 사용하는 방식입니다.
주요 장점
초기 구축이 빠르고 최신 모델을 즉시 사용할 수 있으며, 트래픽 급증 시 확장이 상대적으로 쉽습니다.
주요 고려사항
사용량 기반 과금으로 비용이 급증할 수 있고, 규제 산업에서는 데이터 외부 전송 자체가 제약이 될 수 있습니다.
관련 용어
AI 인프라/모델 최적화
레이트 리미팅 (Rate Limiting)
짧은 시간에 과도한 요청이 몰릴 때 API 호출량을 제한하는 제어 기법
AI 인프라/모델 최적화
로봇 파운데이션 모델 (Robot Foundation Model)
대규모 로봇 데이터와 멀티모달 입력으로 사전 학습되어 다양한 물리 작업에 전이 가능한 범용 로봇 AI 모델
AI 인프라/모델 최적화
로컬 AI (Local AI)
모델을 외부 API가 아닌 자체 PC·서버에서 직접 실행하는 방식
AI 인프라/모델 최적화
모델 증류 (Model Distillation)
대형 모델의 출력 신호를 활용해 더 작은 모델을 학습시키는 경량화 기법
AI 인프라/모델 최적화
버텍스 AI (Vertex AI)
Google Cloud에서 제공하는 기업용 머신러닝·생성형 AI 통합 플랫폼
AI 인프라/모델 최적화
벡터 데이터베이스 (Vector DB)
AI 임베딩 벡터를 저장하고 유사도 기반으로 검색하는 전문 데이터베이스