엣지 AI (Edge AI)
클라우드 대신 기기에서 직접 AI를 실행하는 방식
#Edge AI#온디바이스#효율
엣지 AI란?
엣지 AI는 스마트폰, 카메라, 자동차, IoT 센서 같은 기기(엣지)에서 AI 모델을 직접 실행하는 방식을 말합니다. 클라우드 서버로 데이터를 보내 분석 결과를 받는 대신, 기기 안에서 바로 판단을 내리는 구조입니다. 옆 사람에게 바로 묻고 답을 받는 것처럼 빠르고, 네트워크가 없어도 동작합니다.
어떻게 작동하나요?
엣지 기기는 연산 자원이 제한적이므로 가볍고 최적화된 모델이 필요합니다. 이를 위해 양자화(정밀도 낮추기), 프루닝(불필요한 연결 제거), 지식 증류(큰 모델의 지식을 작은 모델에 전달) 같은 기법이 쓰입니다. 또한 스마트폰의 NPU, 전용 엣지 가속기처럼 AI 전용 칩이 성능을 보완합니다.
왜 중요한가요?
엣지 AI의 핵심 가치는 지연 시간, 프라이버시, 안정성입니다. 자율주행이나 로봇처럼 즉각 반응이 필요한 작업은 클라우드 왕복 지연이 치명적입니다. 의료 영상이나 보안 영상처럼 민감한 데이터는 기기 밖으로 나가지 않아야 합니다. 네트워크가 끊겨도 계속 동작해야 하는 상황에서도 엣지 AI는 필수입니다.
관련 용어
AI 인프라/모델 최적화
레이트 리미팅 (Rate Limiting)
짧은 시간에 과도한 요청이 몰릴 때 API 호출량을 제한하는 제어 기법
AI 인프라/모델 최적화
버텍스 AI (Vertex AI)
Google Cloud에서 제공하는 기업용 머신러닝·생성형 AI 통합 플랫폼
AI 인프라/모델 최적화
벡터 데이터베이스 (Vector DB)
AI 임베딩 벡터를 저장하고 유사도 기반으로 검색하는 전문 데이터베이스
AI 인프라/모델 최적화
에이전트 오케스트레이션 (Agent Orchestration)
여러 AI 에이전트와 도구 실행 흐름을 정책에 맞게 조정·통제하는 운영 방식
AI 인프라/모델 최적화
주권 AI (Sovereign AI)
데이터·모델·인프라 통제권을 조직이나 국가가 직접 보유하는 AI 운영 전략
AI 인프라/모델 최적화
코봇 (Collaborative Robot)
사람과 같은 작업 공간에서 협업하도록 설계된 안전 중심 산업용 로봇