본문으로 건너뛰기
목록으로 돌아가기
economics

추론 비용 (Inference Cost)

학습이 끝난 모델이 실제 요청을 처리할 때 발생하는 단위당 실행 비용

#추론 비용#Inference Cost#토큰 비용#LLM 가격

추론 비용이란?

추론 비용은 모델 학습 이후, 실제 서비스에서 프롬프트를 처리하고 응답을 생성할 때 드는 비용입니다.

보통 어떻게 측정하나요?

API 환경에서는 주로 입력·출력 토큰 단가로 측정하고, 로컬 환경에서는 GPU 감가상각, 전력비, 운영비를 합산해 계산합니다.

왜 중요한가요?

추론 비용은 제품 가격 정책, 기능 범위, 사용자당 수익성에 직접 영향을 주기 때문에 AI 서비스의 사업성 판단 핵심 지표로 쓰입니다.

관련 용어