Constitutional AI (헌법 기반 정렬)
명시된 원칙 집합을 기준으로 AI가 자기 비판과 수정을 반복해 정렬하는 접근
#Constitutional AI#헌법 기반 정렬#CAI#AI self-critique
Constitutional AI란?
Constitutional AI는 모델이 따라야 할 원칙(헌법)을 먼저 정의하고, 그 원칙을 기준으로 답변을 스스로 비판·수정하도록 만드는 정렬 방법입니다.
왜 중요한가요?
사람 검수만으로는 확장 비용이 커집니다. Constitutional AI는 대규모 학습 환경에서 일관된 안전·정책 방향을 유지하는 데 유리합니다.
실무 관점
원칙 문서가 모호하면 모델 행동도 불안정해집니다. 금지 항목, 우선순위, 예외 정책을 문서로 명확히 고정해야 합니다.