AI 인프라/모델 최적화
[AI로 가는 길 09] 트랜스포머 다음 단계: 프리트레이닝·파인튜닝·RLHF를 한 번에 이해하기
트랜스포머가 엔진이라면, 프리트레이닝·파인튜닝·RLHF는 그 엔진을 실제로 움직이게 하는 학습 공정입니다. ChatGPT 같은 대화형 AI가 어떻게 만들어지는지 직관적으로 설명합니다.
글 읽기RLHF 태그가 포함된 블로그 글을 모아봤습니다.
사람의 평가를 이용해 모델 응답을 더 유용하고 안전하게 만드는 학습
RLHF (인간 피드백 강화학습) 용어 자세히 보기 →트랜스포머가 엔진이라면, 프리트레이닝·파인튜닝·RLHF는 그 엔진을 실제로 움직이게 하는 학습 공정입니다. ChatGPT 같은 대화형 AI가 어떻게 만들어지는지 직관적으로 설명합니다.
글 읽기