본문으로 건너뛰기
#RLHF1 개의 글

RLHF 관련 글

RLHF 태그가 포함된 블로그 글을 모아봤습니다.

사람의 평가를 이용해 모델 응답을 더 유용하고 안전하게 만드는 학습

RLHF (인간 피드백 강화학습) 용어 자세히 보기 →