연구성과물

논문 및 특허

[국내논문] [ 4차년도 ] 인간 피드백 기반 강화학습 (RLHF)에서 보상 모델의 효과적인 훈련 방법에 관한 연구
  • 게재 : 한글및한국어 정보처리 학술대회
  • 등록일2023.12.31
  • 조회 867

인간 피드백 기반 강화학습 (RLHF)에서 보상 모델의 효과적인 훈련 방법에 관한 연구