Neural-Symbolic AI

연구성과물

논문 및 특허

[국내논문] [ 4차년도 ] 인간 피드백 기반 강화학습 (RLHF)에서 보상 모델의 효과적인 훈련 방법에 관한 연구

게재 : 한글및한국어 정보처리 학술대회
등록일2023.12.31
조회 867

인간 피드백 기반 강화학습 (RLHF)에서 보상 모델의 효과적인 훈련 방법에 관한 연구