연구개요
연구 소개
연구내용
응용 및 활용
연구성과물
데이터셋
오픈소스
논문 및 특허
데모
공지/문의
공지사항
FAQ
문의
약관 및 정책
이용약관
개인정보처리방침
이메일무단수집거부
kor
eng
LOGIN
Open menu
kor
eng
LOGIN
연구개요
연구 소개
연구내용
응용 및 활용
연구성과물
데이터셋
오픈소스
논문 및 특허
데모
공지/문의
공지사항
FAQ
문의
약관 및 정책
이용약관
개인정보처리방침
이메일무단수집거부
연구성과물
연구성과물
논문 및 특허
논문 및 특허
[국내논문] [ 4차년도 ] 인간 피드백 기반 강화학습 (RLHF)에서 보상 모델의 효과적인 훈련 방법에 관한 연구
게재 :
한글및한국어 정보처리 학술대회
등록일
2023.12.31
조회
904
인간 피드백 기반 강화학습 (RLHF)에서 보상 모델의 효과적인 훈련 방법에 관한 연구