연구성과물

논문 및 특허

[국내특허] [ 4차년도 ] 문서 유사도 측정 모델 생성 방법 및 이를 이용한 문서 유사도 측정 방법
  • 게재 : 특허청
  • 등록일2023.12.31
  • 조회 843
문서 유사도 측정 모델 생성 방법 및 이를 이용한 문서 유사도 측정 방법이 개시된다. 문서 유사도 측정 모델 생성 방법은 표본 데이터에서 문서 내 핵심 문장을 재배열하는 단계, 상기 문서 내 문장구조 및 문장 사이 관계에 대한 추가 학습하는 단계, 기 구축된 데이터와 문장 유사도를 비교하여 파인 튜닝(fine tuning)하여, 기초 학습 모델을 생성하는 단계, 상기 기초 학습 모델을 이용하여, 레이블링 되지 않은 문서 데이터에 대해서 레이블링을 부여하는 준 지도 학습하는 단계, 및 상기 준 지도 학습 과정을 통해 구축된 훈련 데이터를 최대 토큰의 개수에 따라 단계를 나누어 순차적으로 학습하는 단계를 포함한다.