연구성과물

논문 및 특허

[국내특허] [ 3차년도 ] 검색 기반의 대화 시스템에서 다음 발화의 응답 선택을 위한 발화 조작 장치 및 그 방법
  • 게재 : 특허청
  • 등록일2022.12.31
  • 조회 807
본 발명은 검색 기반의 대화 시스템에서 다음 발화의 응답 선택을 위한 발화 조작 장치 및 그 방법에 관한 것으로, 외부로부터 입력된 원본 대화에서 임의의 한 발화를 추출하고, 추출된 각 발화를 해당 원본 대화와 분리된 형태로 해당 원본 대화를 제1 재구성하며, 해당 원본 대화의 일관성을 학습할 수 있도록 제1 재구성된 원본 대화의 각 발화의 앞과 마지막 발화의 뒤에 특정의 삽입토큰을 추가하는 발화삽입모듈과, 해당 원본 대화가 아닌 임의의 다른 대화에서 랜덤으로 어느 한 의미가 다른 발화를 추출하고, 추출된 의미가 다른 발화를 해당 원본 대화 중 어느 한 발화의 전/후에 끼워 넣은 형태로 해당 원본 대화를 제2 재구성하며, 해당 원본 대화 내 발화 간의 일관성을 학습할 수 있도록 제2 재구성된 원본 대화의 각 발화의 앞에 특정의 삭제토큰을 추가하는 발화삭제모듈과, 해당 원본 대화에서 임의의 마지막 발화를 추출한 후, 추출된 임의의 마지막 발화를 해당 원본 대화와 분리된 형태로 제3 재구성하고, 해당 원본 대화 내 발화 간의 순서 정보를 학습할 수 있도록 제3 재구성된 원본 대화의 각 발화의 앞에 특정의 검색토큰을 추가하는 발화검색모듈과, 발화삽입모듈로부터 추가된 특정의 삽입토큰, 발화삭제모듈로부터 추가된 특정의 삭제토큰, 및 발화검색모듈로부터 추가된 특정의 검색토큰을 출력 자질로 적용하여, 기 설정된 비지도 학습(Unsupervised Learning) 방법을 기반으로 해당 특정의 삭제토큰, 검색토큰, 및 검색토큰의 위치가 실제 삽입, 삭제, 및 검색되는 위치인지 학습하는 언어학습모델을 포함함으로써, 언어 모델을 기반으로 하는 발화 예측 모델을 설계함에 있어, 특정의 토큰(Special Token)을 이용하여 자기 지도 학습(Self Supervised Learning) 방식을 통해 데이터 증강 효과를 낼 수 있으며, 또한 자기 지도 학습 방식이기 때문에 별도로 사람이 데이터를 구축할 필요가 없는 효과가 있다.