구어체에 특화된 인공지능 기계 번역 스타트업 엑스엘에이트(XL8, 대표 정영훈)는 자연어처리(Natural Language Processing) 분야 최고의 국제 컨퍼런스 중 하나인 ‘The 2023 Conference on Empirical Methods in Natural Language Processing(EMNLP)’에서 실시간 번역(Simultaneous Machine Translation 성능을 향상시키기 위한 방법을 제안하는 논문을 제출해 지난달 승인 받았으며, 오는 12월 EMNLP 2023 Findings에 게재될 예정이다.
엑스엘에이트의 김강, 조한규 리서치 사이언티스트가 공동 1저자로 참여한 논문 “Enhanced Simultaneous Machine Translation with Word-level Policies”에서는 지금까지 실시간 기계 번역이 사용해온 서브워드(sub-word) 기반 폴리시(policy) 방식이 아닌 워드(word) 기반 폴리시를 실시간 번역 시스템에 통합하는 것을 제안함으로써, 훨씬 높은 번역 성능을 보일 수 있음을 보여준다.
일반적으로 기계 번역 모델은 희귀 단어 처리, 모델링의 유연성 등의 장점으로 인해 입출력 문장을 서브워드 단위로 분할하여 모델을 학습시켜왔다. 실시간 번역 모델은 언제 번역을 시작하고 이어갈지 결정하는 폴리시에 기반해 동작하는데, 기존 실시간 모델들은 비실시간 모델에 따라 서브워드 기반 폴리시를 바탕으로 동작하도록 설계되었다. 하지만 서브워드 기반 폴리시는 모든 서브워드가 처리되기 전에 부분적으로 처리된 워드에서 번역을 생성하는 경우가 많기 때문에 번역 품질이 최적화되지 않는 경우가 많았다.
또한, 언어 모델과 실시간 기계 번역 간 서브워드의 불일치 문제로 인해 자연어처리 모델 성능을 향상시킬 수 있는 강력한 방법으로 입증된 언어 모델의 통합을 실시간 기계 번역 모델에 적용하지 못하는 문제가 있었다. 해당 연구는 워드 기반 폴리시를 사용해 이러한 한계를 극복하여 서브워드 기반 폴리시 대비 더 낮은 지연시간과 더 높은 번역 성능을 달성 가능한 것을 보였다.
이번 연구에서 제안된 실시간 번역 모델은 엑스엘에이트의 실시간 통번역 서비스 ‘이벤트캣(EventCAT)’에 통합되어 라이브 방송 및 스트리밍, 글로벌 컨퍼런스, 비즈니스 미팅, 라이브커머스 등 다양한 라이브 행사에서 다국어로 실시간 번역을 위해 사용되고 있다.
특히, 이벤트캣은 네이처포럼, 리움미술관 특별행사, 컴업2023, 콘텐츠유니버스코리아 등 다양한 국내외 온오프라인 행사에서 영어, 아랍어, 중국어 등 다양한 언어로 번역하는 서비스를 제공해 참가자들이 언어 장벽을 넘어 행사에 더욱 몰입할 수 있는 환경을 제공한 바 있다.
보도자료 제공: 엑스엘에이트