14일, 온·오프 동시, 고려대 임희석 교수 '딥러닝 기반의 최신 기계번역 연구 동향', 경상국립대 조준형 교수 '번역학에서 바라본 병렬 말뭉치 구축 및 활용의 유용성과 쟁점', 포스텍 김윤수 교수 ‘딥러닝 기반의 최신 기계번역 연구 동향’ 등 의 발표와 토론으로..

행사 이미지
행사 이미지

글로벌 콘텐츠 시장에서 가지는 대한민국의 음악, 영화, 드라마의 영향력은 실로 대단하다. 이제 더 이상 몇 편의 성공작이 아닌 다양한 장르, 대규모 K-콘텐츠가 글로벌 소비자들의 마음을 사로잡고 있다.

이러한 성공은 작품 자체의 완성도가 핵심적 동인이겠으나 언어의 장벽을 극복하게 한 번역도 주효했다. 그러나 급속도로 증가하는 콘텐츠 보급 규모와 보급 속도에 발맞추기 위한 번역 문제를 해결할 수 있는 방법이 필요한데 대규모 한국어-외국어 병렬말뭉치 구축을 통한 자동번역 기술 향상이 그 해답 중 하나라고 할 수 있다.

정치, 경제, 문화 등 다양한 분야에서 통역과 번역에 대한 수요가 그 어느 때보다 증가하고 있으며 이러한 수요에 맞추어 인공지능(AI) 기반 자동번역 기술 또한 나날이 발전하고 있다.

다만 자동번역 기술의 성능은 데이터의 규모와 번역 품질에 좌우되므로 우수한 번역 품질을 기반으로 한 대량의 데이터 구축이 필수적이다. 그러나 한국과 경제, 문화적 교류가 활발한 베트남어, 인도네시아어, 태국어 등의 특수 외국어들은 번역 말뭉치 데이터의 부족으로 자동번역 시 고품질의 번역 결과물을 기대하기 어렵다.

이러한 문제를 극복하기 위해 국립국어원(원장 장소원)은 2021년 8월부터 한국어-외국어 병렬 말뭉치 구축 사업을 추진해 왔다. 2021년 1차 사업에서는 한국어를 8개 언어(베트남어, 인도네시아어, 태국어, 인도 힌디어, 캄보디아어, 필리핀 타갈로그어, 러시아어, 우즈베크어)로 번역한 800만 어절의 병렬 말뭉치를 성공적으로 구축했다.

이는 한국어교육의 발전에 따라 다양한 국가에 한국어를 유창하게 구사할 수 있는 고급 인력이 다수 확보되었기에 가능했다. 이러한 성과에 힘입어 2차 사업에서는 1차 사업보다 구축 데이터의 규모를 확대하여 10,000,000어절의 병렬 말뭉치를 구축하고 있다.

프로그램
프로그램

이 사업의 일환으로 오는 14일 ‘한국어-외국어 병렬 말뭉치 구축의 쟁점과 활용 방안'이라는 주제로 워크숍이 열린다. 국립국어원이 주관하고 '22 한국어-외국어 병렬 말뭉치 구축 사업단(연구책임자 이정희 경희대 교수)이 주최하는 이번 워크숍에서는 관·산·학 전문가들을 초청하여 주제 강연과 주제 토론을 진행한다.

국립국어원 강미영 언어정보과장의 개회사를 시작으로 오전에는 고려대학교 임희석 교수의 '딥러닝 기반의 최신 기계번역 연구 동향', 경상국립대학교 조준형 교수의 '번역학에서 바라본 병렬 말뭉치 구축 및 활용의 유용성과 쟁점', 포스텍 김윤수 교수가 ‘딥러닝 기반의 최신 기계번역 연구 동향’ 등 각각의 주제로 강연 한다.

오후에서는 '한국어-외국어 병렬 말뭉치 구축의 쟁점 및 활용 방안'이란 주제로 연구 책임자 경희대학교 이정희 교수를 좌장으로 고려대학교 송상헌 교수, 솔트룩스이노베이션 김영택 부사장, 시스트란 김유석 대표, 플리토 이정수 대표 등이 패널로 나서 논의하고 향후 관련 산업에 미칠 영향력을 전망한다.

저작권자 © 인공지능신문 무단전재 및 재배포 금지