셀바스 AI 대화형 음성합성 오픈소스 플랫폼
셀바스 AI 대화형 음성합성 오픈소스 플랫폼

[아시아에이=김수빈 기자] 인공지능 전문기업 셀바스 AI가 '로봇의 감정 및 개성을 표현할 수 있는 대화형 음성합성 오픈소스 플랫폼'을 구축했다.

이번 오픈소스 플랫폼은 산업통상자원부 산업기술혁신사업의 일환으로, 한국과학기술원 주관하에 진행된 “음원 다양화를 통하여 로봇의 감정 및 개성을 표현할 수 있는 대화음성합성 원천기술 개발” 국책연구과제의 결과물이다.

개발된 오픈소스 플랫폼은 소스코드 공유사이트 깃허브(GitHub)에 구축되었으며, DNN(Deep Neural Network) 음성합성기 제작에 필요한 음성코퍼스를 비롯하여 로봇에 감정과 개성을 부여하기 위한 Emotional SSML 해석기, 딥러닝 기반 한국어 G2P(Grapheme-To-Phoneme) 변환기, 딥러닝 훈련이 가능한 End-to-End 한국어 음성합성기 및 음색과 감정을 표현할 수 있는 음성합성기가 공개되어 있다. 또한, 가창 기반 음성합성기 연구를 위해 수집한 한국어와 영어 각각 50개로 구성된 어린이 노래 코퍼스도 공개하였다.

해당 오픈소스 플랫폼은 한국과학기술원, 성신여대, 대전대학교, 서강대학교 그리고 ㈜셀바스 AI에서 공동연구한 결과물이다. ㈜셀바스 AI는 연구과제 중 DNN 음성합성기 제작에 필요한 음성코퍼스 설계 및 구축을 담당하여 총 40명의 목소리로 이루어진 24,247개 문장, 34시간 분량의 음성 데이터베이스를 구축하였으며, 감정과 개성 표현을 위한 음성 데이터가 포함되었다.

공개된 음성 데이터베이스는 한국어로는 전 세계에서 가장 많은 양의 음성합성용 데이터를 제공하고 있다.

저작권자 © 아시아에이 무단전재 및 재배포 금지