산업체 ·학계에 10만 문장 유료 배포

한국전자통신연구원(ETRI)은 프랑스어 대화체 음성데이터베이스(DB)를 개발, 음성DB 10만 문장을 산업체와 학계에 유료로 배포한다고 15일 밝혔다.
외국 언어에 대한 음성DB는 최근 스마트폰 등 모바일 기기의 확산 보급과 함께 중요한 원천기술로 각광받고 있다. 음성 리모콘 제조사나 외국어 교육업체, 자동통번역 서비스업체, 자동차·내비게이션 제조사, 포털업체 등 여행·관광·어학 분야 등에 폭넓게 활용되고 있다.

언어음성DB는 크게 음성인식 분야와 언어번역 분야의 소프트웨어로 나뉜다. 이들을 이용해 기업은 태블릿 PC나 내비게이션, 스마트폰, 전자사전, 지능형로봇 분야 등에 활용해왔다. 최근에는 ETRI가 만든 세계 최고 수준의 통번역 앱인 지니톡에도 쓰였다.

이번에 배포하는 프랑스어 DB는 프랑스어 대화체 음성DB와 한국어-프랑스어 대화체 대역문장DB, 남미 스페인어 대화체 음성DB 등 3종의 언어음성DB다. 특정영역 언어음성DB 기획·설계 기술과 언어음성DB 오류검출 기술, 언어음성DB 평가기술 등의 핵심기술로 구축됐다.

그동안 음성DB를 이용한 상용제품들은 국가DB사업에서 구축한 자료를 이용해 국내 기술로 자체 개발한 부분도 있었으나 국내 DB가 없는 경우에는 외국에서 개발한 음성인식·번역 엔진을 탑재해야하는 불편이 있었다. 최근 자동통역서비스 등 자동통역 산업이 확산되는 추세를 고려하면 이 분야의 기술 자립을 위해선 다국어 언어음성DB 구축이 시급했다.

ETRI는 지난 2007년부터 한·영·일·중 등 다국어 언어음성DB를 구축했으며 지난해 프랑스어를 추가했다. 올해에는 독일어를 새롭게 추가하는 한편 러시아어와 아랍어, 베트남어 등도 구축할 계획이다.
ETRI 자동통역연구실 이영직 박사는 “이번에 개발한 프랑스어 음성DB는 가격 면에서 해외DB보다 5~10% 수준으로 중소기업에 제공할 수 있다”며 “DB를 활용하면 언어음성기술의 완성도를 높일 수 있어 신규시장 창출과 국제 경쟁력 강화에 기여할 것으로 기대한다”고 말했다.

유주경 기자 willowind@ggilbo.com

저작권자 © 금강일보 무단전재 및 재배포 금지