[금강일보 곽진성 기자] 국내 연구진이 기존의 문어체 언어분석 기술을 고도화시킨 구어체 언어분석 API를 공개했다.

한국전자통신연구원(ETRI)은 지난달 30일 위키백과 및 법령 등 문어체를 주로 이해하는 기존 언어분석 기술을 확장, 사람의 대화 분석오류를 최대 41% 개선, 정확하게 이해할 수 있는 구어체 언어분석 기술을 관련 사이트에 공개했다고 6일 밝혔다.

ETRI에 따르면 개발한 ‘엑소브레인(Exobrain)’은 현재 ‘한컴오피스 2020’에 탑재되는 등 이미 상용화가 이뤄진 인공지능으로 언어분석 기술, 딥러닝 언어모델 기술, 질의응답 기술 등이 적용됐다.

특히 언어분석 API는 지난 2017년 10월 공개 이후, 일 평균 2만 6000건 등 총 2600만 건에 이를 만큼 학계 및 언어처리 분야 연구자들에게 널리 사용되고 있다.

ETRI가 공개한 구어체 언어분석 기술은 크게 형태소분석 기술, 개체명 인식 기술 두 가지이다. ETRI가 공개한 기술은 TTA 표준 가이드라인을 따르며, 형태소 태그는 47개, 개체명 태그는 146개다.

ETRI 연구진은 구어체 언어분석 API와 더불어 기존 대비 성능을 개선한 문어체 언어분석 API도 추가로 공개했다. 추가로 공개된 API는 형태소분석과 개체명 인식 기술이 각각 96.80%, 89.40%의 높은 정확도를 보였다.

임준호 언어지능연구실 박사는 “기존 엑소브레인 언어분석 기술이 백과사전 및 법령을 분석하기 위한 목적으로 개발됐음에도 구어체 분야에 많이 적용되고 있었다. 구어체 언어분석 API 공개로 언어분석의 정확도 및 신뢰도를 제고해 국내 인공지능 시장이 더욱 활성화되길 기대한다”고 말했다.

곽진성 기자 pen@ggilbo.com

저작권자 © 금강일보 무단전재 및 재배포 금지