김승희 ETRI 음성지능연구그룹 책임연구원 인터뷰
"발음 사전에 없으면 단어 인식 어려워... 음성인식, 기술보다 데이터서 승패 갈려"
"정부 긴 안목 투자 덕분에 성공적 개발... 국가·국민에 모든 기술혜택 돌아갔으면"

▲ 김승희 ETRI 책임연구원은 "누가 얼마만큼 양질의 많은 데이터를 보유하느냐가 음성인식 기술의 핵심"이라고 말했다. 사진=홍서윤 기자
“음성인식이나 번역의 접점은 사람이죠. 다른 어떤 것보다 사람을 위한 기술이라고 할 수 있습니다.”

한국전자통신연구원(ETRI)에서 20년째 음성인식을 연구 중인 김승희 책임연구원은 이같이 음성인식기술의 의미를 말했다. 말과 언어는 사람지향적인 것으로서 이를 편하게 활용토록 하는 따뜻한 기술이라는 설명이다.

“우리는 인공지능 쪽에서 빅데이터 안 양질의 정보를 뽑아내는 시도를 하고 있다. 가능하면 많은 사람들이 기술을 이용해 혜택을 입도록 하려면 우리가 하는 역할은 필연적이다. 굉장히 돈이 많은 사람이라면 동시통역사를 상시 고용할 수 있지만 대부분의 사람들은 그런 여유가 없기 때문이다. 기술과 기계가 있다면 상대방의 언어를 하나도 모르는 사람들일지라도 많은 도움을 받을 수 있다.”

음성인식이 되려면 기본적으로 말하려는 단어가 발음사전에 들어가 있어야 한다고 한다. 발음사전은 단어의 소리와 단어를 표현하는 결과물이자 각 단어를 발음기호로 표현한 지식의 덩어리다.

“애초에 발음사전에 등록돼있지 않은 단어를 미등록어라고 하는데 그런 단어는 기본적으로 인식이 안된다. 기본적으로 인식대상 어휘에 속하는 단어에 대해서만 인식한다. 발음사전에 아예 존재자체가 없다고 하면 그 단어는 왜곡될 수 있다. 개발하는 사람이 이 어휘가 많이 쓰인다고 보고 반영하지 않으면 반영이 안된다. 예를 들어 제주도에서 돔베고기라고 얘기해봐야 제대로된 결과가 나오지 않는 것과 같다. 제주도에서는 아무리 많이 썼다고 해도 (발음사전에 등록되지 않아)인식결과에서는 다른 어휘로 나오게 된다”

음성인식은 이제 기술적인 차이보다는 얼마만큼의 데이터를 확보하느냐가 승패를 크게 좌우한다고 한다.

“음성인식은 수많은 데이터를 수집한 뒤 신경망을 훈련시키는 딥러닝(Deep learning) 방식을 적용한다. 딥러닝시대에 와서는 기술알고리즘 공유가 빨라지면서 기술 자체는 크게 차별화가 안된다. 전반적인 성능 기여도를 보면 데이터의 비중이 커졌다. 데이터의 양과 질이 모두 중요하다. 기본적으로 기억이라는 한국어가 있고 이 한국어 문장에 대한 영어 문장이 있고 이것들의 양이 많으면 이를 기반으로 모델을 만들게 된다. 특정 데이터베이스에 자주 등장하는 단어는 번역결과가 양호하나 양이 적다면 이를 벗어나는 패턴이 만들어질 수 있다. 누가 얼마만큼 양질의 많은 데이터를 보유하느냐가 핵심이다.”

ETRI 연구진은 시장 수요에 맞춰 올해 새로운 과제를 시도 중이다.

“우리나라 대학 등에 들어와 교육받는 외국학생들이 늘고 있다. 이들 외국학생에 영어로 유창하게 강의를 하는 교수들도 있지만 간혹 능숙지 못해 강의 질이 떨어지는 경우가 생긴다. 자연히 대학에서 통역 수요가 생기면서 수요제기를 하고 있는 상황이다. 한국어, 중국어, 영어를 기반으로 강연을 실시간으로 통역해주는 과제를 진행 중이다. 지금은 연구단계로 목표를 점진적으로 높여가는 과정이며 올해 안에 단계적으로 시연해볼 계획이다.”기술이 인간통역사를 넘는 데에는 길지 않은 시간이 걸릴 것으로 내다봤다.

“결국 사람능력을 내고 싶어 여러 기법을 도입한 것이 신경망이다. 간단한 수학적 모델을 만들어 나름대로는 굉장히 좋은 성능을 보여왔고 발전했으나 아직은 통역사를 따라가기에 한계가 있다. 인간통역사는 단순히 글자정보뿐 아니라 소리자체에 대한 분위기, 대상 사전지식 등 다양한 정보를 융합해 최적의 결과를 내놓는다. 반면 통역기나 번역기는 글자정보만 이용하고 정보양도 제한적이기 때문이다. 개인적으로는 5년 내에 인간통역사를 뛰어넘는 것은 확실하다고 보여진다. 이 분야 발전속도가 빨라 10년 뒤에는 어떻게 달라질지 예측키 어렵다.”

김 책임연구원은 국가 덕분에 기술개발에 성공했고 모든 혜택이 국가와 국민에게 돌아갔으면 한다고 전했다. “우리가 지니톡이라는 히트상품을 낼 수 있던 것은 국가가 비전을 갖고 밀어준 덕분이다. 기업은 단기 위주 성과가 필요해 성공하지 않을 것 같으면 시도하지 않는다. 우리는 중간에 정체기도 있었고 실패할 가능성도 있었지만 국가가 길게 보고 지원해줘 결실을 이룰 수 있었다. 우리는 국가 덕분에 성공할 수 있었고 우리가 제공하는 기술은 대한민국 안에 있다. 우리의 기술로 대한민국 기업이 국내뿐만 아니라 전세계적으로 돈을 많이 벌었으면 한다. 그 혜택은 직접적이든 간접적이든 대한민국 국민이 받기 때문이다.”

홍서윤 기자 classic@cctoday.co.kr
저작권자 © 충청투데이 무단전재 및 재배포 금지