'기계가 무너뜨리는 언어장벽'…AI 번역 대중화 성큼

저가 번역 수요↓·번역업종 재편 전망…공공 데이터 구축 필요성도 제기

▲ (성남=연합뉴스) 김태균 기자 = 경기도 성남시의 네이버 본사에 설치된 AI 번역 서비스 '파파고'의 전시관 모습. 2017.7.18

#1 대학생 김모(21)씨는 수업 과제로 영어 자료가 나오면 사전 대신 번역 사이트를 열어둔다. 문단 여러 개를 단번에 문맥에 맞게 우리말로 바꿔주기 때문에 이해가 빠르다. 김씨는 "사전에서 단어를 일일이 찾아 뜻을 짐작할 필요가 없어졌다"고 했다.

#2 대기업에서 마케팅 업무를 맡는 황모(30·여)씨는 중국 소비자 동향을 전해주는 현지 블로그 몇개를 '즐겨찾기'에 넣고 수시로 자동 번역을 해본다. 황씨는 "불과 1∼2년 전만 해도 '외계어' 번역 결과만 나와 중국어를 배워야 할지 고민했는데 요즘은 번역 품질이 월등히 좋아져 만족스럽다"고 했다.

인공지능(AI) 기반 번역이 빠르게 우리 삶에 들어오고 있다. AI 번역은 AI가 문장의 맥락을 스스로 학습해 뜻을 옮겨주는 만큼 종전의 기계 번역보다 결과가 훨씬 자연스럽다.

작년 11월 구글이 국내에 무료 AI 번역을 선보인 데 이어 19일 네이버도 시범 공개 상태였던 AI 번역 서비스인 '파파고'의 200자 분량 제한을 풀어 구글처럼 긴 글(최대 5천자)을 옮기는 길을 텄다.

AI 번역의 품질은 AI가 양질의 데이터(자료)를 얼마나 많이 학습하느냐에 달렸다. 각종 데이터가 가장 풍부한 양대 검색 사이트인 네이버와 구글이 국내에서 AI 번역 경쟁에 돌입하면서 전반적인 서비스 품질이 올라가고 기계 번역의 대중화가 더 빨라질 것으로 예측된다.

IT(정보기술) 업계에서는 현재 AI 번역의 정확도가 평범한 사람의 80%, 전문 번역가와 비교해서는 60∼70% 수준으로 보고 있다.

인간의 솜씨를 온전히 대체하기에는 실력이 부족하지만, 매우 빠르게 많은 텍스트를 번역할 수 있어 비용·효율 면에서는 이미 사람과 비교가 어렵다.

이 때문에 AI 번역의 보급은 사람이 하는 번역 업무의 성격 자체를 바꿔놓을 것으로 전망된다.

일단 대충 뜻만 통하는 정도로만 번역하는 일은 대부분 AI가 대체할 것으로 보인다. AI가 작업한 '1차 번역'을 두고 오류 여부를 확인하고 의미를 다듬는 역할로 인간 번역가의 업무가 재편될 것이라는 관측도 많다.

익명을 요구한 한 현직 번역가는 연합뉴스와의 전화 통화에서 "올해 초부터 기계로 돌린 것 같은 번역 원고를 갖고 와 감수만 해달라는 의뢰가 늘고 있는 것은 사실"이라며 "굳이 처음부터 끝까지 사람 손을 거칠 필요가 없다는 인식이 조금씩 나타나는 것 같다"고 설명했다.

열악한 국내 번역업의 수준이 AI의 등장에 따라 상승의 계기를 맞을 수 있다는 관측도 있다.

단순 번역을 기계가 빠르게 처리하면서 생산성이 좋아지고, 문화 차이와 맥락까지 외국어로 다듬는 고차원 작업인 '현지화'(localization)에 인력을 집중적으로 투입하는 관행이 나타날 공산이 작지 않다는 것이다.

현지화는 현재도 각국의 종교·역사·문화적 금기에 따라 수출용 콘텐츠를 꼼꼼히 감수해야 하는 게임·웹툰·드라마 업계 등에서 수요가 느는 분야다.

익명의 다른 번역가는 "한국 번역의 고질적 문제는 단가가 낮아 품질 악화가 되풀이된다는 것"이라며 "생산성이 좋아지면 이에 따라 시간당 단가가 오르고 고급 인력을 기용할 여지가 많아질 수 있다"고 설명했다.

AI 번역은 번역 데이터에 대한 새 논의도 촉발할 것으로 보인다.

인터넷 쇼핑몰, 마케팅, 공공 서비스 등 다양한 분야에서 AI 번역의 수요가 치솟지만, 실제 AI 번역을 구현할 '밑천'인 학습 데이터는 부유한 소수 기업이 독식할 공산이 크기 때문이다.

중소기업이나 지방자치단체 등이 고유의 AI 번역 서비스를 개발하지 못하고 대기업 제품에 의존할 수밖에 없게 되면서 데이터에 따른 '빈익빈 부익부' 문제가 나타날 수 있다는 것이다.

현재도 국내외 AI 서비스의 개발은 미국 구글·페이스북·마이크로소프트, 중국 바이두, 한국의 네이버 등 빅데이터(대용량 자료)를 보유한 주요 IT 기업이 장악한 상태다.

이 때문에 학계에서는 정부가 '번역 학습 데이터'를 구축해 무료 개방하는 방안을 추진할 필요가 있다는 제안이 나오고 있다.

한글·영어 번역문 등의 학습 데이터를 모아 공공 자료로 개방하면 그만큼 AI 번역 서비스의 개발·상용화가 활성화해 사회 전체에 이익이라는 설명이다.

숙명여대 곽성희 교수(통번역학)는 "번역 데이터는 AI 시대에 새 고부가가치 자산으로 떠올랐다"며 "예전 공적 기금으로 사전을 편찬했듯 국가가 번역 데이터베이스(DB)를 구축하는 방안을 검토해야 한다"고 강조했다.tae@yna.co.kr

연합뉴스 cctoday@cctoday.co.kr 기자 프로필 보기

상단영역

본문영역

'기계가 무너뜨리는 언어장벽'…AI 번역 대중화 성큼

저가 번역 수요↓·번역업종 재편 전망…공공 데이터 구축 필요성도 제기

기사 댓글 0

비회원 로그인