김혜진 ETRI 지능제조융합연구실 책임연구원

요즘 주위를 둘러보면 온통 인공지능(AI)이다. TV, 세탁기, 냉장고부터 자동차, 제조산업뿐만 아니라 영화, 게임 등 문화 콘텐츠에 이르기까지 거의 모든 영역에서 AI를 찾아볼 수 있다. 그런데, 재미나게도 우리 곁에 AI가 다가온 것이 그리 오래되지 않았음에 깜짝 놀라게 된다. ‘인공지능과 딥러닝’의 저자인 마쓰오 유타카에 따르면 AI에는 총 3번의 붐이 있었다고 주장한다. 제1차 붐은 1950년대~60년대로, 최초의 컴퓨터 애니악의 탄생 후 10년 뒤, 추론과 탐색으로 AI의 방향성을 제시했다. 두 번째 붐은 1980년대에 등장한 다층신경망 덕분이었다. 인공지능의 대표격인 뉴럴 네트워크가 있었고, 그 초기 버전인 퍼셉트론은 선형 문제만을 풀 수 있었다. 다층신경망은 은닉층을 추가해 비선형 문제도 풀 수 있게 됐다. 그러나, 컴퓨팅 파워의 한계로 추가할 수 있는 은닉층의 개수가 제한됐고 결국 풀 수 있는 문제도 한계가 있을 수밖에 없었다.

필자는 이 두 번째 붐이 끝난 겨울의 시대에 처음 AI를 접하게 됐다. 데이터와 컴퓨팅 파워 부족을 수식과 이론으로 메꾸어 보기 위해 노력하던 시기다. 데이터와 수학이 있다면 어떤 문제든 풀어낼 수 있는 AI의 매력에 푹 빠지게 됐다. 당시, 난제 중 하나였던 칵테일파티는 시끄러운 파티장에서 나와 대화하는 사람의 음성을 잘 들을 수 있는 현상을 구현하는 문제다. 눈에도 보이지 않는 소리의 분포를 컴퓨터에게 데이터로 가르쳐 원하는 소리만 듣게 할 수 있다니! 놀랍지 않은가? 하지만 이 시기에는 데이터와 컴퓨팅 파워의 부족으로 소리를 깔끔히 분리할 수 없었다.

그런데 세 번째 붐을 맞이한 현재의 AI는 이어폰에 탑재된 AI 기능으로 시끄러운 장소에서도 나만의 고요를 얻을 수 있게 됐다. 수천 명의 얼굴 중 내 얼굴만 찾아내고, 고흐의 화풍으로 그림을 그리고, 외국어를 이해할 수 있다. 이뿐만 아니라 인류가 찾아내지 못했던 새로운 물질을 발굴하고, 장인이 찾지 못한 공장 시스템의 문제점을 알아낼 수 있도록 진화해 가고 있다. 이는 컴퓨팅 파워의 도움도 있었지만, 데이터에 대한 인식 변화가 주요했다고 생각한다. SNS상의 이미지 태깅(tagging)의 도움으로 AI 분야 중 영상 분야는 데이터를 제일 쉽게 모을 수 있었고 덕분에 가장 많은 발전을 이룰 수 있었다.

그러나, 데이터 축적의 중요성에 대한 공감대 형성은 현재 진행형이다. 데이터에 대한 인식이 AI와 함께할 우리의 미래를 결정할 것으로 생각한다. 고품질 데이터는 레이블링 작업이 필요해 가격이 비싸다는 단점이 있다. 산업 현장에서는 버리면 됐던 불량품도 데이터화를 위한 추가 작업에 현장 사람들의 저항 또한 만만치 않다. 아울러, 애써 모은 데이터가 쓸모없는 것인 경우도 빈번하다. 이와 함께 다양한 사례의 데이터를 포함해야 데이터 품질이 높아지는데, 서로 다른 기업에서 데이터를 공유하기란 어렵다. 공공 데이터에 대한 수요가 높아지고 있는 이유다.

AI의 미래는 어디까지일지, 얼마나 그 규모가 더 커질지 우리는 아직 모른다. 그러나, 분명한 것은 AI는 과학기술 안에서만이 아니라 일반인들의 데이터에 대한 인식 수준이 높아질수록, 더 좋은 AI 기술을 만들어 질 수 있다는 점이다.

 

저작권자 © 충청투데이 무단전재 및 재배포 금지