조영주 ETRI 시각지능연구실 연구원

2015년 고흐의 화풍을 사진에 입혀서 새로운 그림으로 만드는 인공지능인 스타일 트랜스퍼(style tranfer)가 세상에 나왔다.

당시 누구나 손쉽게 훌륭한 결과를 얻을 수 있다는 점 덕분에 많은 이들의 관심을 샀고 더 나아가 인공지능이 예술의 분야까지 잠식하게 되는 것이 아니냐는 걱정도 많았다. 그 후 얼마 지나지 않아 사람의 얼굴을 감쪽같이 바꿔치기해 가짜 영상을 만들어 내는 딥페이크(deepfake) 기술이 공개돼 크나큰 충격을 주었다.

딥페이크의 원리는 단순히 영상의 얼굴을 다른 얼굴로 바꿔치기하는 기술에 불과하지만, 딥페이크를 통해 만들어진 영상은 가짜라고 인지하지 못할 정도로 정교했기 때문이다. 이러한 딥페이크는 2차 창작물을 만들어 내기 쉬워졌다. 이로인해 딥페이크 기술을 사용한 영상이 넘쳐나기도 해 불법적인 일에 사용되는 사례가 발생하기도 했다. 딥페이크의 부작용에도 불구하고 기술의 발전은 하루가 다르게 진일보하고 있다. 최근 삼성은 미국 라스베이거스에서 열린 CES 2020(Consumer Electronics Show, 소비자 가전 전시회)에서 인공인간 ‘네온’을 공개했다.

스크린 속에서 진짜 사람처럼 움직이고 행동하는 인공인간 네온은 실제 사람과 매우 흡사하다.

골프 자세를 알려달라고 요구하면 곧바로 골프 치는 자세를 취하는 등 음성으로만 소통하던 기존 AI 스피커를 뛰어넘어 시각적 커뮤니케이션까지 가능함을 보여주었다. 이렇듯 인공지능이 만들어 내는 가짜 영상과 이미지는 우리도 모르게 우리 일상에 깊숙이 스며들고 있다.

시각적으로 표현된 가짜는 우리에게 다가오고 인공지능에 대해 직관적인 생각을 하도록 한다.

그렇다면 진짜 같은 가짜를 만들어 내는 인공지능은 우리에게 어떤 도움을 줄 수 있을까?

엔비디아(NVIDIA)사에서 개발한 이미지 AI인 고갱(GauGAN)은 빈 바탕에 그리고 싶은 풍경의 영역을 지정해주는 것만으로 근사한 그림을 만들어준다. 마치 화가 고갱처럼 말이다. GauGAN을 이용해 디자이너는 많은 노력을 들이지 않고도 빠른 시간 안에 원하는 배경을 만들어 낼 수 있다.

UC버클리 대학에서는 사람의 포즈를 기반으로 인공지능을 학습시켜 어떠한 인물의 행동이 담긴 짧은 동영상만 있으면 해당 인물이 춤을 추는 영상을 만들어 낼 수 있는 기술을 공개하기도 했다.

삼성 스콜코보 AI센터와 스콜코보의 스타트업이 공동연구로 만들어낸 인공지능은 사진 단 한 장으로 말하는 듯한 동영상도 만들어 낼 수 있다. 이러한 기술을 활용하면 고인이 된 가족이 말하고 움직이는 동영상을 만들어 남은 가족들에게 위로의 메시지를 전달할 수도 있을 것이다. 필자가 속한 ETRI 시각지능연구실 또한 인공지능 적대적신경망(Generatve Adversarial Networks, GAN)과 같은 다양한 분야에서 세계적인 기술을 선도하기 위해 연구하고 있다.

2019년에는 얼굴 사진에 영역을 지정하면 포토샵으로 수정한 것과 같은 효과를 얻을 수 있는 기술(SC-FEGAN)을 개발해 공개키도 했다. 앞으로 인공지능이 만들어 내는 가짜는 인간의 인지 수준을 뛰어넘을 정도로 발전해 진짜와 가짜의 구별이 더욱 곤란해질 것이다. 인공지능에 대한 연구는 많은 숙제를 안고 있지만, 다양한 응용 분야에서 생활에 도움을 주는 방향으로 연구를 해나갈 것이며 우리의 연구로 인해 삶이 더욱 빛나기를 소망한다.

저작권자 © 충청투데이 무단전재 및 재배포 금지