배유석 ETRI 시각지능연구실 책임연구원

ETRI 연구원으로 생활한 지 벌써 25년이 지나고 있다. 그동안 다양한 연구 분야에서 많은 과제를 수행해왔다. 현재 필자가 수행 중인 과제는 10년이라는 장기적인 목표 아래 딥뷰(DeepView)라 불리는 과제를 추진하고 있다.

기존 연구들이 보통 3년에서 5년의 단기 과제로 과제가 종료될 때마다 새로운 과제를 수주하는 어려움이 있다. 하지만 장기과제인 딥뷰에 연구원으로 필자가 참여하니 주변에서 10년 동안 과제 걱정 안해도 되겠다는 부러움을 받곤 했다. 그런데 세월이 흘러 벌써 딥뷰는 8년차에 들어가고 있다. 이제 남은 기간은 2년 남짓. 딥뷰가 다루는 영상 분야는 구글, 페이스북 등 글로벌 대기업이 대규모 자본을 바탕으로 기술을 주도하고 있고 기술의 변화도 워낙 빠르다 보니 하루가 다르게 쏟아지는 기술들 속에서 세계 기술과 경쟁하면서 우리만의 핵심 원천기술을 확보하고 기술을 주도하기 위해서는 많은 시간과 노력이 들어간다.

인공지능 분야에서 기계가 사람의 시각 인지능력 수준으로 영상의 내용을 이해하기 위해서는 사물을 인식하고 사람의 행동을 정밀하게 이해하는 시각지능 핵심 원천기술을 확보하는 것이 매우 중요하다. 딥뷰는 대규모 영상 데이터를 사람 수준으로 처리할 수 있는 대규모 기계학습 기술과 사람의 행동을 정밀하게 이해하는 시각지능 핵심 원천기술을 확보하고 다양한 실세계 적용 사례들을 통해서 인공지능의 응용을 넓혀나가는 연구를 추진하고 있다.

딥뷰는 2017년 컴퓨터비전 분야 세계 최고의 국제영상인식대회인 이미지넷 챌린지 대회에서 전 세계 우수한 팀들과 겨루어 사물 종류별 검출 성능 세계 2위를 달성했다. 당시 연구진들은 우수한 성과를 도출하기 위해 머리를 맞대고 미국 기준 제출 마감 시한을 한국시간으로 맞춰 놓고 1%라도 더 높은 결과를 제출하기 위해 며칠 밤을 꼬박 새워가면서 실험하고 마지막 결과를 취합해 제출했던 기억이 난다. 좋은 결과가 나와 컴퓨터비전 분야 최고학회인 CVPR의 이미지넷 챌린지 워크숍에 초대돼 성과 발표 때 많은 연구진들이 자부심을 느꼈고 자랑스러워했다. 연구진으로서 그동안 힘든 과정을 보상받는 것 같았다.

영상 분야에서 현재 많이 사용되고 있는 딥러닝이라는 기술은 고성능의 GPU 하드웨어 프로세서뿐만 아니라 대용량의 학습 데이터가 있어야 좋은 결과를 낼 수 있다. 딥뷰도 그동안 학습한 데이터를 일반에 공개하는 등 시각지능 분야 산업 생태계 활성화에 힘쓰고 있다.

또한 연구 성과를 공공분야 사회문제 해결에도 적용 중이다. 연구진은 대전시와 함께 인공지능 기반 대규모 CCTV 영상분석 실증 연구를 통해 100채널의 CCTV 영상을 동시에 분석하는 기술을 개발했다. 올해는 사람의 상태를 정밀하게 이해해 CCTV 영상에서 쓰러지는 사람을 실시간 탐지할 수 있는 기술을 대전시에 적용 중이다. 도심의 안전사고를 예방하는 기술이다. 본 기술은 현재 대전시 스마트도시통합센터에 설치돼 사람 대신 인공지능이 자동으로 사람의 위험 상황을 알아채 관제 사각지대를 하나씩 해결하고 있다. 이러한 연구진의 노력은 국가연구개발우수성과 100선, 연구원 대표성과 대상 수상 등으로 이어졌다.

필자가 연구 중인 딥뷰는 이처럼 안전한 사회를 만들기 위해 노력 중이라는 점에서 연구자로서 뿌듯하다.

지금보다 더욱 향상된 시각지능 개발로 우리 생활 주변의 문제해결에 적극 기여하고 싶다.

저작권자 © 충청투데이 무단전재 및 재배포 금지