추현곤 한국전자통신연구원(ETRI) 실감미디어연구실장

정보통신기술의 발달과 더불어 다양한 카메라 및 디스플레이가 탑재된 모바일 기기의 성능이 개선되고 있다. 이로써 비디오 데이터가 양산을 점점 가속화되는 상황이다. 이미지 및 비디오 같은 영상 데이터가 전체 인터넷 트래픽의 80% 이상을 넘어선 지 오래 되었으며 그 비중은 해를 거듭할 수로 높아지고 있다.

이와 더불어 영상을 사람이 아닌 딥러닝과 같은 인공지능을 탑재한 기계(머신)이 처리하는 경우도 같이 늘어가고 있다. 머신 비전은 기존에 인간이 눈으로 보고 판단하는 것을 기계(머신)가 가지고 있는 카메라와 같은 하드웨어와 소프트웨어를 통해 대신 처리하는 기술이다. 딥러닝 기술을 이용한 머신 비전의 정확도가 사람이 처리할 수 있는 정확도의 범위를 뛰어넘게 되었다. 이를 바탕으로 기존의 산업 자동화 이외에 자율주행 자동차, 영상 보안 및 안전 등으로 점점 그 응용 대상을 넓혀가고 있다.

최근의 많은 통계에서 인공지능을 이용한 영상의 소비가 사람의 소비를 이미 넘어선 것으로 나타나는 등 이미 기계는 미디어 소비의 큰 주체가 되고 있는 상황이다. 특히 사람과 달리 인공지능이 탑재된 기계는 24시간 365일 쉬지 않고 영상을 소비할 수 있어, 앞으로 점점 더 많은 영상 정보가 기계에 의해 처리가 될 것으로 예상된다. 특히 최근 공개된 생성형 인공지능 기술의 등장은 이제 기계가 미디어를 분석하고 소비하던 입장에서 한발 더 나아가 미디어를 생산할 수 있는 존재로 발전을 거듭하는 상황이다.

이러한 시대적 변화는 시각적 부호화 연구에 있어서 새로운 연구 방향과 접근방식에 영감을 주었다. 기존 비디오 부호화 기술은 사람에게 최상의 영상 품질을 제공하도록 최적화되어 있다. 이는 사람이 아닌 비디오 데이터를 처리하는 기계의 입장에서 볼 때 현재의 비디오 부호화 기술이 최적이 아닐 수 있다는 의미로 해석될 수 있다. 즉 기계 입장에서 최적화된 부호화 기술이 필요함을 의미한다. 정지영상표준(JPEG)과 동영상 및 음성부호화표준(MPEG)을 비롯한 여러 국제 표준화 기구에서 기계를 위한 영상 부호화 기술에 대한 논의를 진행하고 있다. 최근의 비교 실험 결과에서는 기존의 사람을 위한 부호화 기술에 비교하여 약 2배 가까운 효율을 더 높일 수 있다는 실험 결과가 채택되기도 하였다. 또한 최근에는 기계를 위한 오디오 부호화의 기술도 표준화를 위한 논의를 시작하였다.

기계를 위한 미디어 기술은 아직 자율주행차 간 연결이나 보안 감시 네트워크 등을 제한된 기술 분야를 목표로 한다. 하지만, 점점 더 많은 응용으로 확대될 것으로 예상된다. 이를 통해 앞으로의 부호화 시장을 이끌 수 있으리라 본다. 필자도 연구원에서 사람의 개입이 없이 기계간 임무 수행을 위한 영상 처리 및 부호화 핵심기술을 개발 중이다. AI 기반 영상특징 압축하고 부호화 하는 기술 개발과 머신 비전 영상 부호화를 위한 영상 변환, 전·후처리 기술을 연구 개발 중이다.

현재 우리는 사람이 만든 영상을 기계가 분석하고 기계가 만든 영상을 사람이 이용하고 있지만 앞으로는 기계가 영상을 제작하고, 이를 기계가 소비하기를 위한 기술이 곧 나올 것으로 기대한다. 기계를 위한 미디어 기술의 발전으로 사람을 위해 더욱 더 편리하고 안전한 생활이 되기 위해 오늘도 많은 연구진의 노력이 가치있는 것이라고 생각한다. 기계를 위한 미디어 시대가 눈앞에 온 듯 하다.

저작권자 © 충청투데이 무단전재 및 재배포 금지