노삼열 ETRI 자율형IoT연구실 선임연구원

자율주행 기술은 자동차 산업의 패러다임을 완전히 바꾸고 인간의 생활에도 큰 변화를 가져올 것이다. 자율주행 기술은 차량을 소유하는 시대를 공유하는 시대로 전환시킬 것이고 대부분의 교통사고 원인인 인간의 실수로부터 자유롭게 해 교통사고 수를 현저히 줄일 것이다. 시각장애인과 같이 교통약자의 이동 장벽은 없애고 목적지까지 운전을 대신 해줌으로써 시간 활용에 따른 편의성도 증대시킬 것이다. 아울러 교통체증 완화 및 연료 절감에 따른 에너지 효율을 증대시킬 것이다.

이러한 잠재성과 기대로 인해, 지난 20년간 대학, 연구소, 자동차 제조 회사, ICT 기업 등 많은 연구기관에서 자율주행 자동차 상용화를 목표로 천문학적 금액을 투자하며 연구를 진행해 왔다.

자율주행 기술은 크게 두 가지 방식, 즉 모듈러(Modular) 방식과 종단간(End-to-End) 방식으로 구분돼 연구됐다.

먼저 구글 웨이모를 포함한 대부분의 연구기관에서 채택하고 있는 모듈러 방식은 주로 인식(Perception), 판단(Decision-making), 제어(Control)로 모듈화해 시스템을 개발하는 방식이다. 여기서 각 모듈은 세부 컴포넌트들로 구성되며 각 컴포넌트들은 여러 알고리즘을 포함한다.

이 방식은 주행 가능한 상황을 먼저 정의해 시스템 설계 및 구현하기 때문에 예측 가능한 범위 내에서는 잘 작동하는 반면 예상하지 못한 상황에 직면하는 경우 대처가 어려운 문제점이 있다.

또 시스템 설계의 복잡도, 모듈 간 오류 전파, 시스템 최적화, 시스템 구축의 고비용 등의 한계도 존재한다.

하지만 사고 발생 시 원인 파악이 쉽다는 점에서 많은 연구기관에서 모듈러 방식을 채택해 자율주행 시스템을 개발하고 있다.

그렇다면 미래의 자율주행 기술도 모듈러 방식을 계속 채택해야 할까. 최근 10년간 인공지능 및 딥러닝 기술 발전에 따라, 자율주행 분야에서도 종단간 방식에 대한 연구가 활발히 진행되고 있다.

종단간 방식은 시스템을 모듈화하지 않고 센서 입력부터 제어출력까지 단일 신경망을 통해 시스템을 개발하는 방식을 말한다.

이 방식은 충분한 대규모의 다양한 데이터로 학습이 이뤄지고 제공되는 대규모의 데이터를 소화할 수 있는 큰 신경망으로 구현된다면 아마도 모듈러 방식의 한계를 극복할 수 있을 것으로 예상된다. 특히 필자는 에이전트가 시행착오를 통해 스스로 경험을 쌓아 복잡한 작업을 수행할 수 있는 행동을 자율적으로 학습하는 강화학습 기반 자율주행 기술이 앞으로의 자율주행 기술이 나아가야 할 방향이라고 생각한다. 또 사전에 학습한 지식과 경험을 활용해 새로운 작업을 빠르게 학습할 수 있는 능력을 제공하는 메타 강화학습 방법은 자율주행 자동차가 특정 도시, 특정 시나리오가 아닌 전 세계 어느 도시에서나 활용될 수 있는 능력을 제공할 것으로 예상한다.

최근에는 안전성과 밀접한 관련이 있는 다수의 시행착오를 통해 학습해야 하는 문제를 극복하고자 오프라인 강화학습 연구가 활발히 진행되고 있다. 이는 에이전트가 수많은 시행착오를 직접 수행하지 않고 다른 에이전트 또는 인간이 사전에 쌓은 경험을 토대로 미리 학습하는 방식으로 안전한 강화학습 방법을 제공할 것으로 예상한다. 필자는 강화학습 기반 종단간 방식의 자율주행 기술이 앞으로 나아가야 할 자율주행 기술 방향이라 생각하지만 가까운 미래에는 모듈러 방식과 종단간 방식의 합성된 형태인 하이브리드(hybrid) 방식이 도움이 될 것으로 예상한다.

저작권자 © 충청투데이 무단전재 및 재배포 금지