촬영 영상을 중앙 관제센터에서 사각 인공지능 딥뷰(DeepView)를 활용해 실시간으로 자동 분석하면 주취자와 노숙자 등을 탐색해 관제 요원에게 알림을 제공하는 기술이다.
17일 한국전자통신연구원(ETRI)과 대전시에 따르면 CCTV 영상 속 사람의 18가지 관절 포인트와 6가지 자세 정보 등을 종합해 행동을 정확하게 인식하는 딥뷰 기술을 연말까지 시범 운영하고 내년부터 본격적으로 운영할 계획이다.
서 있는 사람에 비해 비정형 자세의 사람, 즉 웅크리거나 쓰러진 사람은 잘 탐지하지 못하는 등 미탐지가 많았던 기존 행동인식 기술의 단점을 보완하며 연구진은 비정형 자세 인식률을 획기적으로 개선해 탐지 시간을 단축했다.
사람 영역과 세부 관절 위치, 자세 데이터를 동시에 활용해 행동을 정확하게 인식하는 것이 핵심이라고 ETRI는 설명했다. 단계별로 행동을 인식하는 것이 아니라 여러 판단 요소를 동시에 고려하는 모델을 통해 실제로 특정 영역에서 사람이 쓰러졌는지 아닌지 등을 자동으로 검출하는 식이다.
연구진은 자체적으로 구축한 5만5천여 건의 사람을 포함하는 이미지 데이터와 9만여 건의 사람 영역, 세부 관절 위치, 자세로 구성된 고품질 데이터세트를 딥러닝 학습에 함께 활용해 정확도를 높였다.
딥뷰는 CCTV 영상 관제 시스템과 연동해 쓰러진 사람을 실시간으로 탐지해 관제센터에 알린다. 기술을 본격적으로 적용하면 광역 감시를 통해 CCTV 관제 사각지대를 해소하고 112나 119 등과 연계해 사고의 신속한 대응이 가능할 전망이다.
지난 6월부터 기술에 대한 실증을 수행 중인 ETRI와 대전시는 내년부터 유흥주점과 보행 수요가 많은 곳을 대상(CCTV 100채널)으로 시범운영을 거친 뒤 향후 확대 적용할 계획이다. 학습데이터 보완을 통해 정확도를 더 높이고 모델 안정화, 채널 확대를 위한 경량화 작업 등도 병행하기로 했다.