지난 22일(현지시간) 미국 코넬 대학 도서관을 통해 공개된 이 논문은 지난 11월 15일 애플이 '대립 훈련을 통한 시뮬레이션 및 자율 이미지 학습(Learning from Simulated and Unsupervised Images through Adversarial Training)'이라는 제목으로 공개형 학술 데이터베이스에 올린 것으로 확인 됐다.
카네기멜론대 교수 출신으로 기계학습 분야의 권위자인 살라쿠디노프가 지난 8월 애플에 합류한 뒤 바로셀로나에서 열린 신경정보처리시스템 컨퍼런스에서 연구결과를 공개하겠다고 발언한 후 3개월 만이다.
논문 내용은 컴퓨터 비전 알고리즘을 합성하거나 컴퓨터 생성 이미지를 사용하여 객체를 인식하도록 교육하는 기술을 설명하고 있다.
실세계 이미지에만 기반한 교육 모델과 비교할 때 합성 데이터를 활용하는 모델은 대개 컴퓨터 생성 이미지에 부호가 지정되기 때문에 보다 효율적이다. 예를 들어 눈이나 손의 합성 이미지에는 주석이 달린 반면, 비슷한 물체를 묘사한 실제 이미지는 알고리즘에 알려주지 않기 때문에 인간이 개입해야 한다.
그러나 애플은 시뮬레이션 된 이미지를 사용하면 컴퓨터 생성 콘텐츠가 정확한 학습 세트를 제공할 만큼 현실적이지 않기 때문에 결과가 만족스럽지 않을 수 있다고 지적한다. 이같은 격차를 줄이기 위해 애플은 '시뮬레이션+자율학습'을 통해 시뮬레이터의 출력을 정제하는 시스템을 제안한다.
실제로 '시뮬레이션+자율학습'은 분류되어있지 않은 실제 이미지 데이터와 주석이 달린 합성 이미지를 결합한다. 이 기술은 생성된 데이터를 실제 데이터에서 더 잘 식별할 수 있도록 서로 다른 두 개의 경쟁 신경 네트워크(생성기 및 식별기)를 적용하는 GAN(Generative Adversarial Networks: 실제 이미지와 합성 이미지를 구분하도록 훈련하고, 이를 바탕으로 실제와 같은 합성 이미지를 재생성하는 기술)에 주로 기반한다.
비교적 최신에 가까운 이 개발 프로세스는 실제 사진과 같은 '초해상도(Super-resolution)' 이미지를 생성하는데 성공했다.
애플은 또, '시뮬레이션+자율학습' 게을 정적인 이미지를 넘어 비디오 입력으로 확장하고 싶다는 바람을 담았다.
이번 논문은 살라쿠디노프 인공지능 연구 책임자 외에 애플의 기계학습 연구원 6명이 공동저자로 참여했다.