연합뉴스불과 74억원의 개발비용만을 들여 저비용 고성능 AI모델을 구현해, 미국 인공지능과 반도체 기업들에 충격을 안겼던 중국의 인공지능 스타트업 '딥시크'가 이번에는 지적재산권 침해 논란에 휩싸였다.
미국 오픈AI의 모델을 활용해 이른바 '지식 증류(Knowledge Distillation)'를 했다는 의혹이 제기되고 있는 것이다.
IBM 홈페이지에 따르면 "지식 증류는 사전 학습된 대규모 모델인 '교사 모델'의 학습사항을 더 작은 '학생 모델'로 이전하는 것을 목표하는 머신러닝 기술"이다.
더 작은 '학생 모델'이 '교사 모델'을 모방하도록 학습시키는 것인데, 규모가 작은 중소기업과 연구기관들이 이를 활용하는 경우는 많지만 경쟁 모델을 개발하기 위해 이를 활용하는 것은 오픈AI 약관 위반에 해당한다는 지적이 나오고 있다.
파이낸셜타임즈(FT)는 29일 오픈AI 관계자를 인용해 "지식 증류 과정이 일부 발견됐고, 딥시크가 이를 활용한 것으로 추정된다"고 보도했다.
앞서 블룸버그 통신도 오픈AI 파트너사인 마이크로소프트가 지난해 딥시크가 자사 API 를 사용하는 정황을 파악하고 해당 계정들을 차단한 뒤 조사를 벌이고 있다고 보도했다.
트럼프 행정부에서도 관련 의혹을 적극 제기하고 나서면서 일이 커지는 모양새다.
백악관 AI/가상화폐 정책 총괄(차르)인 데이비드 색스는 미국 폭스뉴스와의 인터뷰에서 "딥시크가 오픈AI 모델에서 지식 증류를 했다는 상당한 증거가 있다며 "향후 몇 달 동안 주요 AI기업들이 이를 방지하기 위한 조치를 취할 것"이라고 말했다.
지식 증류 의혹이 제기되면서 딥시크가 개발비용으로 74억원 수준의 개발비용만 들였다는 발표에 대해서도 의문이 제기되고 있다.
스위스 세인트 갈렌 대학교의 나오미 헤프너 교수는 BBC와의 인터뷰에서 "의혹이 사실이라면 딥시크가 저비용으로 AI모델을 학습시켰다는 주장은 기만"이라며 "그런 저비용으로 학습이 실제로 가능한지는 아직 알 수 없다"고 말했다.
한편, 미국 AI기업들이 중국 AI기업들의 지적재산권 침해 문제를 제기하고 나섰지만 몇몇 언론들은 미국 AI기업들도 언론사 기사나 저명한 작가들의 도서를 무단으로 학습시켜 지적재산권 침해논란에서 자유롭지 못하다고 꼬집기도 했다.