"내 돈 내고 내 카톡 3자까지 돌려진 셈"…이루다 개발사 사과에 이용자 부글부글

'이루다' 개발사 민감정보 노출 사과…"개인정보 보호 체계 구축해 재발 방지"
실명 유출 인정, 조사 성실히 임할 것…"원하는 이용자는 개인정보 삭제"
이용자들 "카톡 대화는 2인 이상의 대화, 상대방은 모를텐데 계좌정보 등은 어쩌나"
"사과할 게 아니라 데이터 전량 폐기해야"…집단 소송 준비

'AI 이루다' 개발한 스타트업 스캐터랩. 연합뉴스
인공지능(AI) 챗봇 '이루다' 개발사 스캐터랩이 개인정보 유출 의혹에 대해 "정부 조사에 성실히 임하겠다"면서 사과했다. '이루다'를 둘러싼 여러 논란이 불거진 지 닷새 만이다.

개인정보는 비식별화 처리를 주장도 사실이 아닌 것으로 드러난 데다, 민감 정보가 포함된 대화 패턴이 오픈소스 플랫폼을 통해 노출된 사실이 알려지면서 여론이 거세지자 결국 고개를 숙였다.

스캐터랩은 13일 사과문을 배포하면서 "개인정보 처리 관련 관계 기관 조사에 성실하게 임하고 있다. 서비스를 이용해주신 모든 이용자분들께 진심으로 사과드린다"고 밝혔다.


이어 "논란이 되는 모든 사항에 대해 진상조사위원회를 구성해 철저히 조사하는 한편, 외부 전문가를 포함한 상시 개인정보 보호 체계를 구축하고 재발 방지를 위한 강화된 보안 교육을 실시하는 등 노력하겠다"고 강조했다.

그러면서 "이번 사안으로 인해 인공지능 산업계에 계신 여러 동료 기업들, 연구자분들, 파트너들께도 누를 끼치지 않기를 바란다"며 "AI 윤리에 관한 사회적 합의에 부합할 수 있도록 노력하겠다"고 덧붙였다.

실명과 지역명 등으로 추정되는 정보를 비식별화 처리한 대화내용. 연합뉴스
성희롱에 이어 장애인·성소수자 혐오 발언으로 논란이 된 스캐터랩은, 연애 분석 앱 '연애의 과학'으로 이용자 카카오톡 데이터를 수집, 이루다 개발에 활용하는 과정에서 개인정보보호법을 어겼다는 의혹을 받고 있다.

연애의 과학 앱 이용자와 이용자의 연인에게 개인정보 이용·활용 동의를 제대로 받지 않은 점, 데이터를 이루다 재료로 쓰는 과정에 익명화(비식별화)를 제대로 하지 않은 점 등이 핵심이다.

스캐터랩은 연인들 대화 데이터를 사내 메신저에 부적절하게 공유했다는 의혹도 받고 있다. 스캐터랩은 이루다 관련 개발 기록을 오픈소스 공유 플랫폼 '깃허브'에 공유했는데 여기서도 익명화를 제대로 하지 않은 것이다.

100여건의 대화 묶음(개별 문장 환산시 1700여건)이 담긴 해당 데이터셋에선 실명이 20여번 이상 필터링 되지 않고 대화 상대방과 관계가 그대로 나온다. 개인 기저 질환을 유추할 수 있는 대화 내용이나 생활 반경, 직장 관련 정보가 등장하기도 한다.

이 데이터셋은 전날 개발자 커뮤니티에서 논란이 되자 삭제됐다.

인공지능 챗봇 이루다. 이루다 홈페이지 캡처
스캐터랩은 사과문과 함께 배포한 자료에서 "깃허브에 공개한 오픈소스에 내부 테스트 샘플이 포함된 사실이 확인됐다"며 "실명을 자동화 비식별 처리했는데, 필터링 과정에 걸러지지 않은 부분이 일부 존재했다"고 인정했다.

스캐터랩은 "데이터 관리에 신중하지 못했다. 민감할 수 있는 정보가 노출된 점에 진심으로 사과드린다"며 "해당 깃허브 게시물은 즉시 비공개 처리했다. 대화를 나눈 사람들의 관계나 생활 반경이 추정될 여지는 전혀 없다"고 해명했다.

'사내 대화방에서 수집된 대화를 직원들끼리 돌려봤다'는 증언에 대해서는 "스캐터랩 전원이 참여하고 있는 카카오톡 대화 당해년도 단체방에서는 해당 내용이 없음을 확인했다"며 "또 다른 사내 메신저 채널인 슬랙에 대해선 다수 대화 채널이 있는 관계로 현재 조사를 진행 중"이라고 했다.

개인정보 이용 동의를 소홀히 받았다는 의혹에 관해서는 "연애의 과학이 동의를 받은 절차가 법적으로 문제가 없을 것이라고 판단했다"며 "이용자분들과 충분히 소통하지 못한 점은 깊이 반성한다"고 거듭 사과했다.

스캐터랩은 "데이터가 AI에 활용되기를 원하지 않는 분들은 DB에서 삭제하실 수 있다"는 입장이다.

그러나 이용자들은 스캐터랩이 사과할 게 아니라 "카톡 데이터를 전량 파기해야 한다"고 목소리를 높이고 있다.

한 이용자는 "카톡 대화는 2인 이상 대화인데 한쪽의 제공 동의만 받았고 심지어 '가입하면 개인정보 활용에 동의하는 것으로 간주'한다는 방식의 명시적 동의는 개인정보 보호법 위반"이라면서 "빅데이터 개인정보 가이드라인에 따르면 수집할때 비식별화 조치해야되는데 하지않고 저장해 제3자에게 제공까지 했다"고 항의했다.

그는 "제3자에게 제공하려면 개인정보 제공자의 동의를 받아야 하고 왜 제3자에게 줘야하는지 누구에게 주는지를 알려야 한다"면서 "원하는 사람만 삭제해준다는 것은 오히려 비식별 조치하지 않았고 누구의 발화인지 알수있게 저장했다는 말"이라며 덧붙였다.

또다른 이용자는 연과 심리 상담 중에 상대방과의 카톡 빈도 수를 측정 하는 유료 서비스를 언급하며, "문제는 그 안에 상대방과 누가 더 많이 연락 하는지 퍼센테이지를 측정하면서 개인정보는 물론 서로 나눈 19금 대화 등이 있고 결국 이런 대화에서 루다가 학습한 것"이라고 주장했다.

이어 "다시 말해 수십만명이 이용하는 이 어플에 자기 정보가 3 자한테 마구 돌려지고 쓰여졌다는 것은 정말 심각한 문제인데 연과 측에선 우린 이미 개인정보 수집에 동의를 했다 문제 없다 식인건 말도 안된다"고 지적했다.

이외에도 "돈은 돈대로 받고 카톡 상담 문자 내용 분석 한다더니 전부다 개인정보 수집한 셈이다", "상대방은 알지도 못하는데 이건 너무 한거 아니냐", "계좌정보같은 민감정보가 많을텐데 그런 것들 다 어떻게 할 것이냐, 전량 폐기해야 한다"며 비난이 쏟아지고 있다.

연애의 과학 이용자들은 스캐터랩이 개인정보를 유출했다면서 집단소송을 준비 중이다.

한편, 이날 개인정보보호위원회와 한국인터넷진흥원(KISA)은 서울 성동구 스캐터랩 사무실을 방문해 개인정보 유출 의혹에 관한 본격적인 조사에 착수했다.

실시간 랭킹 뉴스