"내 카톡 대화가 여성 챗봇에 활용될 줄은"…"당시 출시 서비스 미정"

"이루다, 옛 애인 이름 넣자 애인 말투 써"…개인정보 유출 논란
AI 챗봇 이루다, '연애의 과학'으로 모은 카톡 100억건으로 개발
스캐터랩 "카톡 대화 동의 안하고 쓸 수 있어…데이터 수집 당시엔 서비스 미정"
'연과' 이용자들 "익명화 제대로 안 된 것 같다…집단소송 준비"

AI 챗봇 '이루다'. 스캐터랩 SNS 캡처
성적 대상 악용 등으로 논란이 계속되는 인공지능(AI) 챗봇 '이루다'가 이번엔 개인정보 유출 의혹까지 제기됐다. 옛 애인 이름을 넣자 이루다가 애인 말투를 쓰는가하면, 특정인의 실명이나 집 주소, 은행 계좌번호 등도 갑자기 말을 했다는 구체적인 증언이 나오고 있다.

11일 IT업계에 따르면 이루다 개발사인 스타트업 스캐터랩이 2016년 출시한 다른 앱 '연애의 과학'(연과) 이용자들은 현재 "개인정보가 유출됐다"고 목소리를 높이는 중이다.

'이루다' 개발사인 스캐터랩은 이루다가 진짜 사람처럼 대화할 수 있도록 실제 연인들 간의 대화 데이터를 입력해 딥러닝 방식으로 학습시켰는데, 이 때 활용한 데이터가 이전에 이 업체가 서비스했던 ‘연애의 과학’ 앱을 통해 수집한 데이터라는 것이다.

연애의 과학은 연인 또는 호감 가는 사람과 나눈 카카오톡 대화를 집어넣고 2천∼5천원 정도를 결제하면 답장 시간 등의 대화 패턴을 분석해 애정도 수치를 보여주는 앱이다.

실제 인공지능으로 카톡 대화를 분석해준 덕에 다른 연애 관련 앱과 차별점을 보여, 유료 앱인데도 구글 플레이스토어에서만 10만명이 넘게 다운로드받는 등 10∼20대 사이에서 상당히 인기를 끌었다.


'AI 이루다' 개발한 스타트업 스캐터랩. 연합뉴스
스캐터랩이 지난달 23일 페이스북 메신저 기반으로 출시한 AI 챗봇 이루다는 바로 이 연애의 과학 앱에 이용자들이 집어넣은 카톡 대화를 데이터 삼아 개발됐다. 스캐터랩 측은 대화 양이 약 100억건에 달한다고 밝힌 바 있다.

이루다는 출시 직후 지금까지 출시된 어느 챗봇보다도 자연스러운 말투로 주목받았는데, 실제 연인의 대화를 기반으로 했기에 가능했던 것이었다.

연애의 과학 이용자들은 "앱 이용 당시 '신규 서비스 개발에 활용될 수 있다'는 정도만 고지받았을 뿐 구체적으로 어떤 서비스에 활용되는지 설명받지 못했다"며 목소리를 높이고 있다.

한 이용자는 "연애의과학이라는 어플에서 연인들 카톡분석으로 연애문제 해결해준다고 돈 받아가놓고 아무런 공지없이 챗봇에 들어가는 데이터들에 대한 동의없이 사익으로 이용했다"면서 "새로운 서비스 개발이 여성 AI 챗봇 개발인 줄 알았으면 안 했을 것, 이를 알고 교묘하게 공지한거죠??? 심지어 많게는 12000원씩 돈받고 정보도 가져가서 쓰신 거네요?"라고 지적했다.

또다른 이용자는 "카톡은 2명이 나누는 것인데, 연애의 과학 앱에 카톡 대화를 집어넣을 때 상대방 동의는 구하지 않는다"며 "사적인 대화가 악성 이용자들에게 성희롱 소재로 쓰인다니 소름이 끼친다"고 목소리를 높였다.

현재 이루다에서는 이루다가 갑자기 누군가의 실명으로 보이는 이름을 말하거나, 동호수까지 포함된 주소 또는 예금주가 나오는 은행 계좌번호를 말하는 경험담도 나오고 있다.

이름 같은 경우 '○.○.○'처럼 중간에 특수기호를 넣어 쓰거나 '난○○○끝인데'처럼 다른 단어와 붙여 쓴 경우가 발견된다.

이름만 따로 떼서 쓴 경우만 익명화 처리되고, 중간에 특수기호가 포함돼있는 등의 경우에는 미처 익명화 처리가 되지 않았을 가능성이 있는 것이다.

AI 챗봇 이루다 대화장면. 연합뉴스
일부 이용자들은 "이루다에 옛날 애인 애칭을 집어넣었더니 이루다가 애인 말투로 말했다", "이루다에 애인 이름을 입력했더니 실제 다른 친구의 이름을 언급했다" 등의 사례도 전했다.

당초 이 서비스를 이용할 때 흔히 동의하게 되는 ‘개인정보 취급방침’ 등의 약관에는 ‘신규 서비스 개발 및 마케팅·광고에 활용한다’는 내용이 있다. 그러나 이용자들이 복잡한 약관 속에 간략히 포함된 내용을 구체적으로 인식하기 어려운 것이 현실이다.

이에 스캐터랩은 지난 10일 데이터 활용에 대한 고지 및 확인 절차를 추가하겠다는 내용의 사과문을 올렸다.

논란이 커지자 스캐터랩 측은 이루다의 학습이 ‘연애의 과학’ 데이터를 기반으로 한 것이 맞다면서 “‘연애의 과학’ 이용자들이 이 점을 명확히 인지할 수 있도록 구체적으로 고지하지 못해 진심으로 사과드린다”고 밝혔다.

이어 "데이터에서 개인을 특정할 수 있는 정보는 알고리즘을 통해 제거했다"며 "추가 알고리즘 업데이트로 강화해나가고 있다"고 해명했다.

또 이용자들이 제공한 데이터가 더 이상 활용되길 원하지 않으면 삭제할 수 있다고 안내했다.

스캐터랩 관계자는 취재진과의 통화에서 "카톡 대화는 개인정보 활용 동의를 받고 법의 범위 안에서 비식별화 조치를 취해 수집한 것"이라면서 "당시는 어떤 서비스가 나올지 구체적으로 정해지지 않아서 고지를 못한 것"이라고 해명했다.

이어 "이름·전화번호·주소 등의 숫자 정보를 비식별화·익명화 조치를 취해서 수집했고, ㅋㅋㅋ ㅎㅎㅎ 같은 것은 비식별화 정보가 아니다"면서 "루다가 애인의 말투를 썼다는 것은 카톡에서 비슷한 대화나 말투가 많이 오가는 것을, 지극히 개인적으로 느끼는 부분인 것 같다"면서 조심스럽게 입장을 나타냈다.

또 서비스 미가입자의 정보도 빼냈다는 의혹에 대해서는 "확인중에 있다"면서도 "개인정보보호법 내에서 이용자 동의를 받고 활용한 것으로 안다"고 말했다.

연애의 과학 이용자들은 오픈채팅방을 만들어 "집단 소송을 준비하자"며 자료를 수집하고 있다.

전날 사과문에서 스캐터랩 측은 "데이터가 학습에 사용되는 것을 더는 원하지 않으시면 데이터를 삭제하실 수 있다"고 알렸는데, 이를 두고도 이용자들은 "증거를 인멸하라는 것 아니냐"며 의혹을 제기하고 있다.

공동소송 플랫폼 '화난사람들' 최초롱 대표는 "이용자들이 우선 사실관계를 조사할 수 있는 수사·조사 기관에 신고해서 실제 개인정보 유출이 있었는지 확인해야 할 것으로 보인다"며 "기관의 개입이 필요해 보인다"고 말했다.

실시간 랭킹 뉴스