SNS에 나도는 루머 90% 이상 가려낸다

트위터 등 SNS(사회관계망서비스)에 나도는 루머를 가려낼 수 있는 기술이 개발됐다.

KAIST(한국과학기술원)는 문화기술대학원 차미영 교수 연구팀(제1저자 권세정 박사과정)이 빅데이터 분석을 통해 트위터 내에서 광범위하게 퍼지는 정보의 진위를 90% 이상 정확하게 판별할 수 있는 기술을 개발했다고 9일 밝혔다.

차 교수 연구팀은 2006년부터 2009년까지 미국 트위터에서 전파된 정치·연예인·IT·건강 등 분야에 관한 100건 이상의 정보를 수집해 루머와 루머가 아닌 것으로 밝혀진 사실을 반반씩 섞은 뒤 이번에 개발한 방법을 적용해 분석한 결과, 90%의 정확도를 나타냈다.


특히 특정 인물이나 기관을 비방하거나 욕설이 포함된 루머의 경우, 더욱 높은 정확도를 보였다.

연구팀은 'Bigfoot(설인)' 루머를 비루머인 'Summize(서마이즈) 합병' 사례와 비교해 일반 정보가 전파되는 것과는 확연히 구별되는 루머의 전파 특징을 세가지로 분류했다.

우선 루머는 일반 정보와 달리 지속적으로 전파되는 것으로 나타났다.

일반 뉴스는 전파 속도가 한번 정점을 찍고 나면 잠잠해지는 데 반해, 루머는 수년간 지속적으로 언급되는 모습을 보였다.

또 루머가 확산하는 방식이 서로 연관이 없는 임의의 사용자들에 의해 산발적으로 이뤄졌다.

일반 정보는 온라인 내 친구관계를 중심으로 퍼지지만, 루머는 관련되지 않은 개개인이 참여하는 모습을 보였다.

그리고 인지도가 낮은 사용자들에서 시작해 연예인이나 정치인 등 유명인에게로 전파되는 현상이 관찰됐다.

특히 루머는 일반 정보와 달리 진위를 의심·부정·유추하는 심리학적 과정과 연관된 단어, 즉 '아니다, 사실일지는 모르겠지만, 확실치는 않지만, 내 생각에는, 잘 기억나진 않지만' 등의 사용이 월등히 높았다.

연구팀이 루머로 구분한 사례로는 '미국 대선 당시 버락 오바마 대통령 후보가 무슬림이며 반기독교적 성향이 있다', '영화배우 니콜 키드먼이 성전환 수술을 했으며 양성애자이다' 등이 포함됐다.

정보의 전파 초기에는 루머인지 여부를 가리기 어렵지만, 일정시간이 지나 정보 확산이 이뤄지면 빅데이터를 기반으로 해 정보의 진위를 판단하는 것이 가능하다고 연구팀은 전했다.

차미영 교수는 "팔로워가 많거나 영향력 있는 연예인이나 정치인 등 유명인의 경우 명성·신뢰를 잃을 수 있기 때문에 정보의 전파에 신중한 모습을 보이는 반면, 루머의 경우 임의의 사용자들이 책임을 회피하는 서두를 던지며 언급하는 모습을 보였다"면서 "국내 사례에 대해서도 데이터를 얻을 수 있다면 분석이 가능하다"고 말했다.

서울대 및 마이크로소프트 아시아연구소와 공동 수행한 이번 연구는 지난해 12월 미국 텍사스주에서 열린 데이터마이닝 분야 최고 학술대회인 'IEEE 데이터마이닝 국제회의'에서 발표됐다.

실시간 랭킹 뉴스