'대깨문'은 가리고 '닭근혜'는 방치
입에 올리기에도 불편한 이같은 단어들은 여야 극단의 진영에서 상대 진영을 폄하하는 대표 용어입니다. 그런데 우리나라의 양대 포털 중 한 곳인 다음(DAUM)에서 한 쪽 진영을 폄하하는 단어는 가리고 다른 한 쪽 진영을 깎아내리는 단어는 방치한다는 자료가 나왔습니다. 국민의힘 박성중 의원의 자료입니다. 박 의원은 여당의 과학방송통신위원회 간사이기도 합니다.
박 의원은 다음 댓글에 '대깨', '이죄명', '수박' 등을 치면 즉시 삭제, 가림 처리되는 것을 알 수 있다고도 했습니다. 대깨문은 '대가리가 깨져도 문재인'의 준 말로, 문 전 대통령 강성 지지 세력을 비하하는 표현입니다. 박 의원은 처음으로 포털이 대깨문과 같은 '정치적 표현'을 AI필터링 기능으로 조처한다는 사실이 밝혀졌다고도 강조했습니다.
그렇다면 이건 어떨까요?
'대깨윤'은 가리고 '문재앙'은 방치
박 의원의 말대로 다음이 정치적 편향성을 갖고 이에 대한 댓글을 필터링 한다면 '대깨윤'은 방치해야 하고 '문재앙'은 가려줘야 합니다. 하지만 실제로는 반대였습니다. 다음의 댓글 서비스가 '타임톡' 시스템으로 개편되면서 댓글은 24시간 후에 사라지지만, 댓글을 쓴 지 몇 분 만에 '대깨윤'은 AI가 가려놨고 몇 분 후에도 '문재앙'은 남겨뒀습니다.
대체 왜 그런 걸까요?
카카오의 입장은 이렇습니다. 동물의 머리를 의미하는 동시에 사람에 대한 비속어로 사용되는 '대가리'가 포함된 '대깨'에 대해 AI가 비속어로 판단했다는 겁니다. 그래서 해당 어휘가 포함된 경우 가리기 대상이 됐다는 설명입니다. 이러한 키워드는 방송통신심의위원회의 '인터넷 내용등급 서비스(세이프넷)'를 준수했고요.
인터넷 내용등급 서비스의 <언어 세부사항>에서 가장 높은 등급인 Level 4를 보면 노골적이고 외설적인 비속어에 해당합니다. 상대의 인격을 모독할 의도가 분명하고 폭력적이라고 느껴지는 비속어가 대상입니다. 카카오 측은 "노골적인 신체 관련 표현 가운데 파생되는 것들을 AI가 학습하는 것"이라고 설명했습니다.
특히 키워드를 분류할 때 정치적 해석을 포함한 어떤 임의적 해석이나 판단을 포함하지 않는다고 강조했습니다. 욕설은 삭제, 비속어가 가림의 기준이 될 뿐이라는 것이죠. 이 때문에 야당을 비하할 때 쓰이는 용어로 주로 쓰이는 '문죄인', '개딸', '찢재명', '이죄명' 등의 키워드 역시 가려지지 않습니다.
네이버의 경우에는 기본적으로 단어나 금칙어 기준으로 댓글을 걸러내지 않는다고 합니다. 'AI 클린 봇' 시스템은 문장의 맥락을 파악해서 필터링 여부를 결정한다고 합니다. 이를테면 '대깨문'만 쳤을 때는 가려지지 않을 수 있지만, '대깨문 죽여버렸으면 좋겠다'라고 했을 때 혐오의 표현이 명백하기 때문에 가려진다는 것이죠.
IT 업계의 고민은 날로 깊어지고 있습니다. 과거 멀쩡한 단어였음에도 시대가 변함에 따라 갑자기 혐오 표현으로 바뀌기도 하고, 그냥 일상에서 썼던 단어였는데도 다른 단어와 합쳐지면서 혐오 표현이 더해지기도 하는 등 상황이 수시로 바뀌어섭니다. 언제부터 어떻게 혐오 표현으로 봐야 할 지도 따져봐야 합니다.
동물로 사람을 비하한 '쥐박이', '닭근혜'나, 과일을 빗댄 표현 '수박' 등이 그런 예일 듯 합니다. 그냥 일상적으로 썼던 말들에 혐오 표현이 덧대어진 경우이지요. 다음 댓글에선 모두 가림 처리가 되지 않습니다. 하지만 박 의원의 자료에는 '이죄명', '수박'도 가림 처리가 된다고 지적했죠. 실제로 써보니 그렇지 않았습니다. 가림 처리가 되지 않았습니다.
다음의 댓글 AI 필터링이 보다 투명하고 정교해져야 한다는 지적은 할 수 있어 보입니다. 하지만 사실이 아닌 내용을 국회의원의 이름으로 자료를 내는데는 더욱 신중할 필요가 있습니다. '가짜뉴스'에 대한 논의가 더욱 활발해지는 이때에 말입니다.