'엑사원'으로 구현한 틸다, 첫 공개…스스로 '사고' 가능
엑사원은 세계 최대 수준인 말뭉치 6천억 개 이상, 텍스트와 결합한 고해상도 이미지 2억5천만 장 이상의 데이터를 학습한 초거대 멀티모달 AI다. 멀티모달은 텍스트, 이미지, 영상 등 다양한 영역을 동시에 이해하고 복합적인 결과물을 도출하는 AI 모델이다.
엑사원과 결합한 틸다는 지금까지 나온 가상인간들과 달리 스스로 학습한 뒤 사고하고 판단할 수 있다. 기존에 없는 새로운 창작물을 만들 수 있을 뿐 아니라 인간과 자연스럽게 소통까지 할 수 있다는 점이 특징이다.
LG 관계자는 "초거대 AI가 주로 언어 모델을 기반으로 소설이나 에세이, 칼럼 등 텍스트로 된 콘텐츠 창작을 해왔던 것을 넘어 비전 모델을 통해 시각 분야로 창작의 범위를 확대하고 실제로 활용한 최초의 사례라"라고 밝혔다.
그러면서 "틸다는 입력된 언어의 맥락까지 이해해 기존에 없는 이미지를 창작한다"며 "예술 작품이나 디자인 이미지들을 학습해 유사한 화풍이나 브랜드 디자인 콘텐츠를 만드는 기존 AI들과도 차이가 있다"고 덧붙였다.
틸다, 가상인간 시장 판도 바꿀까
업계는 특히 초거대 AI를 기반으로 한 '틸다'의 등장이 가상인간 시장의 판도를 바꿀 수 있을지 주목하고 있다.지금까지 가상인간 시장은 크게 두 가지 축으로 나뉘어 발전해왔다.
의사소통 능력을 탑재할 수는 있지만, 가상인간 제작 업체들은 가상인간들의 외모를 개선하는데 더 초점을 맞췄다. 의사소통 능력을 구현하려면 시간과 비용이 많이 드는 데다가 엔터테인먼트 분야에서 활동할 때 이런 능력이 그렇게 필수적이지 않았기 때문이다.
또 다른 축은 AI 뱅커 등으로 활약하고 있는 '지능형 AI 휴먼'의 경우다. 사람의 업무를 어느 정도 대체해야 하는 만큼 의사소통 능력을 탑재했다. 그러나 음성인식 수준이 AI 스피커와 같이 초보적인 수준에 머무는 점과 처리할 수 있는 업무가 서류 안내 등 간단한 수준이라는 점이 한계로 지적됐다.
틸다는 자유로운 '의사소통'을 넘어 창작까지 가능하다는 점에서 기존 가상인간들의 한계를 뛰어넘을 수 있다는 평가다.
틸다는 앞으로 LG의 초거대 AI를 메타버스에서 만날 수 있는 매개체 역할을 수행한다. 특히, 환경 문제에 대한 남다른 고민 의식을 가지고 있는 Z세대들과 소통하는 'AI 아티스트'로 활동할 계획이다. 나아가 LG는 제조∙연구∙서비스∙교육∙금융 등 다양한 분야에서 인간을 돕고, 인간과 협력하는 전문가 AI 휴먼을 내놓을 예정이다.
강원대 김상균 산업공학과 교수는 "지금 가상인간은 겉으로는 사람 같지만 실제로 생각하거나 소통할 수 있는 역량은 없다. 그걸 하기 위해서 AI를 붙이는 것"이라며 "초거대 AI를 붙여 여러 개의 데이터를 학습하는 경우, 상담사 등 상업 분야에서 매우 큰 활용도를 낼 수 있을 것으로 본다"고 전망했다.