"AI가 AI에게 일 시키는 세상 온다"…앤스로픽·구글도 참전

앤스로픽, 최신 모델 공개 '컴퓨터 유스'
AI가 화면 인지하고 PC 통째로 '제어'
구글도 AI 에이전트 '자비스' 내달 공개
빅테크 '행동하는 AI 비서' 영역 점차 확대

앤스로픽의 '컴퓨터 유스'. 앤스로픽 유튜브 캡처

#1. 사무 업무 자동화
어느 사무실, 직원이 공급업체에 보내야 할 양식 서류를 작성해야 하는데 해당 정보가 컴퓨터 여기저기 흩어져 있는 상태다. 앤스로픽의 인공지능(AI) 모델 '클로드'에게 공급업체가 요청한 양식을 작성해달라는 명령을 내리자, 클로드가 알아서 엑셀 파일에 관련 업체 정보가 있는지 검색했다. 원하는 정보가 없자, 고객관계관리(CRM) 사이트에 들어가서 업체에 대해 검색한 뒤 해당 정보를 찾았다. 정보를 바탕으로 우측 양식에 정보를 자동으로 입력하기 시작했다.

#2. 일정 계획 자동화 

다음 주에 친구가 샌프란시스코에 놀러 온다. 함께 금문교에서 일출을 보기 위한 하이킹 계획을 세워달라고 클로드에게 요청했다. 크롬을 열어 구글 검색을 통해 해당 날짜에 금문교에서 일출 보기 좋은 시간과 정보를 찾아냈다. 구글 지도를 열어 네비게이션 기능을 활용해 현재 있는 위치와 도착 장소의 거리, 소요 시간을 확인했다. 당일 일출 시간과 도착 장소까지 걸리는 시간 등을 고려해 달력에 일정을 추가하고, 당일 날씨는 쌀쌀할 수 있으니 따뜻한 겉옷을 챙기라는 메모까지 남겼다.

#3. 웹사이트 제작 자동화 

클로드에게 90년대 느낌의 재밌는 홈페이지를 만들어 달라고 부탁했다. 스스로 크롬 브라우저를 실행해 클로드 사이트에 접속하더니, 홈페이지를 만들기 위한 코드를 요청하는 명령문을 입력했다. AI가 AI에게 명령한 셈. 출력된 소스코드를 다운 받고, 프로그램을 실행해 다운 받은 폴더에서 해당 파일을 찾고 연다. 코딩하는 것으로 그치지 않고, 자신이 만든 홈페이지에서 에러가 난 부분의 원인까지 파악한 후 다시 제대로 된 홈페이지를 만들어냈다.

미국 AI 스타트업 앤스로픽이 자사의 최신 AI 모델인 '클로드 3.5 소넷'을 기반으로 한 '컴퓨터 유스(Computer Use)'라는 새로운 AI 소프트웨어를 공개하면서 시연한 세 가지 장면이다. 앤스로픽은 챗GPT로 유명한 오픈 AI의 대항마로 꼽힌다.

지금까지 AI가 해당 사이트 내에서만 서비스를 했다면 앤스로픽의 AI는 사용자의 컴퓨터 화면을 인식해 자유롭게 돌아다니면서 종합적인 일을 수행할 수 있다는 점에서 AI의 기술 발전이 급속하게 진행되고 있다는 평가가 나온다.

'한 마디' 하면, 화면 인지하고 PC 통째로 '제어권' 가지고 수행

앤스로픽의 '컴퓨터 유스'는 AI 스스로 화면을 보고 커서를 움직일 뿐 아니라 버튼을 클릭하고 텍스트를 입력하는 등 사람들이 이용하는 방식으로 컴퓨터를 사용할 수 있도록 했다. 단계마다 사용자가 필요한 정보를 찾아 달라고 AI에게 명령을 내려야 했다면, '컴퓨터 유스'는 세부사항을 따로 지시하지 않아도 AI가 스스로 필요한 정보를 결정하고 컴퓨터를 사용해 정보를 취득한 후 정리까지 했다.

기존 AI로 코딩을 짠다고 할 때도 사용자가 챗GPT 사이트에 들어가서 명령문을 입력한 뒤 코딩 소스가 출력되는 수준이었다면, 이번 클로드 신기능은 AI 스스로 사용자의 PC 통째로 제어권을 가지는 모습을 보여줬다. '명령 한 번'에 사용자 컴퓨터에 설치된 다양한 프로그램을 순차적으로 실행해 알아서 웹사이트를 제작한 것이다. 

앤스로픽은 "근본적으로 새로운 것을 시도하고 있다"며 "특정 작업을 돕는 도구를 만드는 대신, AI에 일반적인 컴퓨터 기술을 가르쳐 사람을 위해 설계된 다양한 도구와 소프트웨어 프로그램을 사용할 수 있도록 하고 있다"고 설명했다. 앤스로픽은 해당 기능을 개발자들에게 베타 버전으로 먼저 공개하고, 올해 말 또는 내년 초쯤에 정식 출시하겠다는 계획이다.

구글은 '자비스', MS는 '자율 에이전트'…행동하는 'AI 비서' 대전 

영화 '아이언맨'의 인공지능 비서 '자비스'는 주인공의 모든 명령을 알아듣고 실행해주는 복합지능형 인공지능 비서다. 아이언맨 캡처

구글도 앤스로픽처럼 AI 에이전트 서비스를 이르면 연내 공개할 방침이다. 미국 정보기술 전문매체 디인포메이션에 따르면, 코드명은 영화 '아이언맨'의 주인공 토니 스타크를 보조하는 AI 서비스의 이름을 따 '프로젝트 자비스'로 정했다고 한다. 자비스는 명령에 따라 화면에 있는 내용을 스크린 샷으로 찍어 이미지나 텍스트를 분석하고 동작에 필요한 버튼을 클릭하거나 검색창에 텍스트를 입력할 수 있다. 다만 크롬 브라우저에서만 활용 가능한 것으로 알려졌다.

마이크로소프트(MS)도 21일 스스로 판단해 업무를 처리해 주는 비서 역할을 하는 '자율 에이전트'를 선보였다. 앞서 지난해 11월 MS 창업자 빌 게이츠는 자신의 블로그에 AI 에이전트가 컴퓨터 사용 방식을 근본적으로 혁신할 것이라고 전망한 바 있다. 빌 게이츠는 "AI 에이전트로 인해 앞으로 5년 안에 상황은 완전히 바뀔 것"이라며 "작업마다 다른 앱을 사용할 필요가 없고 하고 싶은 일을 일상 언어로 기기에 말하기만 하면 된다"고 했다.

최근 빅테크들은 '행동하는 AI 비서'의 영역을 점차 확대하고 있는 추세다. 업계는 지금까지의 AI보다 사람들의 실생활에 훨씬 큰 파급력을 불러올 수 있다고 보고 있다. 안성진 카이스트 전산학부 교수는 "챗GPT의 경우 '추천'을 받는 개념이었다면, 행동하는 AI 비서의 단계로 진입했을 경우 사람들에게 미치는 영향력이 훨씬 클 것"이라면서 "이를테면 행동하는 AI 비서에게 뭘 시켰는데 오작동이 나서 중요한 이메일을 지우는 행동 등을 할 수 있다"고 지적했다. 안 교수는 "챗GPT에게 물어본 후 답변이 마음에 들지 않으면 안 쓰면 그만이지만, 행동하는 AI 비서의 오작동은 실질적인 피해를 줄 수도 있다"고 설명했다.

AI 비서의 경쟁이 심화되면서 시장을 선점하기 위한 진검 승부가 펼쳐질 것으로 보인다. 앤스로픽이 아직 시험 버전에 불과한 '컴퓨터 유스'를 서둘러 내놓은 것도 AI 비서 시장을 먼저 차지하기 위한 것으로 풀이된다. 앤스로픽은 컴퓨터 유스에 대해 "아직 실험적 성격이 강해서 오류가 발생하기 쉽다"며 미완성 상태임을 숨기지 않았다. 구글도 다음 달 자비스 공개 계획 역시 변경될 수 있으며, 공개되더라도 실제 이용은 소수의 개발자들에게만 개방될 가능성이 크다고 디 인포메이션은 밝혔다.

실시간 랭킹 뉴스