본문 바로가기
기술

인공지능 에이전트 자비스의 등장 (feat. 앤스로픽)

by 트렌디한 경제 상식 2024. 11. 3.
반응형

인공지능 에이전트 자비스의 등장 (feat. 앤스로픽)
인공지능 에이전트 자비스의 등장 (feat. 앤스로픽)

 

지난주 빅테크 기업들의 잇따른 소형모듈원전(SMR) 계약, 연구개발(R&D) 발표가 이어지더니 이번 주는 ‘AI에이전트’와 관련된 발표가 줄을 이었습니다. 마이크로소프트(MS)에 이어 앤스로픽이 AI 에이전트와 관련된 내용을 발표했거든요. 애플은 아이폰의 AI에이전트인 시리에 챗GPT를 결합한 차세대 AI의 베타 버전을 공개하기도 했습니다.

 

이쯤 되면 빅테크 기업, AI 기업들 사이에 ‘무언의 약속’이 있는 것은 아닐까 하는 생각이 들어요. ‘관심’이 떨어질 때쯤 하나씩 발표하는 것인지, 그게 아니라면 AI 기술 방향이 이렇게 흘러갈 수밖에 없는 것인지 하는 여러 생각이 듭니다. 이번에는 업계에 있는 여러 전문가의 이야기를 토대로 AI 에이전트에 관한 이야기를 정리해 보려 합니다.

 

AI에이전트는 우리를 어떻게 바꿔나갈까요. 징검다리 휴일이 좀처럼 나타나지 않아 한주가 너무도 긴 요즘. 빠르게 시작해 보겠습니다.  

 

1. 자비스가 나타났다

오픈 AI의 경쟁자로 불리는 앤스로픽. 앤스로픽이 22일(현지 시각) ‘사람’을 대신해 컴퓨터 안에서 일을 척척 해결해 주는 AI에이전트를 공개합니다. 일단 개발자를 위한 베타 버전으로 공개했는데요, 유튜브 영상을 통해 공개된 모습을 보면 상당히 흥미로워요.

 

첫 번째 영상입니다. ‘앤트’라는 회사가 ‘벤더 요청’과 관련된 서류 작성을 요청해 왔다고 가정합니다. 이 서류에 넣어야 하는 데이터는 노트북 곳곳에 흩어져 있어요. 앤스로픽의 개발자는 노트북을 연 뒤 클로드에 간단하게 명령어를 입력합니다. “벤더 스프레드시트와 포탈탭의 데이터를 이용해서 서류를 작성해 줘.” AI는 엑셀 파일을 열고 회사 이름에서 ‘앤트’를 찾습니다. 안 나오네요. 곧  CRM에서 회사 이름을 검색합니다. 앤트가 나오네요. 페이지의 스크롤을 내리면서 서류를 채워 나갑니다.

 

Claude | Computer use for automating operations

 

두 번째 영상입니다. 친구가 샌프란시스코로 놀러 옵니다. 노트북을 연 개발자는 명령어를 입력합니다. “친구가 샌프란시스코로 와. 금문교에서 일출을 함께 보고 싶어. 좋은 장소, 운전 시간, 일출 시각을 찾고 달력에 올려줘”라고 명령합니다. AI는 크롬을 열고 구글에 들어간 뒤 검색합니다. 홈페이지를 찾은 뒤 지도를 열고 현재 사용자가 있는 곳에서 얼마나 떨어져 있는지를 확인합니다. 이후 일출 시각을 구글에서 확인하고 이를 토대로 사용자의 달력을 열어 해당 내용을 입력합니다.

Claude | Computer use for orchestrating tasks

 

세 번째 영상은 ‘코딩’입니다. AI에 클로드 홈페이지와 비슷한 스타일을 기반으로 90년대 스타일로 웹페이지를 만들어 달라 요청합니다. AI는 클로드를 열고 홈페이지 제작을 위한 명령어를 입력합니다. 클로드가 알려준 소스를 토대로 홈페이지가 만들어집니다.

Claude | Computer use for coding

 

이날 앤스로픽은 데스크탑 제어가 가능한 API를 공개했는데요, 유튜브를 찾아보니 전 세계 많은 개발자가 이를 이용해 데스크톱을 마음껏 제어하는 영상을 상당수 찾아볼 수 있었습니다. 대부분의 개발자는 “와우!” “놀랍다” 등의 반응을 보이는 듯했습니다.

 

이보다 하루 앞선 21일, MS는 ‘자율 에이전트’를 공개합니다. 특이한 점은 ‘기업용’이라는 단어가 붙은 건데요, 즉 이를 사용하는 기업이 AI에이전트를 ‘알아서’ 제작할 수 있도록 지원한다고 해요. MS 코파일럿 내에서 기업이 원하는 방향으로 AI를 활용할 수 있다는 거죠.

 

MS는 다음 달부터 이를 공개한다고 합니다. MS에 따르면 자율 에이전트는 감독이 없어도 일련의 작업을 수행할 수 있는 작업자 역할을 할 수 있다고 해요. 대규모언어모델(LLM) 기반의 인터페이스를 이용해 ‘챗봇’에서 한 발짝 나아간 기술일 거라고 합니다.

 

이날 MS는 맥킨지에서 개발한 AI에이전트의 사례를 공개했습니다. 맥킨지 상담원은 e메일을 분석해 대화 내용을 파악할 수 있고 답장을 작성해 요약합니다. 그리고 이 과정에서 e메일에 오고 간 내용을 기반으로 다음 단계에 필요한 사람을 스스로 찾아냈다고 해요. 답장도 보냈고요. 아이언맨에 등장하는 ‘자비스’가 정말 구현되려는 것일까요.

 

반응형

2. AI에이전트에 뛰어드는 이유

클로드가 AI에이전트를 공개한 날, 저는 문득 이런 생각이 들었습니다. “이게 구현이 어려운 일이었나?” 지극히 일반인의 시각입니다. 아침에 일어나서 시리나 빅스비에 “오늘 날씨 어때?”를 물어볼 수 있고(꽤 오래전부터), 음성으로 알람을 요청하면 이를 해결해주기도 합니다. “엄마한테 ‘응’이라고 문자 보내”라고 하면 이를 수행했고요. AI스피커는 우리말을 알아듣고 멜론을 가동해 음악을 틀어주기도 합니다.

 

스마트폰이나 노트북에 있는 애플리케이션에 AI가 접근할 수 있는 권한을 주면 해결될 일이 아닐까,라는 생각을 한 거죠. 비전공자인 만큼 이를 확인하기 위해 업계 최고로 불리는 개발자들에게 물었습니다. 답변은 비슷했어요. “어려운 일이야….”라고 말입니다.

 

예전에도 분명 AI라 불리는 비서들이 우리의 일을 해결해 줬습니다. 하지만 내릴 수 있는 명령은 너무 ‘간단’했죠. 시리나 알렉사 등을 불러보신 분들은 아시겠지만 못 알아듣는 경우가 많아요. 잘못된 행동(?)을 하기도 하고요. 알람을 맞춰달라는 명령, 이것보다 한 단계 위로 올라간 질문을 하게 되면 그때부터 AI는 당황해서 아무 일도 못 하게 됩니다.

 

고차원적이고, 한 번 더 생각해야 하고, 사용자의 의도를 파악해야 하는 작업을 ‘기계’에게 구현하는 것은 상당히 어려운 일이었다고 합니다. 심지어 ‘해볼 생각을 할 수 없었지’라는 말씀을 하시는 분들도 계셨고요. 클로드가 선보인 것처럼 데스크톱에서 AI가 커서를 움직이며 자유롭게 여러 일을 수행하는 것도 상당히 난도가 높은 기술이라고 해요. 이러한 것들에 LLM 기술 등이 많은 영향을 미쳤다고 합니다.

 

문득 또 이런 생각이 들었습니다. 빅테크 기업들은 왜 AI 에이전트 구현에 힘을 쓰고 있을까. 크게 두 가지로 나눠서 생각해 볼 수 있을 것 같아요. 첫 번째로 ‘수익’입니다. 오픈 AI는 올해 7조 원의 적자가 예상된다고 합니다. 전 세계 산업을 뜨겁게 달구고 있는 기업입니다. 우리가 사용하는 많은 AI 애플리케이션은 챗GPT에 유료로 돈을 내야 사용이 가능해요. 그런데도 오픈AI는 여태껏 돈을 번 적이 없습니다. AI 인프라에 사용하는 돈이 상당하기 때문이에요. 심지어 오픈AI는 2026년에도 19조 원의 적자가 예상되고 있습니다.

 

비단 오픈 AI뿐만이 아닐 겁니다. GPU를 수천 대 사고, 데이터센터를 짓고, AI가 만들어 낸 ‘쩐의 전쟁’에 뛰어든 빅테크 기업 모두 비슷합니다. ‘수익’은 이들이 하루빨리 이뤄내야 할 숙제입니다. 이러한 상황에서 AI에이전트는 대안이 될 수 있어요.

 

아무리 챗GPT가 좋다고 해도, 클로드를 써보고 깜짝 놀랐다고 해도, 많은 사람이 일상적으로 이를 활용하지는 않아요. 그런데 AI에이전트라면 얘기가 달라집니다. 기업 입장에서는 단순 업무를 최대한 줄이면서 생산성을 높일 수 있을 것이고, 또한 많은 사람이 자신의 스마트폰이나 노트북에 AI에이전트를 설치, 다양한 일을 할 수 있을 테니까요.

 

가령 저는 요즘도 엑셀을 이용한 작업을 자주 하는데요, AI에이전트가 있다면 이러한 일을 하게 시키고 블로그를 쓰는 데 보다 많은 시간을 할애할 수 있을 거예요. 일상생활을 할 때도 마찬가지입니다. 아이들 선물을 사야 한다면 AI에게 맡기는 거죠. “쿠팡과 네이버 쇼핑 등에서 ㅇ살 아이가 좋아할 만한 선물 검색해 줘. 가격대는 ㅇㅇㅇ원에서 ㅇㅇㅇ원 사이로. 이중 후기가 좋은 것을 우선 리스트업 해서 보여줄래?”라고 맡겨 놓고 다른 일을 할 수 있어요.

 

마켓컬리를 이용해 장을 볼 때도, 식당 예약을 할 때도. 사람이 직접 나서서 시간을 써야만 하는 일들을 AI에게 맡길 수 있게 됩니다. 이러한 기술이 바로 우리 곁으로 온다면 쓰지 않을 이유를 찾는 게 어렵지 않을까요. 따라서 LLM 기반의 서비스를 내놓았던 많은 기업은 약속이나 한 듯 AI에이전트로 향해가고 있습니다.

 

다음은 기술 발전 단계입니다. 오픈 AI와 같은 기술기업은 AGI, 즉 범용 AI를 만들기 위해 노력하고 있습니다. 사람과 같은 AI에요. AI가 사람처럼 판단하고 행동하려면 사람과 같은 일을 할 수 있어야 합니다. 지금은 컴퓨터와 스마트폰 안에서 우리에게 ‘제안’하고 ‘알려주고’ 있는데 그치지만 AI에이전트가 된다면 인간이 ‘디지털 공간’에서 하는 일을 AI도 똑같이 할 수 있습니다. 우리가 구매해야 하는 것을 대신 사주고, 돈을 송금할 수 있고, 검색할 수 있어요.

 

또한 이 과정에서 우리에게 새로운 제안을 할 수 있습니다. 가령 “스타벅스 돌체 콜드브루 두 잔과 빵 맛있는 거 배달 주문 넣어줘”라고 했을 때 이용 고객이 많아 배달이 잡히지 않는 경우가 종종 있어요. 이럴 때 AI는 “스타벅스 말고 근처에 있는 투썸플레이스로 배달을 대체할까요?”라고 제안할 수 있을 거예요.

 

오픈AI와 같은 기업은 AI에이전트가 AGI를 향하는 중간단계로 보고 있습니다. 즉 AI 기술개발은 이 단계를 거쳐서 흘러가야 한다는 거죠. 애플의 AI 비서, 시리를 나타내는 이미지가 점점 '뇌'처럼 변하고 있다는 생각, 혹시 안 드셨나요? 전 6월에 공개된 이 이미지를 보고 자비스의 신경망이 떠올랐습니다.

 

인공지능 에이전트 자비스의 등장 (feat. 앤스로픽)
인공지능 에이전트 자비스의 등장 (feat. 앤스로픽)

 

3. 유리한 애플? 부작용은

문득 이런 생각도 들었습니다. AI에이전트가 다양한 일을 하려면 우리가 사용하는 디바이스의 애플리케이션에 모두 접근할 수 있어야 합니다. 그렇다면 디바이스를 보유하고 있는 기업이 AI에이전트 시대에 유리하지 않을까. 많은 전문가가 이러한 말씀을 해주셨어요. ‘애플’이 유리할 수 있다, 라고요. 애플이 지난 6월 발표한 AI 전략의 핵심이 AI에이전트라는 분석도 많습니다.

 

즉 AI 분야에서 애플은 늦었다는 평가가 많았어요. 하지만 결국 AI도 개인화로 가야만 하고, 이러한 상황이라면 전 세계 인구의 절반(과장해서) 가까이 쓰고 있는 ‘아이폰’을 가진 애플은 사실상 유리한 고지에 이미 올라 있었다고 볼 수도 있습니다. 지난 6월 애플이 개발자대회에서 발표한 에이전트용 API가 모두 AI에이전트 시대를 바라본 것이라고도 하고요. 시리가 요청하면 애플리케이션이 특정 데이터를 돌려보내는 API를 추가했는데, 이는 사실상 애플이 AI에이전트를 대비하고 있음을 보여줍니다.

 

24일 목요일 오전, 마침 애플은 시리에 챗GPT를 통합하는 버전을 테스트 중이며 iOS 18.1의 일부로 출시할 예정이라고 발표했어요. 그렇다면 갤럭시로 스마트폰 시장을 양분하는 삼성은 과연 어떤 전략을 보여줄지 기대됩니다. 애플이 제시하는 AI에이전트와 맞먹는, 기술을 선보일 수 있을까요.

 

AI에이전트, 장점만 있는 것은 아닙니다. AI에이전트의 활동을 듣는 순간 아마 많은 분이 문제점을 떠올리셨을 거예요. 바로 ‘해킹’이죠. 내가 승인해서 내 컴퓨터와 스마트폰을 마음껏 돌아다니고 있는 AI가 해킹당한다면 어떻게 될까요. 나 대신에 송금도 하고 결제도 하는 상황에서 이러한 권한을 빼앗기게 되면 큰일이 발생할 수 있습니다.

 

개인 정보도 문제예요. 내가 어디에 가고, 무엇을 사고, 어떤 것을 검색했고, 어떤 앱을 즐겨 쓰고. AI에이전트 시대가 온다면 이러한 모든 정보가 한 곳으로 모일 수 있고, 이는 곧 취약한 부분으로 주목받습니다. AI모델에 대한 취약성은 여전히 보고되고 있는데요, 아무리 보안을 강화하고 부작용에 대응해도 AI에 너무 많은 권한을 준다면 문제가 발생할 수 있습니다.

 

인공지능 에이전트 자비스의 등장 (feat. 앤스로픽)
인공지능 에이전트 자비스의 등장 (feat. 앤스로픽)

 

저는 마블 영화를 좋아합니다. AI 에이전트를 쓰면서 자연스럽게 ‘자비스’가 떠올랐어요. 아이언맨의 비서인 자비스는 토니 스타크가 주문하는 모든 명령을 소화해 냅니다. 자비스가 다른 AI와 다른 점을 확인할 수 있었던 부분이 있어요. 이전에 AGI를 언급하면서 인용했던 장면이에요. 어벤저스 1에서 스타크에게 말을 거는 자비스였어요.

 

핵폭탄을 들고 우주로 날아가 지구를 침공한 외계인의 심장부에 핵폭탄을 던지려는 그때. 스타크는 자기 삶이 여기서 끝날 것이라고 생각합니다. 이 상황을 인지한 자비스는 스타크에게 말해요. “포츠에게 연락할까요?” 챗GPT나 클로드가 우리의 질문에, 우리의 명령에 응답한다면 AI에이전트는 그 명령을 디지털 공간에서 수행해 냅니다. 아직 초기 단계라고 하지만 이 정도 기술 수준이면 내년, 혹은 내 후년에는 관련 기술이 폭발하듯 쏟아질 것 같아요.

 

그렇게 되면 삶의 마지막 순간, 스타크가 보고 싶어 할 사람을 인지해 전화를 연결해 주는 자비스와 같은 AI 에이전트의 등장도 머지않았다는 생각이 듭니다. 누구나 AI에이전트를 손에 들고 다니는 시대. 우리의 삶은 어떻게 변할까요. 그때까지 새로운 기술들을 두려워말고, 호기심과 함께 경험해 보시기를 추천해 드려요.


 

 

카카오의 생성형 AI의 차별점과 시장의 반응

1. 카카오의 생성형 AI, 뭐가 다른가요?얼마 전인 22일 열렸던 카카오의 개발자 컨퍼런스 ‘이프카카오(if kakao AI 2024)’의 핵심 주제는 ‘생성형 AI’였습니다. 정신아 카카오 대표는 “카카오만이

mkpark01.tistory.com

 

 

가장 치열한 AI 경쟁이 이뤄지는 곳 (feat. 줌토피아 2024)

안녕하세요? 혹시 ‘줌’이라는 회사를 알고 계시나요? 화상회의 서비스를 제공하는 ‘줌’은 지난 코비드 기간 비대면이 확산되면서 큰 관심과 함께 상장한 회사입니다. 한때는 시가총액이 500

mkpark01.tistory.com

 

 

원조 AI 강자 구글, AI 경쟁에서 밀리는 이유 (feat. 구글의 다양한 전략)

구글은 2000년대 초반부터 검색 엔진에 AI를 적용해 온 원조 AI 강자입니다. 하지만, 챗GPT의 폭발적인 성장에 맥을 못 추는데요. 얼마 전, 새로운 AI 모델 ‘제미나이’를 공개했지만, 업계 1위 오픈

mkpark01.tistory.com

반응형

댓글