1. I/O 하루 전 오픈AI 에게 한 방 먹은 구글
I/O는 구글이라는 회사명의 기원이 된 구골(googol : 10의 100승)의 제일 앞 두 숫자 1과 0에서 가져왔다고 합니다. 구글 I/O가 개막하기 하루 전날인 13일 오전 10시. 오픈AI가 최신 모델인 GPT-4o를 유튜브 라이브로 공개했습니다. 누가 봐도 I/O를 앞두고 ‘찬물 끼얹기’가 목적인 것으로 보였습니다. 특히, 오픈AI는 GPT-4o의 여러 기능 중 ‘음성 모드’를 집중적으로 다뤘습니다.
GPT-4o가 사람을 위해서 노래를 불러주거나, 사람의 감정을 이해하는 등 영화 그녀(Her)에서 스칼렛 요한슨이 목소리를 맡은 AI 사만다 같은 높은 수준의 AI였습니다. 그런데 아니나 다를까 다음날 I/O에서도 비슷한 기능인 ‘제미나이 라이브’와 ‘프로젝트 아스트라’가 공개됐습니다. 오픈AI도 진작에 '음성AI'를 준비를 하고 있었는데 구글에서 비슷한 것을 발표할 것을 당연히 알고 이를 미리 터뜨린 것으로 보입니다. 마치 애니메이션 톰과 제리에서 톰을 계속 곤경에 빠트리는 제리처럼 오픈AI는 이번에도 구글에 한 방을 날렸습니다.
2. 오픈AI+마소 vs 구글
지금의 생성형AI 개발 경쟁은 ‘오픈AI+마이크로소프트’연합군과 ‘구글’의 싸움이라고 봐도 될 정도입니다. 전쟁은 2022년 11월 오픈AI가 챗GPT를 내놓으면서 시작됐습니다. 오픈AI의 AI기술이 앞서있다는 사실이 공개된지 얼마 안 돼 마이크로소프트가 빙에 GPT를 적용해서 구글의 최대 비즈니스인 검색서비스에 도전합니다(2023년 2월).
구글이 정신 못 차리는 상황에서 오픈AI는 멀티모달 능력을 갖춘 GPT-4를 공개하면서 한 방 더! 마이크로소프트가 이번에는 오피스 도구에 생성형AI인 코파일럿을 포함시키겠다고 다시 한번 공격했습니다. 구글은 다급하게 챗봇 바드를 공개하면서 “우리도 할 수 있어!”라고 외쳤습니다. 이것이 모두 3월에 벌어진 일입니다.
지난해 5월 I/O는 오픈AI와 MS의 협공에 그로기 상태였던 구글이 전열을 가다듬고 반격을 준비하던 시기였습니다. 이때쯤 구글은 미국(구글 브레인)과 영국(딥마인드)으로 나눠져 있던 AI연구개발 조직을 합쳐서 하나의 통합된 ‘AI’를 만들겠다고 결심한 것 같습니다.
3. 제미나이로 하나된 우리
11월 개발자행사에서 'GPT-4 터보'를 공개한 오픈AI가 ‘샘 올트먼 축출 사태’로 혼돈에 빠져있는 상황에서, 구글은 12월 마침내 ‘제미나이(Gemini)’를 공개합니다. 모든 조직의 역량을 하나로 모으고, 산발적인 브랜드도 하나로 모으고, 멀티모달을 네이티브로 만들어진 최초의 AI. 그것이 제미나이였습니다.
이때쯤 구글은 오픈AI와 비교해 자신의 강점이 무엇인지를 확실히 깨달은 것 같습니다. 오픈AI처럼 작은 기업이 가진 유연성과 속도는 따라갈 수 없지만 ‘대기업’이 가질 수 있는 막강한 강점이 있습니다. 안정적인 현금흐름에서 나오는 자본과 다양한 고객 및 제품이 구글의 강력한 무기입니다.
구글은 차세대 TPU를 계속 개발하면서 인프라 비용을 전체적으로 낮췄고, 이를 통해 AI학습 비용은 물론 고객들에게 제공하는 제미나이 API비용도 낮출 수 있었습니다. 이번 I/O에서 구글은 제미나이 1.5프로의 비용을 절반으로 낮춰서 GPT-4o보다 30% 저렴하다고 합니다. 역시 I/O에서 공개된 제미나이 1.5 플래시는 오픈AI의 가장 저가 모델보다 훨씬 저렴합니다.
구글은 오픈AI의 월 20달러 구독 서비스인 챗GPT 플러스의 경쟁 서비스인 제미나이 어드밴스드를 판매하고 있습니다. 제미나이 서비스에 추가로 저장공간을 2 테라바이트나 제공합니다. 제미나이와 챗GPT의 성능이 똑같다면 저장공간도 제공해 주는 ‘제미나이’가 더 매력적입니다.
4. 제미나이? 넌 이미 늙은나이
그래서 I/O 하루 전 공개된 GPT-4o는 구글 제미나이에 대한 오픈AI의 ‘응답’이라는 생각이 들었습니다. ‘제로’에서부터 GPT-4o를 학습시키면서, 비용을 낮추고 속도를 높였기 때문입니다. 또한, 2월에 텍스트를 비디오로 만들어주는 '소라(Sora)'를 공개한데 이어 5월에는 영화 매력적인 보이스AI를 공개하면서, 자신들이 AI 개발 기술 경쟁을 주도하고 있다는 인식을 대중과 개발자들에게 확실히 남겼습니다.
하지만 구글도 가만있지 않습니다. 구글은 I/O에서 오픈AI와 경쟁 관계의 서비스를 여럿 내놨습니다. 소라의 대항마인 ‘비오’. GPT를 커스텀하는 GPTs와 비슷하게 제미나이를 커스텀하는 ‘Gems’ 등을 공개했습니다. AI 개발자 생태계를 구축해야 하는 두 회사 입장에서는 이런 주도권 싸움이 정말 중요합니다.
5. 김 빠진 아스트라에 스마트글라스를 넣었더니?
오픈AI가 하루 먼저 AI를 공개하면서 구글의 AI어시스턴트는 ‘김 빠진 아스트라’가 돼버렸지만 한 가지는 사람들의 뜨거운 관심을 모았습니다. '프로젝트 아스트라'데모에서 스마트폰으로 AI와 대화를 하고 스마트폰 카메라로 AI에게 영상을 보여줬습니다. 데모에서 사용자가 안경을 쓰면서 분위기가 급변합니다. 이 안경이 그냥 안경이 아닌 ‘스마트글라스’였기 때문입니다. 안경에 달려있는 카메라로 AI가 주변을 보고, 안경에 달려있는 스피커를 통해서 AI와 대화를 하는 것입니다.
많은 사람들이 구글이 ‘글라스’를 다시 만드나?라고 생각할 수밖에 없습니다. 메타 레이밴 스마트글라스에서 알 수 있듯이 스마트글라스는 AI를 탑재시키기 매우 좋은 기기랍니다. 구글은 2023년 삼성전자, 퀄컴과 동맹을 맺고 XR기기를 만들기로 했습니다. 구글은 OS를, 퀄컴은 반도체를, 삼성전자는 제조를 맡는 구조입니다. 이 기기는 비전 프로 같은 MR헤드셋일 수도 있고, AR글라스일 수도 있어요. 다만 무엇이 나올지는 아직 알려져 있지 않습니다.
6. 세르게이 형이 여기서 왜 나와?
사실 스마트글라스는 구글에게 큰 아픔이 있는 기기랍니다. 2013년 창업자 세르게이 브린이 AR기기인 '구글 글라스'를 세상에 공개했습니다. 미래 지향적인 컨셉임에도 불구하고 1500달러의 높은 가격과 사용처가 없다는 한계점 때문에 큰 실패를 하게 되었습니다.
7. 애플과 가까워지는 오픈AI?
사만다를 만들기 위한 과정에서 오픈AI에게는 최대의 약점이 있습니다. 바로 테오의 데이터에 접근이 불가능하다는 것입니다. 영화 '그녀'에서 인간 테오가 AI 사만다와 사랑에 빠질 수 있었던 것은 '사만다'가 그 누구보다 '테오'를 잘 아는 존재였기 때문입니다. 하지만 스마트폰이나 PC 등 하드웨어 기반이 없는 오픈AI는 개인의 정보를 확보하기가 쉽지가 않답니다. 반면 구글은 우리의 이메일부터 캘린더, 비밀번호, 유튜브, 검색까지.. 모든 정보를 갖고 있습니다.
그래서 오픈AI가 애플과 가까워지고 있다는 최근의 기사들은 또 의미심장해 보였습니다. 오픈AI의 챗GPT가 아이폰에 탑재된다는데 어느 정도로 두 회사가 가까워지는 걸까요? 이번 GPT-4o 가 공개되면서 맥 OS용 챗GPT 앱이 처음 공개되었는데 이건 어떤 의미일까요?
애플이 오픈AI를 인수하면 어떨까요? 샘 올트먼이 가장 존경하는 사람이 스티브 잡스였고, 그가 첫 창업한 회사는 아이폰용 앱을 만들었다는 것입니다. 마침 애플이 직접 AI반도체도 만든다는데..?? 샘. 너 AI반도체가 필요하다고 하지 않았어?
8. 사실 오픈AI는 구글의 다크나이트?
지금의 생성형AI 개발 경쟁은 ‘오픈AI+마이크로소프트’연합군과 ‘구글’의 싸움이라고 말씀드렸습니다. 오픈AI와 구글의 발표를 보면서 두 회사가 치고받고 싸우는 가운데 두 회사의 기술력은 지금 로켓처럼 날아가고 있습니다. 오픈AI에게 한 방 먹었다고 구글을 비웃을 수도 있지만, 지금 구글처럼 AI를 여러 서비스에 통합시킨 회사는 별로 없을 것입니다. 만약 오픈AI가 없었다면 구글이 이렇게 빠른 속도로 개발에 성공할 수 있었을까요?
9. 아스트라 너 쫌 대단하다?
구글은 I/O에서 '프로젝트 아스트라'를 직접 체험해 볼 수 있는 부스를 운영했습니다. 저도 들어가서 시연해 봤습니다. 터치스크린에 빨간색 펜으로 '하트'를 그리고 이것이 무엇인지 음성으로 물어보자 쉽게 정답을 말했습니다. 여기에 하트에 금이 가는 표시를 하고 물어보니 Broken Heart의 의미에 대해서도 잘 답했습니다. 또 Broken Heart 가 어떤 감정을 의미하는지에 대해서도 제미나이는 잘 알고 있었습니다.
반응도 매우 빨랐고 음성 인식률도 좋았어요. 다만 아직 영어 성능만 뛰어나고 한국어는 잘 안된다는 설명을 들었습니다. 오픈AI의 'GPT-4o' 보이스 모드처럼 진짜 인간 여성과 대화하는 느낌은 덜 했지만 말을 끊는 것도 가능했고 친근한 대화도 가능했습니다. 오픈AI가 하루 전에 'GPT-4o'를 발표하지만 않았어도 많은 화제를 모을 수 있었을 것 같았습니다.
제한적인 환경에서 이뤄진 데모지만 기술적으로는 사만다를 구현하는 것이 그렇게 어렵지 않겠구나라는 생각이 들었습니다. 하지만 이런 기술을 넘어 AI에게 어떤 업무를 시키거나, 어제의 대화를 기억시켜서 일관성 있는 대화를 하는 것은 조금 시간이 필요할 것 같습니다.
'기술' 카테고리의 다른 글
2024년 최고의 무료 바이러스 백신 소프트웨어 (61) | 2024.06.05 |
---|---|
느린 과학(Slow Science)의 중요성 (feat. 세상에서 가장 느린 피치 드롭 실험) (75) | 2024.06.02 |
앤스로픽의 골든 게이트(Golden Gate) 클라우드 연구 결과 발표 (79) | 2024.05.28 |
미래 인공지능(AI)의 윤리적 이슈 (feat. AGI 패러독스) (76) | 2024.05.28 |
인간 다워지는 인공지능(AI)과 위협을 막으려는 인류 (85) | 2024.05.28 |
댓글