본문 바로가기
기술

오픈AI, 새로운 AI 모델인 GPT-4o 공개 (feat. 영화 Her의 사만다 구현?)

by MINK1016 2024. 5. 16.
반응형

오픈AI, 새로운 AI 모델인 GPT-4o 공개 (feat. 영화 Her의 사만다 구현?)
오픈AI, 새로운 AI 모델인 GPT-4o 공개 (feat. 영화 Her의 사만다 구현?)

 

지난 13일(현지 시각), 챗GPT 개발사 오픈AI가 챗GPT의 신규 버전 ‘GPT-4o’를 공개했습니다. 기존 모델보다 훨씬 더 사람 같아진 모습에 샘 올트먼 오픈AI CEO는 "영화에 나오는 AI 같은 느낌"이라고까지 말했습니다. 텍스트는 기본이고, 사람처럼 시각과 청각을 바탕으로 추론하고 말하는 AI 시대가 열렸다는 말이 나옵니다.

 

1. 게임체인저로 등장한 GPT-4o

1) AI야, 사람이야?

오픈AI의 GPT-4o는 이용자와 실시간 음성 대화가 가능한 AI 모델입니다. 챗봇 형태로 주로 텍스트를 통해 질문과 답변을 주고받았던 기존 모델에서 한층 업그레이드됐습니다. 평균 응답 시간이 약 0.23초로, 인간의 평균 답변 속도(0.32초)와 거의 비슷합니다. 감정을 공유하는 듯한 대화도 가능하고, 수학 문제 풀이와 언어 간 통역도 가능합니다. 작년 11월 공개된 GPT-4 터보보다 속도는 두 배 더 빠르고 비용은 절반 수준에 불과하다고 알려졌습니다.

 

GPT-4o의 'o'는 모든 것이라는 뜻의 '옴니(omni)'에서 따 왔습니다. 텍스트와 오디오, 비디오 AI를 통합한 멀티모달 AI 엔진이자, 모든 데이터를 다룬다는 점을 강조하기 위한 것으로 풀이됩니다.

 

2) 이 정도라고?

공개된 GPT-4o와의 대화는 실제 인간과의 대화와 구분이 안 될 정도입니다. 반려견이 등장하자 이름을 묻고 인간에게 털을 쓰다듬어달라고 요구하거나, '아재 개그'를 비웃고 잠을 재우기 위한 이야기를 들려주기까지 합니다. GPT-4o는 5종류 목소리와 50개 언어를 지원합니다. 한국어와 영어, 영어와 일본어 등 쌍방향 통역이 가능한 언어쌍 역시 2,450개에 달합니다.

 

3) 사용도 편리하게

GPT-4o는 몇 주 내 정식 출시될 예정이지만, 개발자를 위한 API는 발표 당일부터 바로 이용할 수 있습니다. 오픈 AI는 개발자들이 새 모델로 애플리케이션을 구축할 수 있게 한다는 방침입니다. 또, 모든 이용자에게 GPT-4o를 무료로 제공하겠다고도 했습니다. 챗GPT에 로그인한 사람이라면 누구나 무료로 사용할 수 있습니다. 미라 무라티 오픈 AI CTO는 “상호작용과 사용 편의성 측면에서 큰 진전을 이룬 것은 이번이 처음”이라고 말했습니다.

 

API(Application Programming Interface)란 외부 서비스의 기능을 다른 서비스에서도 사용할 수 있도록 정해둔 양식입니다. 날씨 앱을 만든다고 가정하면, 기상청에서 제공하는 API를 활용해 기상청의 날씨 정보를 가져오는 식으로 활용합니다.

 

반응형

2. 폭발적인 반응

1) AGI 시대 시작

과학기술계에선 GPT-4o로 인공일반지능(AGI)이 시작됐다며 환영하는 목소리가 들립니다. 인간과 거의 구별할 수 없는 가상의 사람이 인간처럼 듣고, 보고, 추론하고, 말한다는 점에서 AGI라고 봐도 무방하다는 겁니다. 그동안 AI는 실제 세상 사이와 상호작용에 있어 제약이 있었는데, GPT-4o가 그 한계를 넘었다는 이야기가 나옵니다.

 

인공일반지능(AGI, Artificial General Intelligence)은 인간 또는 인간 이상의 지능을 갖춘 AI를 의미합니다. 인간과 같은 인지능력을 바탕으로 스스로 학습할 수 있다는 특징이 있습니다. 사전에 입력된 정보나 변수 내에서만 작동하는 것을 넘어 자율적인 학습 능력을 통해 제작 당시에는 학습받지 못했던 작업도 수행할 수 있습니다.

 

2) 보여주기에 불과해

그러나 일각에선 실질적인 기능 발전이 없는 '잘 짜인 쇼'에 그쳤다는 비판도 보입니다. 모델 능력이 크게 향상된 게 아닌데도, 다른 빅테크 기업보다 더 큰 주목을 받기 위해 새로운 모델을 먼저 출시하려는 경쟁이 붙었다는 겁니다.

 

728x90

3. GPT4o 공개, 다른 기업 상황은

1) AI 주도권 싸움 격화

오픈AI의 이번 발표에는 구글과의 AI 기술 경쟁에서 한 발 앞서겠다는 의도도 엿보입니다. GPT 4o 공개가 구글의 연례 개발자 콘퍼런스(I/O) 하루 전날 이뤄졌기 때문입니다.

 

2) 구글, “절대 안 밀리지!”

지난 14일(현지 시각) 열린 구글의 I/O에선 제미나이가 도입된 검색 엔진을 비롯해 향상된 AI 기능이 대거 공개됐습니다. 업그레이드된 제미나이1.5 시리즈는 한 번에 처리할 수 있는 정보의 양이 한층 확대될 전망입니다. 구글은 음성 모델 기반의 AI 비서 ‘프로젝트 아스트라(Project Astra)’와 AI 사진 검색 기능인 ‘애스크 포토(Ask Photo)’ 등도 선보였습니다.

 

3) 우리도 낀다

오픈AI와 구글에 이어 애플도 다음 달에 세계개발자회의(WWDC)를 열고 AI 전략을 발표할 예정입니다. 애플은 생성형 AI 기능이 탑재된 음성인식 비서 ‘시리’를 공개할 전망이죠. 아마존 역시 다음 달 세계 최대 규모의 AI 모델 출시를 예고했습니다.

 

4) 네카오, 위기감이 커진다

한편, 네이버와 카카오를 포함한 국내 IT 기업의 위기의식은 더욱 고조됩니다. 글로벌 빅테크 기업을 중심으로 빠르게 발전하는 AI 기술력을 따라잡아야 하는 상황입니다. 해외의 한국어 AI 서비스 수준도 높아지면서 AI 기술 경쟁에서 밀릴 수도 있다는 긴장의 끈을 놓을 수 없습니다.


 

 

오픈AI, 음성비서 GPT-4o 공개 (feat. 네이티브 멀티모달)

여러분이 잠든 사이 오늘 새벽 2시, 오픈AI가 ‘봄맞이 업데이트’를 전격 단행했습니다. 챗GPT와 GPT-4.0 모두 업데이트했습니다. 궁금해서 안 볼 수 없었습니다. 오픈AI는 GPT-4라는 대규모 언어 모

mkpark01.tistory.com

 

 

흔들리는 검색 왕국, 구글과 미국 정부의 소송 (feat. 반독점법 위반)

구글이 해마다 애플에 어마어마한 금액을 지급하고 있습니다. 2022년에만 200억 달러(약 27조 3,500억 원)를 애플에 줬다고 합니다. 아이폰의 기본 검색 엔진을 구글로 설정하기 위해서라고 합니다.

mkpark01.tistory.com

 

 

 

인텔로 돌아와 마침내 CEO가 된 겔싱어, 인텔의 부활을 이끌 수 있을까?

1. 한적한 시골마을 ‘농장 소년’으로 보낸 어린 시절인텔의 CEO라면 왠지 모르게 실리콘밸리 같은 기술의 중심지에서 관련 직종에 종사하는 부모의 영향을 받고 자랐을 것 같지만, 겔싱어의 삶

mkpark01.tistory.com

728x90
반응형

댓글