1. 구글의 제미니(Gemini) 모델 공개
OpenAI의 GPT-4에 대한 Google DeepMind의 오랫동안 소문이 자자한 대응인 Gemini에 대한 과대광고가 몇 달 동안 쌓여 왔습니다. 오늘 회사가 그동안 비밀리에 진행해 왔던 내용을 드디어 공개했습니다.
Gemini는 Google이 출시한 가장 큰 AI 출시 제품입니다. Google은 AI 패권 경쟁에서 경쟁사인 OpenAI와 Microsoft를 상대하기 위해 노력하고 있습니다. 한 관찰자가 표현한 대로 이 모델은 다양한 기능에 걸쳐 동급 최고의 모델, 즉 "모든 기계"라는 점에 의심의 여지가 없습니다.
Google과 그 모회사인 Alphabet의 CEO인 Sundar Pichai는 “모델은 선천적으로 더 능력이 뛰어납니다.”라고 말하며, “플랫폼이에요. AI는 웹이나 모바일보다 더 큰 플랫폼 변화입니다. 따라서 이는 우리에게 큰 진전을 의미합니다.”라고 덧붙였습니다.
2. 인공지능(AI) 과대광고의 신호
이는 Google에게는 큰 진전이지만 해당 분야 전체에 있어서 반드시 큰 도약은 아닙니다. Google DeepMind는 Gemini가 32개의 표준 성능 측정 항목 중 30개 항목에서 GPT-4를 능가한다고 주장합니다. 그러나 그들 사이의 여백은 얇습니다. Google DeepMind가 한 일은 AI의 현재 최고의 기능을 하나의 강력한 패키지로 통합한 것입니다. 데모를 통해 판단하면 많은 일을 매우 잘 수행하지만 이전에 본 적이 없는 일은 거의 없습니다. 다음으로 큰 일에 대한 모든 소문 속에서 Gemini는 적어도 지금은 우리가 AI 과대광고의 정점에 도달했다는 신호일 수 있습니다.
온라인 검색을 전문으로 하는 워싱턴 대학의 Chirag Shah 교수는 이번 출시를 Apple이 매년 새로운 iPhone을 출시하는 것에 비유합니다. "어쩌면 우리는 이제 다른 한계점에 도달했을 수도 있습니다. 우리가 방금 너무 많은 것을 보았기 때문에 이것이 우리에게 그다지 인상적이지 않은 것 같습니다."라고 그는 말합니다.
GPT-4와 마찬가지로 Gemini는 다중 모드입니다. 즉, 텍스트, 이미지 및 오디오 등 여러 종류의 입력을 처리하도록 훈련되었습니다. 이러한 다양한 형식을 결합하여 집안일부터 대학 수학, 경제에 이르기까지 모든 질문에 답할 수 있습니다.
어제 언론인을 위한 데모에서 Google은 차트의 기존 스크린샷을 찍고 수백 페이지의 연구를 새로운 데이터로 분석한 다음 해당 새로운 정보로 차트를 업데이트하는 Gemini의 능력을 보여주었습니다. 또 다른 예에서 Gemini는 팬에서 요리하는 오믈렛 사진을 보여주고 텍스트가 아닌 음성을 사용하여 오믈렛이 아직 요리되었는지 묻습니다. “계란이 아직 흐르기 때문에 아직 준비가 안 됐어요.”라고 대답합니다.
그러나 대부분의 사람들은 완전한 경험을 기다려야 합니다. 출시된 버전은 Google의 텍스트 기반 검색 챗봇인 Bard의 백엔드입니다. 회사는 이를 통해 더욱 발전된 추론, 계획 및 분석 기능을 제공할 것이라고 밝혔습니다. Gemini의 정식 출시는 앞으로 몇 달에 걸쳐 시차를 두고 진행될 예정입니다. 새로운 Gemini 강화 Bard는 처음에는 EU와 영국을 제외한 170개 이상의 국가에서 영어로 제공될 예정입니다. Bard를 담당하는 Google 부사장인 Sissie Hsiao는 이는 회사가 현지 규제 기관과 참여할 수 있도록 하기 위한 것이라고 말했습니다.
3. 제미니(Gemini)의 종류 및 기능
Gemini는 Ultra, Pro, Nano의 세 가지 크기로 제공됩니다. Ultra는 모든 기능을 갖춘 버전입니다. Pro와 Nano는 더 제한된 컴퓨팅 리소스로 실행되는 애플리케이션에 맞춰져 있습니다. Nano는 Google의 새로운 Pixel 휴대폰과 같은 기기에서 실행되도록 설계되었습니다. 개발자와 기업은 12월 13일부터 Gemini Pro에 액세스 할 수 있습니다. 가장 강력한 모델인 Gemini Ultra는 광범위한 신뢰 및 안전 점검을 거쳐 내년 초에 출시될 것이라고 Google 경영진이 기자들에게 말했습니다.
피차이는 “나는 지금이 모델의 Gemini 시대라고 생각한다”라고 말했다. “이것이 Google DeepMind가 AI를 구축하고 발전시키는 방법입니다. 따라서 이는 항상 우리가 AI 기술을 발전시키는 최전선을 대표할 것입니다.”라고 말했습니다.
4. 제미니(Gemini)의 발전된 성능과 변경된 기능의 척도
OpenAI의 가장 강력한 모델인 GPT-4는 업계의 표준으로 간주됩니다. Google은 Gemini가 OpenAI의 이전 모델인 GPT 3.5보다 성능이 뛰어나다고 자랑했지만, 회사 경영진은 이 모델이 GPT-4를 얼마나 능가하는지에 대한 질문을 피했습니다.
그러나 회사는 특히 MMLU(대규모 다중 작업 언어 이해)라는 벤치마크를 강조합니다. 이는 물리학, 경제 및 사회 과학 분야의 독해력, 대학 수학, 객관식 퀴즈를 포함하여 텍스트 및 이미지와 관련된 작업에서 모델의 성능을 측정하도록 설계된 테스트 세트입니다. 텍스트 전용 질문에서 Gemini는 90%, 인간 전문가는 약 89%의 점수를 얻었다고 Pichai는 말합니다. GPT-4는 이러한 유형의 질문에서 86%의 점수를 받았습니다. 다중 모달 질문에서 Gemini는 59%를 얻었고 GPT-4는 57%를 얻었습니다. Pichai는 "이러한 한계점을 넘은 최초의 모델입니다."라고 말합니다.
벤치마크 데이터 세트에 대한 Gemini의 성능은 매우 인상적이라고 뉴멕시코주 산타페 연구소의 인공지능 연구원인 Melanie Mitchell은 “Gemini가 매우 정교한 AI 시스템이라는 것은 분명합니다.”라고 말했습니다. 그러나 "Gemini가 실제로 GPT-4보다 훨씬 더 능력이 있다는 것은 나에게는 분명하지 않습니다"라고 그녀는 덧붙입니다.
모델이 좋은 벤치마크 점수를 갖고 있지만 훈련 데이터에 무엇이 있는지 모르기 때문에 이 숫자를 해석하는 방법을 알기가 어렵다고 스탠퍼드 기초 모델 연구 센터 소장인 Percy Liang은 말합니다. Mitchell은 또한 Gemini가 이미지와 비디오보다 언어 및 코드 벤치마크에서 훨씬 더 나은 성능을 발휘한다고 지적합니다. “다중 모드 기반 모델은 여전히 많은 작업에 일반적이고 강력하게 유용할 수 있는 방법이 있습니다.”라고 그녀는 말합니다.
인간 테스터의 피드백을 사용하여 Google DeepMind는 Gemini가 사실에 더 정확하고, 요청 시 귀속을 제공하고, 대답할 수 없는 질문에 직면했을 때 말도 안 되는 말을 뱉어내기보다는 방지하도록 훈련했습니다. 회사는 이것이 환각 문제를 완화한다고 주장합니다. 그러나 기본 기술을 근본적으로 점검하지 않으면 대규모 언어 모델이 계속해서 상황을 보완할 것입니다.
전문가들은 Google이 Gemini의 성능을 측정하기 위해 사용하는 벤치마크가 그만큼 많은 통찰력을 제공하는지 불분명하며, 투명성이 없으면 Google의 주장을 확인하기 어렵다고 말합니다. "Google은 Gemini를 다양한 방법으로 사용할 수 있는 범용 모델인 만능 기계로 광고하고 있습니다."라고 워싱턴 대학교 컴퓨터 언어학 교수인 Emily Bender는 말합니다. 그러나 회사는 이러한 다양한 목적으로 사용될 것으로 예상되는 모델을 평가하기 위해 좁은 벤치마크를 사용하고 있습니다. “이는 사실상 철저하게 평가할 수 없다는 것을 의미합니다.”라고 그녀는 말합니다.
궁극적으로 일반 사용자의 경우 경쟁 모델에 비해 점진적인 개선이 큰 차이를 가져오지 않을 수도 있다고 Shah는 말합니다. "사람들이 실제로 '아, 이게 더 낫구나'라고 생각하는 것보다 편의성, 브랜드 인지도, 기존 통합에 관한 것입니다."라고 그는 말합니다.
5. 제미니(Gemini)의 길고 느린 축적
제미니의 자리는 오랫동안 왔습니다. 2023년 4월, Google은 자사의 AI 연구 부서인 Google Brain을 Alphabet의 런던 기반 AI 연구 연구소인 DeepMind와 합병한다고 발표했습니다. 따라서 Google은 3월에 데뷔했으며 ChatGPT 유료 버전의 근간이 되는 OpenAI의 가장 발전된 대규모 언어 모델인 GPT-4에 대한 답변을 개발하는 데 일 년 내내 노력해 왔습니다.
구글은 투자자들에게 자신이 AI 분야의 경쟁자를 따라잡을 수 있다는 것을 보여줘야 한다는 강한 압력을 받아왔습니다. 회사는 수년 동안 강력한 AI 모델을 개발하고 사용해 왔지만 평판 훼손과 안전 문제에 대한 우려로 대중이 사용할 수 있는 도구 출시를 주저해 왔습니다.
Geoffrey Hinton은 "Google은 이 자료를 대중에게 공개하는 데 매우 신중했습니다."라고 말하며, "일어날 수 있는 나쁜 일이 너무 많습니다. Google은 자사의 평판을 망치고 싶지 않았습니다."라고 덧붙이며 4월에 회사를 떠났습니다. 신뢰할 수 없거나 시장성이 없어 보이는 기술에 직면했을 때 Google은 더 큰 위험을 놓칠 때까지 안전하게 대처했습니다.
Google은 결함이 있는 제품 출시가 어떻게 역효과를 낳을 수 있는지 뼈저리게 배웠습니다. 2월에 ChatGPT 경쟁업체인 Bard를 공개했을 때 과학자들은 곧 회사 자체의 챗봇 광고에서 사실 오류를 발견했으며, 이 사건으로 인해 1,000억 달러의 손실이 발생하며, 주가가 떨어졌습니다.
5월에 Google은 이메일에서 생산성 소프트웨어에 이르기까지 대부분의 제품에 생성 AI를 도입한다고 발표했습니다. 그러나 그 결과는 비평가들에게 깊은 인상을 주지 못했습니다. 예를 들어 챗봇은 존재하지 않는 이메일을 언급했습니다.
이것은 대규모 언어 모델에서 일관된 문제입니다. 인간이 작성할 수 있는 것처럼 들리는 텍스트를 생성하는 데 탁월하지만 생성 AI 시스템은 정기적으로 내용을 구성합니다. 그리고 그것이 그들만의 문제는 아닙니다. 또한 해킹하기 쉽고, 편향으로 가득 차 있습니다. 그것들을 사용하는 것은 또한 매우 오염입니다.
Google은 이러한 문제나 환각 문제를 해결하지 못했습니다. 후자의 문제에 대한 해결책은 사람들이 Google 검색을 사용하여 챗봇의 답변을 다시 확인할 수 있도록 하는 도구이지만 이는 온라인 검색 결과 자체의 정확성에 달려 있습니다.
Gemini는 이러한 생성 AI 물결의 정점일 수 있습니다. 그러나 대규모 언어 모델을 기반으로 구축된 AI가 다음에 어디로 갈지는 확실하지 않습니다. 일부 연구자들은 이것이 다음 봉우리의 기슭이 아니라 고원일 수 있다고 믿습니다.
피차이는 단념하지 않습니다. “미래를 보면 헤드룸이 많이 보입니다.”라고 그는 말하며, “저는 복합성이 커질 것이라고 생각합니다. 우리가 이러한 모델에 더 많은 추론을 가르치면 점점 더 큰 발전이 있을 것입니다. 더 깊은 돌파구가 아직 올 것입니다. “전체를 보면 우리가 이제 시작 단계에 있는 것 같은 느낌이 듭니다.”라고 덧붙였습니다.
'기술' 카테고리의 다른 글
PDF를 Excel로 빠르고 쉽게 변환하는 방법 (feat. 컴퓨터 활용의 꿀팁) (53) | 2023.12.15 |
---|---|
와이파이(Wi-Fi)가 작동하지 않을때 문제 해결 방법 (feat. 네트워크 불량) (33) | 2023.12.13 |
대형 언어 모델 (Large language model, LLM)이 헬스케어를 변화시키는 여섯가지 방식 (feat. Nature Medicine) (51) | 2023.12.11 |
2024년 10대 혁신 기술 목록에 넣지 않은 5가지 (feat. MIT Technology Review 발표) (51) | 2023.12.10 |
인공지능(AI) 만능주의의 착각 (feat. 기술의 활용과 배움의 부재) (71) | 2023.12.09 |
댓글