본문 바로가기
기술

불붙은 이미지 생성형 AI 전쟁 (feat. 춘추전국시대)

by 트렌디한 경제 상식 2024. 8. 22.
반응형

불붙은 이미지 생성형 AI 전쟁 (feat. 춘추전국시대)
불붙은 이미지 생성형 AI 전쟁 (feat. 춘추전국시대)

 

1. 이미지 생성 AI 춘추전국시대

1) 이미지 생성형 AI 열풍

말만 하면 인공지능(AI)이 원하는 이미지를 생성해 주는 시대가 왔습니다. AI 챗봇인 챗GPT의 등장과 함께 AI 산업이 급속도로 발전하며 이미지 생성형 AI 시장의 성장도 빨라졌는데요. 주요 빅테크 기업의 경쟁도 치열합니다.

 

2) 달리(Dall-E)

챗GPT 개발사 오픈AI가 2021년 출시한 이미지 생성 AI로, 다양한 프롬프트(명령)를 입력해 원하는 이미지를 생성할 수 있습니다. 챗GPT와 연결돼 전체 맥락에 대한 이해가 뛰어나다는 장점이 있죠. 특히 지난 15일부터는 챗GPT 유료 이용자만 사용할 수 있던 달리3을 무료 이용자에게도 일부 개방했습니다.

 

3) V6

미드저니의 이미지 생성 AI로, 편집 옵션이 다양해 일러스트레이션과 디자인 분야에 특화돼 있습니다. 하지만 커뮤니티 디스코드(Discord)를 통한 접속만 가능하고 영어에 최적화돼 있다는 단점도 있죠

 

4) 스테이블 디퓨전

스태빌리티 AI의 인공지능 모델로, 달리, 미드저니와 함께 3대 이미지 생성형 AI 모델로 떠오른 스테이블 디퓨전은 커스터마이징이 쉽고, 비용이 저렴하다는 장점이 있습니다.

 

5) 파이어플라이

어도비가 작년 9월 출시한 이미지 생성 AI입니다. 100개 이상의 언어로 텍스트 프롬프트를 지원하는데요. 파이어플라이로 생성한 이미지는 저작권 문제없이 상업적으로도 안전하게 사용할 수 있다는 것이 장점입니다.

 

6) 그록

일론 머스크가 작년 7월 설립한 xAI에서 선보인 AI 챗봇입니다. 이미지 생성 AI가 탑재된 그록-2는 대학원 수준의 과학 지식을 평가하는 GP QA 벤치마크에서 56점을 기록해 챗GPT-4 터보(48점)와 구글의 제미나이 프로5(46.2)보다 높은 수준을 자랑했죠.

 

반응형

2. 머스크의 그록-2, 논란의 중심에 서다

1) 진짜야, 가짜야?

AI의 이미지 생성 능력이 발전하면서 딥페이크로 인한 위협도 늘어납니다. AI 기술을 이용해 이미지나 영상을 합성하는 딥페이크가 오용되며 사회적 문제로 떠오르는데요. 유명인을 합성한 그럴듯한 이미지를 만들어 사회적 혼란을 일으키거나 개인의 명예를 훼손하는 사례가 더 빈번해졌죠.

 

딥페이크란 인공지능의 딥러닝(Deep Learning)과 가짜(Fake)를 합친 단어로, 인공지능을 이용해 사람의 이미지나 영상, 음성 등을 합성하는 기술입니다. 딥페이크가 여러 분야에 악용되면서 부정적인 뉘앙스를 내포한 단어라고 착각할 수 있지만, 딥페이크라는 용어 자체는 가치중립적입니다.

 

3. 딥페이크의 모든 것

1) 논란의 주인공, 그록-2

특히 일론 머스크의 xAI가 출시한 그록-2의 이미지 생성 기능이 출시 초기부터 논란의 중심에 섰습니다. 그록-2에 선정적이거나 혐오 논란을 야기할 수 있는 프롬프트를 입력해도 그대로 이미지를 제작해주기 때문입니다. 머스크가 총기를 난사하고, 트럼프 전 대통령이 9.11 테러를 일으키는 듯한 이미지도 생성돼 인터넷상에서 유포됩니다.

 

2) 머스크, 노린 거야?

그록-2의 가장 큰 특징은 콘텐츠 생성에 있어 제한이 거의 없다는 점입니다. 자체적인 수위 조절이 전혀 되지 않는 셈인데요. 일론 머스크 CEO는 이번 딥페이크 논란이 화두에 오르자, 그록을 “세계에서 가장 재미있는 AI”라고 말해 논란을 키웠죠.

 

728x90

4. '안전한 모델' 만드는 빅테크

1) 안전성 강조하는 구글

딥페이크 관련 안전성 우려가 지속되는 가운데, 구글은 지난 15일 안전성을 강화한 이미지 생성 AI ‘이마젠3’를 출시했습니다. 작년 12월 ‘이마젠2’를 출시한 지 8개월 만인데요. 구글은 이마젠3가 원하는 이미지를 언어로 설명하면 그에 맞는 이미지를 생산하는 텍스트 투 이미지(text-to-image) 생성에서 최고의 성능을 보이는 모델이라 자부했습니다.

 

2) 이번에는 뭐가 다른데?

구글의 이마젠3는 특히 안전성에 초점을 둔 모델입니다. 유해한 이미지 생성은 사전에 차단하고, 유명인의 이미지는 생성 자체가 불가하도록 설정됐죠. 또, 이마젠3로 생성한 이미지에는 디지털 워터마크가 표시되는데요. 이를 통해 실제 이미지로 착각하는 것을 방지해 이미지 오남용을 막을 수 있습니다.

 

3) AI에 요구되는 안전장치

AI의 안전성 논란이 불거지면서, 다른 기업도 하나둘 안전장치를 추가하는 모습입니다. 가령, 달리3는 공인의 이름을 포함해 이미지를 요청하거나 살아있는 예술가의 모습을 모방해 달라고 요청할 경우, 이를 거부하도록 설정돼 있죠.


 

 

UAM 분수령, LA 올림픽때 상용화 목표 (feat. 도심 항공 모빌리티)

2024년 파리 올림픽이 마침내 막을 내렸습니다. 우리나라는 금메달 목표를 5개로 잡았는데요. 선수들이 분투해 역대 최다인 13개를 거머쥐며 당당히 8위를 차지했습니다. 벌써 다음 올림픽을 기대

mkpark01.tistory.com

 

 

메타 Llama 3.1이 가진 진짜 의미 (feat. AI 회사를 만들기 최적의 시기)

1. Llama 3.1의 의미: 수렴하는 기술생각보다 많은 분들이 "왜  Llama 3.5나 4가 아니라 3.1일까?"에 대한 고민을 하지 않으시는 것 같습니다. "3개월 만에 발매되었으니 그런 거 아니야?"라는 것도 합리

mkpark01.tistory.com

 

 

애플AI에 대한 구글의 대응, 시리 vs 제미나이 (feat. 스마트폰 픽셀 9)

여러분이 잠들어 계신 동안 구글이 새로운 스마트폰 픽셀 9를 공개했습니다. 그리고 한층 업그레이드된 스마트폰 AI 비서 제미나이 어시스턴트도 공개. 이는 6월 애플 WWDC에서 공개된 애플인텔리

mkpark01.tistory.com

반응형

댓글