본문 바로가기
기술

사람들의 마음을 사로잡고 있는 OpenAI의 새로운 AI 모델 (feat. Sora)

by MINK1016 2024. 3. 14.
반응형

사람들의 마음을 사로잡고 있는 OpenAI의 새로운 AI 모델 (feat. Sora)
사람들의 마음을 사로잡고 있는 OpenAI의 새로운 AI 모델 (feat. Sora)

 

OpenAI의 AI에 대한 최신 벤처는 지금까지 가장 인상적인 것일 수 있습니다. "Sora"라고 불리는 이 새로운 텍스트-비디오 AI 모델은 테스트할 제한된 수의 사용자에게 방금 문을 열었습니다. 이 회사는 전적으로 AI가 만든 여러 영상을 보여주면서 이를 시작했는데, 최종 결과는 놀라울 정도로 현실적이었습니다.

 

OpenAI는 텍스트 프롬프트를 기반으로 사실적인 장면을 만들 수 있다고 말하면서 Sora를 소개하고 있으며, 웹사이트에 공유된 동영상이 이를 증명합니다. 프롬프트는 설명적이지만 짧습니다. 저는 개인적으로 ChatGPT와 상호 작용하는 데 더 긴 프롬프트를 사용했습니다. 예를 들어, 위에 나온 털북숭이 매머드의 비디오를 생성하기 위해 Sora는 동물, 주변 환경, 카메라 배치를 설명하는 67 단어 프롬프트가 필요했습니다.

 

반응형

OpenAI는 발표문에서 “Sora는 시각적 품질을 유지하고 사용자의 프롬프트를 준수하면서 최대 1분 길이의 비디오를 생성할 수 있습니다.”라고 밝혔습니다. AI는 많은 캐릭터, 풍경, 정확한 동작으로 가득 찬 복잡한 장면을 생성할 수 있습니다. 이를 위해 OpenAI는 Sora가 필요에 따라 줄 사이를 예측하고 읽는다고 말합니다.

 

OpenAI는 “모델은 사용자가 프롬프트에서 요청한 내용뿐만 아니라 그러한 것들이 실제 세계에 어떻게 존재하는지 이해합니다.”라고 말했습니다. 이 모델은 단순히 캐릭터, 의상, 배경을 다루는 것이 아니라 "생생한 감정을 표현하는 매력적인 캐릭터"를 만들어냅니다. Sora는 또한 기존 비디오의 공백을 메우거나 더 길게 만들 수 있을 뿐만 아니라 이미지를 기반으로 비디오를 생성할 수도 있으므로 모든 것이 단지 텍스트 프롬프트가 아닙니다.

 

비디오는 스크린샷 스틸처럼 보기에도 좋지만 움직임이 놀라울 정도로 놀랍습니다. OpenAI는 사이버펑크 스타일의 도쿄 거리와 골드 러시 당시 캘리포니아의 "역사 영상"을 포함하여 새로운 기술을 선보이기 위해 다양한 비디오를 제공했습니다. 인간의 눈을 극단적으로 클로즈업한 것 등 그 외에도 더 많은 것들이 있습니다. 프롬프트는 만화부터 야생 동물 사진까지 모든 것을 다룹니다.

 

728x90

소라는 여전히 몇 가지 실수를 저질렀습니다. 예를 들어 자세히 살펴보면 군중 속의 일부 인물은 머리가 없거나 이상하게 움직이는 것을 알 수 있습니다. 어색한 동작은 일부 샘플에서 첫눈에 눈에 띄었지만 일반적인 이상함은 여러 번 관찰하면서 발견되었습니다. OpenAI가 Sora를 일반 대중에게 공개하기까지는 다소 시간이 걸릴 수 있습니다. 현재 이 모델은 잠재적인 위험을 평가할 레드팀에 의해 테스트될 예정입니다. 일부 제작자는 아직 개발 초기 단계에 있지만 지금 테스트를 시작할 수도 있습니다.

 

AI는 아직 불완전해서 뭔가 좀 지저분할 것으로 예상하고 들어갔습니다. 낮은 기대치 때문인지, 소라의 실력 때문인지 감동도 있지만 살짝 걱정도 됩니다. 우리는 이미 가짜와 진짜를 구별하기 어려운 세상에 살고 있습니다. 이제는 이미지뿐만 아니라 동영상도 위험에 처해 있습니다. 그러나 Sora는 Pika와 같이 우리가 본 최초의 텍스트-비디오 모델이 아닙니다.

 

인기 기술 YouTube 사용자인 Marques Brownlee와 같은 다른 사람들도 소라 동영상에 대한 응답으로 "이것이 당신에게 조금이라도 관심이 되지 않는다면 아무 일도 일어나지 않을 것입니다"라고 트윗했습니다. OpenAI의 Sora가 지금 이만큼 좋다면 몇 년 후에 추가 개발과 테스트를 거쳐 어떤 성능을 발휘할 수 있을지 상상하기 어렵습니다. 이는 많은 일자리를 대체할 수 있는 잠재력을 가진 일종의 기술입니다. 하지만 ChatGPT처럼 인간 전문가와 함께 공존할 수 있기를 바랍니다.


 

 

구글, Gemini 발표 후 정치적 압력에 굴복 (feat. 기술과 미래)

구글은 Gemini AI 플랫폼에서 최첨단 기능을 가져온 후 뜨거운 물에 빠졌습니다. 구글은 어떠한 편파적 차별도 부인했음에도 불구하고 갑작스러운 해임으로 인해 회사가 정치적 압력에 굴복했다

mkpark01.tistory.com

 

 

올해는 인공지능(AI)의 시대 (feat. 모바일 월드 콩그레스 2024)

미국 소비자 가전 전시회(CES), 독일 베를린 국제가전박람회(IFA)와 함께 세계 3대 IT 전시회로 꼽히는 모바일 월드 콩그레스(MWC). 올해는 스페인 바르셀로나에서 개최됩니다. 세계 최대의 이동통신

mkpark01.tistory.com

 

 

샘 올트먼의 원대한 계획으로 반도체 시장 개편 추진

'챗GPT의 아버지'로 불리는 오픈AI의 CEO 샘 올트먼이 파격 행보를 이어갑니다. 올트먼 CEO는 인공지능(AI) 반도체 협력을 위해 지난 26일 방한한 데 이어, TSMC 등 주요 반도체 기업을 방문했습니다.

mkpark01.tistory.com

728x90
반응형

댓글