다시 일 낸 오픈AI, 동영상 생성 AI '소라' 발표

백문이 불여일견이죠. 일단 영상부터 보고 오시겠습니다. 오픈AI가 공개한 ‘소라’로 만든 영상을 확인할 수 있는 곳인데요. 소라는 텍스트를 동영상으로 만들어주는 AI입니다. 현재 오픈AI의 공식 사이트에는 여러 샘플 영상들이 올라와 있습니다.

좀 놀라셨나요? 사람이 텍스트로 쓴 프롬프트를 소라가 이해하고 만들어낸 영상들입니다. 그 중 빨간 모자를 쓰고 설원 위를 걷는 영상의 프롬프트는 다음과 같습니다.

  빨간 울 뜨개질 오토바이 헬멧을 쓰고 있는 30세 나이의 우주인이 파란 하늘 아래의 소금 사막을 모험하는 영화 예고편을 35mm 필름에 선명한 색상으로 촬영하였습니다.  

구체적인 텍스트를 받아들인 소라는 프롬프트의 의도를 거의 십분 반영해냈습니다. 전문가들은 특히나, 소라가 표현해낸 구체적고 연속적인 영상의 디테일에 대해서 감탄하고 있는데요. 예를 들어서 여성이 걸어가면서 잠시 가려졌던 간판이나 신호가 다시 화면에 나타날 때도 이전과 모습이 동일하게 유지되고 있다는 점이죠. 이런 정도의 정확성과 디테일이라면, 상업용 콘텐츠에 소라와 같은 생성형 AI를 쉽게 활용할 수 있는 날이 멀지 않았다는 걸 느끼게 하는데요.

오픈AI는 이날 블로그에 “소라는 다양한 캐릭터가 등장해 특정 유형의 동작을 하는 등 복잡한 장면을 최대 1분짜리 영상으로 디테일하게 뽑아낼 수 있다.”면서 “소라는 사용자의 명령어를 정확하게 해석할 뿐만 아니라 해당 명령어가 물리적 세계에 어떻게 존재하는지도 이해한다.”고 덧붙였습니다

따로 가르치지 않았는데 중력과 물리법칙을 이해하는 AI라니. 정말 놀랍지 않습니까? 소라는 텍스트 외에도 이미지를 동영상으로 만들 수 있고, 기존 동영상을 확장하거나 누락된 프레임을 채우는 기능도 갖춘 것으로 알려져 있습니다.

다만, 아직 상용화할 정도로 완벽한 것은 아니죠. 샘 알트먼 오픈AI CEO는 “소라는 한동안 제한된 소수의 창작자만 사용하도록 할 계획”이라고 밝혔습니다. 그에 따르면 소라는 여전히 좌우 방향을 혼동하거나, 원인과 결과의 시간적 순서를 이해하지 못하는 등의 결함을 보이고 있기 때문이죠.

그럼에도 불구하고 사람들의 오픈AI에 대한 열광은 계속되고 있습니다. 최근 미국 뉴욕타임스의 보도에 따르면 오픈AI의 기업가치가 최소 800억달러(약 106조8400억원)에 달한다고 합니다. ‘최소’입니다. 1년 전과 비교해서 3배나 뛴 기업가치인데요, 그런데 지금 오픈AI의 행보를 본다면 이 가치 역시 더 오를 가능성이 보입니다.

어떤 일이 있어 서냐면요. 오픈AI가 틱톡 공식 계정을 열고, 여기에 소라로 만든 숏폼을 올린 거죠. 나흘 만에 스무 개의 영상을 올렸습니다. 강아지가 키보드를 치고 있는 영상 같은 걸 보고 있으면, 이제 창작의 영역까지 AI로 넘어가고 있다는 걸 실감하게 됩니다. 지금은 1분 남짓 영상이지만 소라가 만들어낼 영상의 길이가 더 길어질 것은 당연한 수순이겠죠. 할리우드조차 긴장해야 할 시기입니다.

사람이 내놓을 수 있는 것은 정말로 아이디어 반짝이는 프롬프트 정도일까요? AI가 절대로 빼앗아 갈 수 없는 영역이 예술과 미학, 철학 등의 분야일 거라고 생각했는데 이제는 우리가 생각하는 예술과 아름다움, 가치 등도 달라질 것으로 보입니다. 카메라가 추상 미술의 시대를 가져왔다면, AI는 인간이 어떠한 예술을 고민하게 만들까요?

 

콘텐츠 제공 : 바이라인네트워크(byline.network)

 
 
구독하기 버튼