OpenAI, 오디오 지원 'Sora 2' 비디오 생성 모델 출시
- 사이트
https://openai.com/index/sora-2/
인공지능(AI) 선두주자 오픈AI(OpenAI)가 30일(현지시간) 플래그십 비디오 생성 모델 'Sora 2'를 공식 출시하며, 동기화된 오디오 기능과 소셜 기능을 탑재한 신규 iOS 앱 'Sora'를 동시에 선보였다. 이는 기존 Sora 모델의 한계를 넘어 물리적 현실감과 창의적 협업을 강조한 업그레이드로, AI 비디오 생성 분야의 'GPT-3.5 모멘트'로 평가받고 있다. Sora 2는 텍스트 프롬프트 기반으로 10초 길이의 고품질 비디오를 생성하며, 미국과 캐나다에서 초대 기반으로 앱을 배포 중이다.
Sora 2의 핵심 혁신은 물리 법칙 준수와 오디오-비디오 동기화다. 이전 모델 대비 더 정확한 물리 시뮬레이션으로 비디오가 현실적으로 느껴지며, 대화, 배경 사운드, 효과음 등 오디오를 자동 생성해 몰입감을 높인다. 예를 들어, "북해에서 바이킹 전쟁" 프롬프트로 생성된 10초 영상은 겨울 조명과 중세 스타일을 세밀하게 재현하며, 산악 탐험가의 외침 장면처럼 음성과 시각이 완벽히 맞물린다. 또한, 'Cameo' 기능으로 사용자가 한 번의 짧은 비디오·오디오 녹화로 자신이나 친구를 영상에 삽입할 수 있으며, 동물이나 객체도 추가 가능하다. 이는 프롬프트 충실도와 일관성을 강화해 다중 샷 스토리텔링을 지원한다.
신규 Sora iOS 앱은 TikTok 스타일의 알고리즘 피드를 통해 생성·리믹스·공유를 촉진하는 소셜 플랫폼으로 설계됐다. 사용자는 맞춤형 피드에서 영상을 탐색하고, 자연어로 콘텐츠를 조정할 수 있으며, Cameo를 활용해 협업 창작을 즐길 수 있다. 오픈AI는 "스크롤 시간을 최대화하는 대신 창작을 장려하는" 철학을 강조하며, 앱 내에서 C2PA 메타데이터와 워터마크를 적용해 콘텐츠 출처를 투명하게 표시한다. 앱은 무료로 제공되지만 컴퓨팅 용량에 따라 제한이 있으며, ChatGPT Pro 구독자는 'Sora 2 Pro' 고품질 버전에 우선 접근 가능하다. 안드로이드 버전 개발도 진행 중이다.
안전성 측면에서 오픈AI는 엄격한 가드레일을 도입했다. Cameo는 본인 인증 후 옵트인 방식으로 운영되며, 성적 콘텐츠·테러 선전·자해 유도 등 위험 프롬프트를 사전 차단한다. 공인 인물 딥페이크 생성은 기본 차단되며, 저작권 IP는 옵트아웃 옵션을 제공한다. 십대 계정에는 부모 통제와 사용 시간 제한을 적용해 사용자 복지를 최우선으로 한다. 이는 AI 소셜 미디어의 윤리적 딜레마를 해소하는 데 초점을 맞춘 접근으로 주목받고 있다.
이번 출시는 AI 비디오 시장의 경쟁을 더욱 가열시킬 전망이다. 원래 2024년 2월 연구 프리뷰로 공개된 Sora가 혁신의 출발점이었다면, Sora 2는 런웨이(Runway), 루마(Luma), 킹(Kling) 등 경쟁 모델을 넘어 현실성과 접근성을 강조한다. API는 소비자 롤아웃 후 공개될 예정이며, 오픈AI는 "협업 창작의 새로운 시대"를 열겠다고 밝혔다. 전문가들은 Sora 2가 엔터테인먼트와 창의 산업을 재편할 잠재력을 지녔다며, 글로벌 확장을 주시하고 있다.
Welaunch 김아현 기자
스타트업 뉴스 플랫폼, 위런치
© 2024 Welaunch. All Rights Reserved
보도자료/기고 : editor@welaunch.kr
광고/제휴 문의: we@welaunch.kr