OpenAI推出文本生成视频大模型Sora

生活杂谈
24年2月16日
编辑

Prompt:

“A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually. the street is damp and reflective, creating a mirror effect of the colorful lights. many pedestrians walk about.”

中文指令：

“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信而随意。街道潮湿且反光，在彩色灯光的照射下形成镜面效果。很多行人走来走去。”

OpenAI 官方文档介绍：Sora是一种扩散模型，主要通过静态噪音的视频开始生成视频，然后再通过多个步骤去除噪音，逐渐转换视频。

Sora 与 ChatGPT 一样采用 Transformer 架构，并使用了 DALL-E 3 中的重述技术，是一种为视觉训练数据生成高精准描述性的字幕。

OpenAI推出文本生成视频大模型Sora

所以，Sora 在生成视频过程中精准还原用户的文本提示语义。

除了文本生成视频之外，Sora 还能根据图像生成视频，并能准确地对图像内容进行动画处理。也能提取视频中的元素，对其进行扩展或填充缺失的帧，功能非常全面。

#免责声明#

①本站部分内容转载自其它媒体，但并不代表本站赞同其观点和对其真实性负责。

②若您需要商业运营或用于其他商业活动，请您购买正版授权并合法使用。

③如果本站有侵犯、不妥之处的资源，请联系我们。将会第一时间解决！

④本站部分内容均由互联网收集整理，仅供大家参考、学习，不存在任何商业目的与商业用途。

⑤本站提供的所有资源仅供参考学习使用，版权归原著所有，禁止下载本站资源参与任何商业和非法行为，请于24小时之内删除!

{{userData.name}}已认证

OpenAI推出文本生成视频大模型Sora

我流随笔｜便秘时期的爱情

上映6天！又一部影片宣布退出春节档

微软 6 月发行商特卖开启！多款佳作超低价入手

贱驴RS2瑰奇：三模百键Gasket Pro结构，性价比诚意之作

雷柏VT9AIR：一年推出六个型号，主打一个满足用户各种需求！

长城GW7000固态硬盘图文详细首测，联芸+长江存储，表现如何？

《奇唤士》PC 版火热发布！

刺客信条4：黑旗/Assassin's Creed IV: Black Flag

用户协议

隐私政策

广告合作

在线工单