















如果你以为 OpenAI Sora 只是一个像 DALLE 这样的创意小玩具,那你可要重新认识一下了。Sora实际上是一个基于数据驱动的物理引擎,能够模拟各种真实或奇幻的世界。这款模拟器能学会复杂的渲染技术、直观的物理规律、长期的逻辑推理以及语义理解,而这一切都是通过先进的去噪技术和梯度计算实现的。
我甚至猜测,Sora可能是通过使用 Unreal Engine 5 生成的大量合成数据来进行训练的。这听起来非常有可能!
你可以把 Sora 看作是一种可学习的模拟器,或者说是一个能模拟现实世界的“世界模型”。虽然在其运作过程中并不直接调用 UE5,但在训练 Sora 的时候,我们可能会使用 UE5 制作的文本和视频配对数据作为训练材料。这种方法可以让 Sora 更好地理解和模拟现实世界的物理现象。
2. 信息论的角度,生成式视频的信息量不如真实拍摄大。一个真实拍摄远远不是视频本身,比如一个30岁的男人和一个20岁的女人对话,表达、语气、表情的背后都是他们积累了50年的数据的总和。这些是生成式当前无法替代的。而且用户对这些细节很敏感。
总结一下:
1. 如果说,希望通过借助 sora 这种视频生成式技术,干掉人拍的视频,把视频行业变成一个“人纯粹消费机器工业化内容”的局面,我认为是没戏的。这不是第八次第四次工业革命,而是对需求的无知。
2. 但如果说,希望通过借助新技术,让人和人之间产生新的连接,激活新的创作产能,我觉得是有戏的。但也得尊重行业规律,日拱一卒的去通过“技术”迭代“生态”,而不是直接把技术强怼给用户。
3. 2的难点是,你们都发朋友圈了,抖快视频号又不是傻子,会给空间让你们颠覆么。




原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/02/2578.html