OpenAI视频模型Sora短暂泄露：引发艺术家反击与抗议

12个月前发布AI俱乐部

摘要：

就在最近，OpenAI发布了一款颠覆性的AI模型Sora，它能够根据文本指令生成逼真的视频。目前，OpenAI […]

就在最近，OpenAI发布了一款颠覆性的AI模型Sora，它能够根据文本指令生成逼真的视频。目前，OpenAI尚未公开AI模型Sora的全部细节，但已经展示了一些令人惊叹的生成视频案例。

人们正在积极探索AI生成领域的可能性，Hugging Face社区也开始尝试使用Sora API接口，以探索其视频生成能力，但需要通过验证token才能进行体验。通过这些接口，可以生成短时长的视频，例如生成10秒、分辨率为1080p的视频。

值得注意的是，用户需要通过特定的指令才能生成所需的视频，这意味着AI模型已经具有一定的理解能力。与此同时，视频生成领域也面临着OpenAI带来的技术挑战。据了解，在短短1小时内，API接口就涌入了大量的请求，甚至导致OpenAI和Hugging Face不得不暂停相关功能的开放。

以下是一些生成案例：描述：“在佛罗里达州的车道上打篮球的青少年，阳光明媚的下午”

以下是一些生成案例：“0：一只毛茸茸的小猫特写，它有着引人注目的蓝眼睛，正坐在柔软的奶油色枕头上。小猫的头微微偏向一边，耳朵专注地竖起。背景是一个温暖、光线柔和的房间，隐约可见

Hugging Face上的一些AI模型开发者分享了他们对该AI模型的看法，他们普遍认为当前最关键的问题是“规模化的问题以及可控性”。

在这些开发者看来：“对于我们这些小型AI团队来说，我们关注的是Sora的视频生成技术，以及如何利用现有的视频生成框架和推理优化技术。同时，我们也密切关注是否会出现类似于‘幻觉’的情况，即Sora生成的内容与提示不符。” 他们还指出，当前的“质量bug检测、推理成本以及端到端token”仍然是需要解决的问题。

这些开发人员还对非AI领域的人员提出了建议，建议他们关注OpenAI的视频生成能力是否会出现偏差，或者其生成的内容是否符合伦理道德。

大家普遍认为OpenAI在社区中创建了“模型演示”，这将有助于提高大型语言模型的透明度。有人猜测OpenAI可能会借鉴Sora早期采用者的经验，改进OpenAI未来的模型发布流程。

根据此前报道，OpenAI的首席技术官Mira Murati表示，Sora模型目前仍在安全评估阶段，尚未开放给大众体验。

在最近的一次Reddit讨论中，技术负责人Kevin Weil提到，Sora模型对安全问题的考虑至关重要，并认为在开放使用之前，需要充分减轻潜在的滥用风险，同时确保内容真实性和品牌安全性。