

就在最近,OpenAI发布了一款颠覆性的AI模型Sora,它能够根据文本指令生成逼真的视频。目前,OpenAI尚未公开AI模型Sora的全部细节,但已经展示了一些令人惊叹的生成视频案例。
人们正在积极探索AI生成领域的可能性,Hugging Face社区也开始尝试使用Sora API接口,以探索其视频生成能力,但需要通过验证token才能进行体验。通过这些接口,可以生成短时长的视频,例如生成10秒、分辨率为1080p的视频。
值得注意的是,用户需要通过特定的指令才能生成所需的视频,这意味着AI模型已经具有一定的理解能力。与此同时,视频生成领域也面临着OpenAI带来的技术挑战。据了解,在短短1小时内,API接口就涌入了大量的请求,甚至导致OpenAI和Hugging Face不得不暂停相关功能的开放。
以下是一些生成案例:描述:“在佛罗里达州的车道上打篮球的青少年,阳光明媚的下午”
以下是一些生成案例:“0:一只毛茸茸的小猫特写,它有着引人注目的蓝眼睛,正坐在柔软的奶油色枕头上。小猫的头微微偏向一边,耳朵专注地竖起。背景是一个温暖、光线柔和的房间,隐约可见
Hugging Face上的一些AI模型开发者分享了他们对该AI模型的看法,他们普遍认为当前最关键的问题是“规模化的问题以及可控性”。
在这些开发者看来:“对于我们这些小型AI团队来说,我们关注的是Sora的视频生成技术,以及如何利用现有的视频生成框架和推理优化技术。同时,我们也密切关注是否会出现类似于‘幻觉’的情况,即Sora生成的内容与提示不符。” 他们还指出,当前的“质量bug检测、推理成本以及端到端token”仍然是需要解决的问题。
这些开发人员还对非AI领域的人员提出了建议,建议他们关注OpenAI的视频生成能力是否会出现偏差,或者其生成的内容是否符合伦理道德。
大家普遍认为OpenAI在社区中创建了“模型演示”,这将有助于提高大型语言模型的透明度。有人猜测OpenAI可能会借鉴Sora早期采用者的经验,改进OpenAI未来的模型发布流程。
根据此前报道,OpenAI的首席技术官Mira Murati表示,Sora模型目前仍在安全评估阶段,尚未开放给大众体验。
在最近的一次Reddit讨论中,技术负责人Kevin Weil提到,Sora模型对安全问题的考虑至关重要,并认为在开放使用之前,需要充分减轻潜在的滥用风险,同时确保内容真实性和品牌安全性。
相关要点:
✨ AI模型开发者对Sora模型表示赞赏,并对OpenAI表示认可。
🧠 他们关注OpenAI的长期战略,包括如何在安全前提下实现技术创新。
📢 OpenAI致力于解决与生成内容相关的潜在问题,并积极探索AI伦理。