

OpenAI发布的全新AI模型Sora,能够根据文字指令生成视频,其逼真程度令人惊叹,引发了广泛关注。据悉,Sora的功能强大且用途广泛:它不仅能够依据简短的文本描述,还能创造出长达一分钟的视频片段,展现出极高的视频生成质量。
Sora颠覆了传统视频创作的模式,它使用户能够通过简单的“提示词”来实现复杂的场景构建,生成20秒甚至更长的优质视频,涵盖了各种主题和风格。在过去2个月,OpenAI一直在对Sora进行测试,让艺术家们体验“用文字创造世界”的可能性。那么,与“真实世界”相比,Sora的“模拟现实”究竟达到了什么水平?
值得一提的是,Sora还能对现有图像进行扩展和编辑。比如,用户提供一张杯子的静态图片,它就能生成一段咖啡溢出的动态视频;或者给定一段90年代滑板少年风格的旧视频,它也能无缝扩展视频内容,使其更加丰富精彩。
不仅如此,Sora在Twitch直播领域也引起了不小的轰动,甚至有人开始畅想利用Sora生成定制的、独一无二的游戏直播画面。假设Auronplay正在直播一场激烈的足球比赛,Sora就能实时生成与比赛进程同步的个性化视觉效果,大大提升了观看体验。
不仅如此,Sora甚至“说服”了一位Twitch主播Pokimane,让她相信自己正在观看一段真实的猫咪弹钢琴的视频。由此可见,OpenAI正在努力消除视频中的虚假成分,确保Sora产出的内容尽可能地接近真实。
尽管OpenAI在技术层面取得了显著进展,但也承认当前阶段仍有一些局限性,特别是视频生成可能与物理规律不符。OpenAI的CTO米拉·穆拉蒂在3月份的《华尔街日报》活动中表示,未来计划让Sora应用于YouTube、Instagram和Facebook等平台的内容创作。OpenAI希望通过Sora,一方面降低视频制作门槛,另一方面也能为Shutterstock等图片平台带来新的增长机会。
然而,围绕视频生成技术的讨论也引发了一些担忧,尤其是OpenAI如何应对Sora可能带来的版权问题。Pryor Cashman知识产权团队合伙人威廉·霍伯表示,使用受版权保护的视频素材训练AI模型,可能会造成侵权,尤其是在AI生成的视频与原作高度相似的情况下。
要理解AI模型的真正潜力,关键在于掌握它的底层逻辑。如果能够洞悉模型构建虚拟世界的方式,就能更好地预测其行为。尤其是在数字领域,人们常常混淆了“渲染”世界和“模拟”世界的概念。从技术角度来看,AI模型需要解决很多复杂的问题,才能创造出能够反映现实世界的视频。
当然,软件和OpenAI也在积极探索AI技术,以期提高自身的技术壁垒。诸如Midjourney、Runway和Stability AI等AI图像生成工具已经能够创作出令人印象深刻的视觉内容。甚至有一些新型的AI音乐生成工具,如Udio和Suno,也开始崭露头角。
目前,AI图像生成技术在“风格迁移”方面表现突出,这意味着它们能够将一种风格应用到另一种风格之上。然而,在视频创作领域,仍然存在许多挑战。Dorsey & Whitney律师事务所的知识产权合伙人安德烈·法亚德指出,视频生成涉及到四个关键的知识产权问题:视频本身的版权、AI模型训练数据的版权、以及生成视频中包含的音乐和肖像的版权。
此外,《连线》杂志也指出了关于版权的担忧,认为现有的AI模型可能会生成与已有作品相似的内容。一方面,这些模型依赖于大量的现有作品进行训练,另一方面,它们所创造的内容也可能会对现有艺术家的生计产生影响。
与此同时,威廉·霍伯表示,法律界尚未就“合理使用”的界限达成共识,这使得在知识产权领域进行AI创新变得更加复杂。这也意味着,在未来,创作者将需要在技术层面实现突破,以应对不断涌现的各种技术挑战。
当然,除了Epic和软件(如“我的世界”)之外,游戏、电影、电视、Roblox和《赛博朋克2077》等内容也将在CD Projekt Red的推动下,积极探索先进的电影制作技术和数字资产管理方法。
尽管AI图像生成技术在各个领域都展现出了巨大的潜力,但其可能带来的法律和伦理问题也需要我们认真对待。一方面,我们需要认识到人工智能对社会和商业模式可能产生的深远影响,另一方面也需要规范和指导知识产权领域的创新。
一些AI图像公司正在寻求与媒体公司建立合作关系,从而规避潜在的版权风险。目前,OpenAI的策略是尽可能地利用公开可用的数据,同时也积极地与创作者展开合作。此外,为了更好地应对知识产权保护问题,OpenAI也在努力开发先进的技术,从而保证其模型能够生成高质量的内容。
尽管人们对AI模型可能产生的误用表示担忧,但其在数字领域也具有广泛的应用前景。对于那些渴望利用AI技术进行创新的人们来说,理解其局限性至关重要。
快讯中提到的AI工具

强大的AI音乐生成平台,能生成丰富多样的音乐作品

新推出的 Gen-3 Alpha 是一个高速、高保真、可控的视频生成工具

OpenAI 开发的文本到视频生成模型

致力于创造对全人类有益的安全 AGI

开启 AI 绘画的奇幻之旅