AIGC新里程碑！OpenAI官宣最强视频生成模型Sora

香港奇点财经2月16日报道。随着聊天机器人和图像生成器进入商业领域，视频可能成为生成式人工智能（AIGC）的下一个前沿领域。本周四（2月15日），OpenAI推出了新的生成式人工智能模型Sora，Sora的工作原理类似于OpenAI的DALL-E，它可以根据用户输入的场景生成高清视频剪辑，也可以根据静止图像生成视频剪辑，以及扩展现有视频或填充缺失的帧。

“Sora”，源自日语中的“天空”一词。据《纽约时报》报道，该技术背后的团队表示，选择这个名字是因为它“唤起了无限创造潜力”。Sora可以创建看起来像是从好莱坞电影中提取出来的视频片段。OpenAI在Sora的首页展示了这些片段，包括在雪地上小跑的猛犸象、一个怪兽凝视着融化的蜡烛，以及由类似gopro的相机拍摄的东京街景。

OpenAI表示，Sora是一个能够理解和模拟现实世界的模型的基础。换句话说，Sora被认为是一个具有能力理解和模拟真实世界情境的基础性模型。这暗示着Sora具有一定的智能和适应能力，可以处理与现实世界相关的任务和情境，并且有潜力为各种应用和领域提供帮助。

目前，Sora仅限于生成一分钟或更短的视频，并且尚处于测试阶段未对公众开放。该技术并不完美，甚至还包含了奇怪和不合逻辑的图像。例如，该系统最近生成了一个有人吃饼干的视频，但那块饼干似乎永远吃不完。

另外，OpenAI表示正在与专家合作，测试Sora模型以防止错误信息、仇恨内容和偏见等问题。这些专家被称为红队成员，他们会以对抗性方式测试模型，以确保其能够应对各种潜在的安全挑战。

他们还开发了图像分类器，用于检查每个生成视频的帧，以确保在符合使用政策。为了确保产品符合使用政策，OpenAI在产品中使用文本分类器，以检测并禁止用户用户输入违反政策的文本，例如涉及极端暴力、性、仇恨、名人肖像或他人知识产权等的内容。

当然，这可能也与OpenAI目前面对的激烈竞争有关。OpenAI希望通过Sora与其他公司的视频生成人工智能工具竞争，如谷歌在今年1月分推出的Lumiere，它也能够根据文字描述生成视频。并且Lumiere采用了一种新的架构叫时空U-Net，它可以在一次处理中生成整个视频，而不是像以前的方法那样逐帧生成，可以说是最先进的文本到视频的生成技术。

其他初创公司也提供类似的人工智能工具，例如Stability AI，它有一款名为Stable Video Diffusion的产品。亚马逊还发布了Create with Alexa，这是一个专门生成基于提示的短片儿童动画的模型。

然而，这项新技术也引发了担忧。据机器学习公司Clarity的数据显示，人工智能生成的赝品数量同比增长了900%。对此，OpenAI表示，他们将与政策制定者、教育工作者和艺术家、演员等合作，以了解他们的担忧并确定这项新技术能够被合理运用。但OpenAI也表示，虽然他们进行了大量的研究和测试，但他们仍然无法预测用户将如何使用他们的技术，并且不排除有人滥用技术的情况。

AI在演艺界的使用一直是一个焦点问题，明星演员担心他们可能失去对自己肖像权的控制，不知名的演员担心他们可能会完全被取代，编剧担心他们可能被迫分享创作工作，或者他们的作品可能被机器所取代。美国演员工会-美国电视和广播艺术家联合会，与代表雇主的电影和电视制片人联盟之间在去年因此爆发了激烈的争执。

这一争议在2023年7月13日演员罢工初始只日进一步升级。美国演员工会当时表达了对工作室使用人工智能的担忧，特别是担心他们的个人肖像和表演，可能会被用来训练新的生成人工智能系统。而制片人联盟则表示他们提出了保护表演者数字相似性的人工智能提案，包括要求表演者同意使用数字复制品或对表演进行数字更改。

在这场争议中，演员工会强调保护“人类创作的作品”，包括声音、肖像或表演的改变。另一方面，编剧协会也表达了对使用人工智能的担忧，希望防止人工智能生成的原始故事情节或对话被视为“文学材料”，并强调任何“公司或非个人的文学传播者”都不是编剧，只有人才能被视为作家。

发表回复 取消回复

发表回复取消回复