当前位置:首页 > AIGC > 正文内容

Stable Video Diffusion

No111个月前 (01-12)AIGC51

以下是官方的介绍:

我们今天发布了稳定视频扩散(Stable Video Diffusion),这是我们基于图像模型稳定扩散(Stable Diffusion)推出的第一个生成式视频基础模型。

这款最先进的生成式AI视频模型现已在研究预览版中推出,它代表了我们在为各种用户创建模型的过程中迈出的重要一步。

通过这一研究版本的发布,我们已在GitHub仓库上公开了稳定视频扩散的代码,运行该模型本地所需的权重可在我们的Hugging Face页面上找到。有关该模型技术能力的更多细节可在我们的研究论文中找到。

适用于各种视频应用

我们的视频模型可以通过在多视角数据集上微调轻松地适应各种下游任务,包括从单个图像生成多视角合成。我们计划开发各种基于此基础模型并对其进行扩展的模型,类似于稳定扩散周围已经形成的生态系统。

来自我们微调过的视频模型的多视角生成示例

此外,从今天开始,您可以在此登记加入我们的等待列表,以访问全新的基于文本到视频界面的网络体验。此工具展示了稳定视频扩散在广告、教育、娱乐等多个行业中的实际应用。

性能具有竞争力

稳定视频扩散以两种图像到视频的模型形式发布,能够以每秒3至30帧的可自定义帧速率生成14和25帧。在最初的基础形式下发布时,通过外部评估,我们发现这些模型在用户偏好研究中超过了领先的封闭模型。

仅用于研究

虽然我们急切地用最新的进展更新我们的模型,并努力结合您的反馈,但我们强调,这个模型在当前阶段并不打算用于实际或商业应用。您对安全性和质量的见解和反馈对于提炼此模型以最终发布是非常重要的。

这与我们在新模式下的以前发布相呼应,我们期待与大家分享完整的发布。

一点看法

从发布的demo视频效果来看,画质上并没有runway和pika好,展示的功能也只是文生视频,至于效果来说目前还没人使用到所以也不清楚。而且好像需要A100的卡才能用,这个根本不是民用显卡的配置。

虽然它号称比runway和pika性能更高,在现在这个阶段Pika和runway已经开始卷可控性和画质了,目前的demo看不出有什么更好的点。如果加上SD的开源生态可能会不一样,但是现在它也还没说要开源

综上所述,可以观察,但是并无惊喜。

不过AI生成视频开始卷了,也就意味着更好的产品一定在路上了。




官方网址:stability.ai/news/stable-video-diffusion-open-ai-video-model




前往官网

扫描二维码推送至手机访问。

版权声明:本文由 寻艺录 发布,如需转载请注明出处。

本文链接:https://www.xunyilu.com/195733.html

分享给朋友:

“Stable Video Diffusion” 的相关文章

美图AI Logo设计

美图AI Logo设计

美图AI Logo设计是一款使用人工智能技术来帮助用户快速设计产品、店铺视觉Logo的工具。它可以生成多种不同风格和排版的Logo,满足用户的不同需求。 美图AI Logo设计的使用方法非常简单。首先,打开美图设计室,点击“AI Logo设计”。接下来,输入品牌名和一句话描述,美图AI Log...

讯飞智文 — 科大讯飞

讯飞智文 — 科大讯飞

讯飞智文是一款由科大讯飞推出的人工智能文档创作平台。它基于讯飞星火认知大模型,支持处理各种内容格式,包括一句话主题、长文本、音视频等多种形式。 这使得讯飞智文成为了一款极具创新性的智能文档创作平台,不仅提供高效便捷的文案改写服务,还能自动生成令人印象深刻的ppt文档。 讯飞智文的功能主要包括...

网易云音乐 × 小冰X Studio

网易云音乐 × 小冰X Studio

网易云音乐·小冰X Studio是一款面向音乐人及音乐爱好者的音乐创作辅助工具,它提供多种人工智能歌手的声音选择,音乐人只需输入曲谱和歌词,就能快速生成高质量的音乐作品。 网易云音乐与小冰合作的音乐创作工具X Studio的功能主要包括以下几个方面: 提供多种人工智能歌手的声音选择。X...

美图AI模特试衣

美图AI模特试衣

美图AI模特换衣是一款使用人工智能技术来帮助用户快速将模特的衣服换成另一套衣服的工具。它可以帮助用户快速创建多种风格的时尚造型,并用于电商、娱乐、视觉设计等多个领域。 美图AI模特换衣的使用方法非常简单。首先,打开美图设计室,然后选择“AI模特试衣”。接下来,选择需要换衣的模特图片,并选择需要...

DomoAI

DomoAI

DomoAI 是一款人工智能驱动的艺术生成工具,可让您根据文本提示或者上传图像、视频创建独特的图像与视频,目前专注于生成二次元动漫风格的视觉内容。 它具有多种功能,可让您创建各种艺术风格,目前可以生成以下视觉图像: 风景 人物 抽象 卡通 DomoAI...

有道速读 — 网易有道

有道速读 — 网易有道

有道速读是一款由网易有道开发的人工智能阅读辅助软件,它可以帮助用户快速阅读文档,并获取文档的主要内容。 有道速读的功能主要包括以下几个方面: 文档摘要:有道速读可以自动生成文档的摘要,帮助用户快速了解文档的主要内容。 文档解读:有道速读可以对文档进行深入解读,帮助用户理解文档的细节...