Step-Video-T2V

Step-Video-T2V

Step-Video-T2V是一款由阶跃星辰与吉利汽车联合开源的文本生成视频大模型,支持中英文输入,基于 Video-VAE 与 DiT 架构,具备 300 亿参数,最长可生成 204 帧高质量视频。模型引入 DPO 偏好优化,提升画面一致性与真实感,适用于影视创作、教育内容、游戏设计与 AI 多模态研究等场景,支持本地部署与在线体验。
02.7K0
Emu Video

Emu Video

Emu Video 是由 Meta 开发的先进文本生成视频工具,采用因子化生成方法,通过两个扩散模型实现高质量视频生成。用户只需输入文本提示,即可生成分辨率高达 512x512 像素、每秒 16 帧、时长 4 秒的视频。Emu Video 适用于广告制作、教育培训、多媒体创作、社交媒体内容和艺术表达等多种场景,提供简易且高效的视频生成体验。
01.3K0