Step-Video-T2VStep-Video-T2V是一款由阶跃星辰与吉利汽车联合开源的文本生成视频大模型,支持中英文输入,基于 Video-VAE 与 DiT 架构,具备 300 亿参数,最长可生成 204 帧高质量视频。模型引入 DPO 偏好优化,提升画面一致性与真实感,适用于影视创作、教育内容、游戏设计与 AI 多模态研究等场景,支持本地部署与在线体验。02.7K0AI大模型# Step-Video-T2V开源模型# Text-to-Video模型# 多模态视频生成模型