
Waver 1.0简介
Waver 1.0是什么?
Waver 1.0是 FoundationVision 推出的下一代通用视频生成基础模型,基于 Rectified Flow Transformer 架构,统一支持文本生成视频(T2V)、图像生成视频(I2V)与文本生成图像(T2I)。最高可生成 1080p 高分辨率视频,分辨率、宽高比与时长(2–10 秒)灵活可调;在 T2V 与 I2V 榜单均跻身前三,画质、运动幅度与时间一致性媲美商用方案。支持可控风格与质量、APG 伪影优化及 Cascade Refiner 高效升采样,适用于影视创意、游戏动画、教育科研等多场景。

核心特点
- 一体化多模态生成:同一模型支持 T2V、I2V、T2I 三种任务,无需切换模型。
- 高分辨率与灵活时长:最高支持 1080p 视频生成,分辨率、宽高比、视频时长(2–10 秒)可自由设定。
- SOTA 性能:在 T2V 和 I2V 榜单均进入前三,画质、运动幅度、时间一致性均优于多数开源模型,媲美甚至超越商用方案。
- 卓越运动建模:擅长生成复杂、大幅度的运动场景(如体育、舞蹈、机械运动等)。
- 可控风格与质量:通过 Prompt Tagging 控制视频风格(写实、动画、像素风等)与质量。
- 推理优化:引入 APG 技术减少伪影、提升真实感,采用级联精修器(Cascade Refiner)实现高效 1080p 升采样。
技术原理
Waver 1.0 通过 Rectified Flow Transformer + Wan‑VAE 压缩 + Prompt Tagging + Cascade Refiner + APG 优化,在一个统一模型中实现了高质量、多风格、可控的文本/图像到视频生成,并在运动建模上达到 SOTA 水平。
应用场景
- 影视与广告创意:快速生成分镜、广告短片、动画片段
- 游戏与虚拟世界:制作游戏过场动画、环境演示
- 教育与科研:可视化复杂运动、实验过程或历史场景
- 社交与内容创作:生成短视频、故事片段、视觉特效
项目地址
项目官网:http://www.waver.video/
Github仓库:https://github.com/FoundationVision/Waver
arXiv技术论文:https://arxiv.org/pdf/2508.15761
数据评估
本站新媒派提供的该工具内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2025年8月31日 上午10:38收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。
与Waver 1.0相关工具


PixelDance

PuLID

文心千帆

文心大模型

gpt-realtime

CineMaster

RMBG-2.0

光语金帆

言犀

MotionGen

天谱乐

CodeGemma

OpenRouter AI

BuboGPT
