商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)

AI资讯4个月前发布 新媒派
468 0 0

「少问自己为什么

   多问别人凭什么」

这自我反思的独到观点,

可不是我说的,

而是…Vimi 的兵马俑表情包文案…

商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)

这不,这两天,2024 世界人工智能大会,在上海举办的如火如荼。开馆第 1 天,商汤科技就推出了面向 C 端的,全球首个可控的人物类 AI 视频生成产品-Vimi相机!

商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)

To C ? 可控 ?听起来很厉害的样子,

快来跟着我一起扒一扒:

商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)
Vimi是商汤科技推出的可控人物视频生成大模型,专为视频创作者设计。通过动作视频、动画、声音和文字等多种驱动元素,Vimi能够生成与目标动作一致的人物视频。它不仅能精准控制人物表情和肢体动作,还能生成合理的头发、服饰和背景,支持光影变化。Vimi突破了传统AI视频生成的限制,能够稳定生成分钟级的单镜头人物视频,画面效果自然流畅。

概述

  • 首个“可控”人物视频生成大模型
  • 面向C端用户,支持多种娱乐互动场景
  • 基于商汤日日新大模型构建

主要功能

  • 生成长达1分钟的单镜头人物类视频
  • 画面效果稳定,无劣化或失真
  • 支持聊天、唱歌、舞动等多样化娱乐互动场景

技术特点

  • 通过1张照片,生成目标动作一致的人物视频
  • 实现精准的人物表情控制和自然肢体变化控制
  • 支持动作视频、动画、声音、文字等元素驱动

应用场景

  • 广告、电影制作等行业提供便捷服务

行业认可

  • 入选WAIC展会最高荣誉“镇馆之宝”

来看看Vimi官方视频效果如何:

了解了下官方介绍, Vimi主要有两大功能:

1.一张照片生成写真视频

就目前市面技术而言, 让照片动起来,

已经不再是什么新鲜事儿了

商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)

但是,Kimi官方表示, 它能持续生成,

效果相对稳定的,一分钟单镜头人物视频!

并且能精细化控制表情和动作,

这,就比较厉害了!

 

来看看写真的效果,

Kimi能通过动作、视频、动画、声音、文字等

多种驱动元素,来驱动人物类照片

能控制人物的表情和肢体动作,

生成合理的头发服饰背景和光影的变化

商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)

2.个性动态表情包

提供一张简单的自拍照,

它就能整出一堆有趣的表情包,

唱歌、跳舞、说晚安!都不在话下,

盲猜,这个性化的定制,能引爆年轻人的刚需..

商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)

让自己喜欢的名人动起来,也是可以的…

商汤科技Vimi:首个“可控”人物视频生成大模型来了(含申请通道)

实操体验

来,打开下面的链接:

https://vme-int.softsugar.com/questionnaire/

你会看到这行文字:Vimi产品体验申请

进入填写申请信息,等待短信通知,你还等什么?

犹豫,就会像这几天的可灵,跟几十万人一起排队!

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...