EchoMimicEchoMimic是阿里巴巴达摩院开发的一项AI数字人开源项目,能够通过音频和面部标志点生成高度逼真的肖像动画。无论是单独使用音频或面部标志点,还是将两者结合,EchoMimic都能创造出自然流畅的动态视频。能够通过给定的音频和一张面部照片,生成与音频口型动作匹配的说话或者唱歌视频,做口播视频或者趣味唱歌视频都可以。该技术在娱乐、教育、虚拟现实和在线会议等领域有广泛应用前景。
美图数字人开放平台美图数字人开放平台是美图公司旗下的一个专注于3D数字人制作、AI人像驱动、AIGC内容制作以及AI人机交互的服务平台。该平台提供一系列的服务,旨在帮助客户打造品牌化的、独立的数字人IP,从而吸引更多的年轻客群。
讯飞虚拟人科大讯飞虚拟人是一个全栈式AI虚拟人应用服务平台。运用最新的AI虚拟形象技术,结合语音识别、语义理解、语音合成、NLP、星火大模型等AI核心技术,提供虚拟人形象资产构建、AI驱动、多模态交互的多场景虚拟人产品服务。
元乙智创元乙智创是浙江元乙智能科技有限公司倾力打造的数字人创作平台,致力于将前沿技术与视频创作完美结合。通过该平台,用户可以根据自己的需求,快速创建出栩栩如生的数字分身,用于文化传播、在线教育、电子商务、文旅体验等各种场景。
SadTalkerSadTalker 是由西安交通大学(西交大)开源的项目。它是一个用于生成风格化的单图说话人脸动画的工具,可以根据输入的图片和音频生成对应音频口型的视频。用户可以给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴、眨眼、移动头部等。它可以从音频中生成3DMM的3D运动系数(头部姿势、表情),并隐式调制一种新颖的3D感知面部渲染,用于生成说话的头部运动视频。
Lalamu StudioLalamu Studio是一款基于人工智能技术的创新软件,主要用于创作口型同步视频。用户可以通过上传视频文件或使用内置模板开始创作,利用先进的人工智能算法,系统会自动对嘴部动作进行调整,以确保与音频的完美匹配。
厘里AI数字人厘里是阿里大文娱技术团队自研的超写实数字人。厘里通过深度训练AI模型,能够精准模拟人类面部表情、肌肉运动等细节,并根据不同场景和角色进行造型和服装的变换。她的无美颜的真人肤质系统呈现更加细腻和自然,使观众在享受节目乐趣的同时,也能感受到数字人技术的魅力。