DUIX

11个月前发布 534 00

工具介绍:DUIX是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,让每个开发者可轻松创建智能化、个性化的数字人Agent,并应用到各行各业。

收录时间:
2024-06-26

DUIX简介

DUIX(Dialogue User Interface System)是硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源,开发者可自行接入多方大模型、语音识别(ASR)、语音合成(TTS)能力,实现数字人实时交互,并在Android和iOS多终端一键部署,让每个开发者可轻松创建智能化、个性化的数字人Agent,并应用到各行各业。

DUIX

DUIX:硅基智能打造的AI数字人智能交互平台

核心功能 Core Features

  • 部署成本低: 无需客户提供技术团队进行配合,支持低成本快速部署在多种终端及大屏。
  • 网络依赖小: 适合地铁、银行、政务等多种场景的虚拟助理自助服务。
  • 功能多样化: 可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。
  • 实时视频沟通:用户可以与智能写实数字人进行实时对话,这种体验仿佛跨越了时空的限制,为用户提供了随时随地的沟通可能。
  • 个性化定制:根据个人兴趣爱好,用户可以选择自己喜欢的数字人形象、声音和人设,从而打造专属于自己的互动体验。
  • 多角色扮演:数字人不仅仅是虚拟伙伴,它们还可以是用户的虚拟伴侣,甚至是无所不知的“百晓生”,满足用户在不同场景下的不同需求。
  • 情感连接:通过与数字人的互动,用户能够建立起情感纽带,享受陪伴的乐趣。这种情感连接为用户提供了情感支持和心理慰藉。
  • 朋友圈功能:数字人的“朋友圈”展示了他们生活的点滴日常,用户可以从中更深入地了解数字人的个性和兴趣,进一步拉近与数字人之间的距离。

常见问题解答

1.可以支持数字人定制吗?是基于照片还是视频?

答:可以支持数字人定制,我们是基于视频进行数字人定制。您可以定制专属的数字人用于SDK中。但定制的数字人属于付费服务,您可以联系客服邮箱。

2.如何定制形象?

答:定制硅基数字人需要拍摄一段 3-5 分钟的真人出镜口播视频,具体出镜姿势、口播内容,可以根据最终的真实使用场景来确定。比如用来制作法律咨询相关视频,即可选择正装出镜,口播法律相关内容,这样整体情景比较一致。

3.定制形象如何收费?

答:我们提供与SDK开源接口配套的数字人定制,定制价格为9800元/套,包括形象+声音,若有更多定制需求,可以联系客服邮箱。

4.数字人形象怎么更新?

答:目前开源的主要提供公共模特,有需求可以定制

5.形象克隆有API接口么?

答:训练服务目前只支持部署在我们的内部服务器进行调用

6.播报的wav文件,支持流式数据吗?

答:流式驱动正在做改造优化,暂时还不支持;

7.播报开始结束有没有相关回调方法?

答:播报开始结束的回调方法详见sdk文档

8.数字人动作有没有相关api控制?

答:数字人动作API,暂时还不支持

9.下载的文件如何替换?

答:下载文件的替换详见代码

商业案例展示 Business case presentation

 

https://apps.apple.com/us/app/duix-your-ai-companion/id6451088879 DUIX

与DUIX相关工具

SadTalker

SadTalker

SadTalker 是由西安交通大学(西交大)开源的项目。它是一个用于生成风格化的单图说话人脸动画的工具,可以根据输入的图片和音频生成对应音频口型的视频。用户可以给模型一张图片以及一段音频文件,模型会根据音频文件把传递的图片进行人脸的相应动作,比如张嘴、眨眼、移动头部等。它可以从音频中生成3DMM的3D运动系数(头部姿势、表情),并隐式调制一种新颖的3D感知面部渲染,用于生成说话的头部运动视频。
EchoMimic

EchoMimic

EchoMimic是阿里巴巴达摩院开发的一项AI数字人开源项目,能够通过音频和面部标志点生成高度逼真的肖像动画。无论是单独使用音频或面部标志点,还是将两者结合,EchoMimic都能创造出自然流畅的动态视频。能够通过给定的音频和一张面部照片,生成与音频口型动作匹配的说话或者唱歌视频,做口播视频或者趣味唱歌视频都可以。该技术在娱乐、教育、虚拟现实和在线会议等领域有广泛应用前景。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...