
VoxCPM
VoxCPM是由面壁智能(ModelBest) 联合 清华大学深圳国际研究生院人机语音交互实验室(THUHCSI) 开发并开源的无分词器文本转语音(Tokenizer-Free TTS)系统。 它采用端到端扩散自回归架构(Diffusion Autoregressive),直接从文本生成连续语音表示,突破了传统离散标记化方法的限制,在自然度、表现力和音色还原度上有显著提升。
DDColor是阿里达摩院研究的一种基于深度学习的图像上色模型,它可以自动将黑白或灰度图像着色,使图像更加生动逼真。它使用了双解码器技术,能够同时考虑色彩分布和像素级详细信息,实现高度真实的图像上色效果。它还利用多尺度视觉特征和颜色损失来提高着色的语义合理性和颜色丰富性。

DDColor的黑白上色测试效果:

本站新媒派提供的DDColor内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年1月27日 下午8:25收录时,该网页上的内容,都属于合规合法,后期网页的内容如有出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。






