kokoroTTSKokoro TTS是一款拥有 8200 万参数的先进文本转语音模型,基于 StyleTTS 2 架构,提供高质量、自然的语音合成。支持多语言,包括英语、法语、韩语、日语和普通话。适用于有声书、播客、培训视频等多种应用场景。Kokoro TTS 是开源的,具备高效、实时处理的特点,适用于各种环境中的语音合成需求。07.6K0AI音频工具# AI语音合成工具# Kokoro TTS# 开源TTS模型
VoxCPMVoxCPM是由面壁智能(ModelBest) 联合 清华大学深圳国际研究生院人机语音交互实验室(THUHCSI) 开发并开源的无分词器文本转语音(Tokenizer-Free TTS)系统。 它采用端到端扩散自回归架构(Diffusion Autoregressive),直接从文本生成连续语音表示,突破了传统离散标记化方法的限制,在自然度、表现力和音色还原度上有显著提升。03.2K0AI大模型# AI语音生成模型# VoxCPM# 开源TTS模型