Spark-TTS

Spark-TTS

Spark-TTS是SparkAudio团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具,无需额外的生成模型,直接从LLM预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。
08.1K0
UntitledPen

UntitledPen

UntitledPen是一个AI驱动的语音生成平台,帮你的内容打造最自然流畅的旁白。  基于最先进的 GPT 音频生成模型,支持多语言、高质量音频,适用于视频/播客/广告/教育培训等多种情景下的配音需求。并通过智能编辑器让文本优化更加便捷,支持 Markdown 格式,输出 128kbps 及以上的标准音质,确保音质清晰动听。
01K0