
Spark-TTS
Spark-TTS是SparkAudio团队开源的基于大型语言模型(LLM)的高效文本转语音(TTS)工具,无需额外的生成模型,直接从LLM预测的编码中重建音频,实现零样本文本到语音的转换。Spark-TTS支持中英双语,具备跨语言合成能力,可通过参数调整(如性别、音调、语速)生成虚拟说话者的声音,满足多样化需求。
蘑兔听记是深圳制片帮网络科技有限公司研发的音视频转文字工具,超98%的语音识别准确率,30分钟音频只需3分钟就可转成文字,支持20多种方言、30余种外语,极大提高了工作和学习效率。

蘑兔听记 – 制片帮推出的实时音视频转文字工具
第一步:在搜索引擎上搜索“蘑兔听记”,找到网站入口,网址:https://tingji.movtool.com/

第二步:点击进入蘑兔听记网站,登录账号后,选择需要处理的文件上传;上传成功后,点击右下角的“提交转写”,耐心等待(速度还是很快的);转写完成后,在在当前可以看到转写后的文件,点击“点击查看”会进入到内容详情界面,在这里可以看到详细的文字内容;

第三步:最后选择复制或者导出,导出的是一个压缩文件,解压后是word格式的文档,打开word文档后,可以进行编辑校正。

本站新媒派提供的蘑兔听记内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2024年11月11日 上午10:38收录时,该网页上的内容,都属于合规合法,后期网页的内容如有出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。





