FireRedASR

1年前发布 4.2K 00

工具介绍:FireRedASR是一款由FireRedTeam开发的开源工业级自动语音识别(ASR)模型,支持普通话、中文方言和英语。它在公开的普通话 ASR 基准测试中取得了新的最优结果,并且在歌词识别方面表现出色。

收录时间:
2025-02-18

FireRedASR简介

FireRedASR是一款由FireRedTeam开发的开源工业级自动语音识别(ASR)模型,支持普通话、中文方言和英语。它在公开的普通话 ASR 基准测试中取得了新的最优结果,并且在歌词识别方面表现出色。

FireRedASR

主要特点

  • 多模型支持:FireRedASR 包括两个变体:FireRedASR-LLM 和 FireRedASR-AED。FireRedASR-LLM 采用编码器-适配器-大型语言模型 (LLM) 架构,旨在实现端到端的语音互动。FireRedASR-AED 采用注意力机制的编码器-解码器 (AED) 架构,旨在平衡高性能和计算效率。
  • 高性能: 在公开的普通话基准测试中,FireRedASR-LLM (8.3B 参数) 的平均字符错误率 (CER) 为 3.05%,超过最新的最优结果。 FireRedASR-AED (1.1B 参数) 的平均 CER 为 3.18%,虽然略低于 FireRedASR-LLM,但仍优于最新的最优模型。
  • 多语言和多任务能力: FireRedASR 在中文方言和英语的 ASR 测试中也表现出色,并在歌词识别方面表现突出。
  • 开源与社区支持: FireRedASR 的模型和推理代码已经开源,用户可以在 GitHub 上获取和使用。

FireRedASR的应用场景

  • 智能语音交互:FireRedASR可以应用于智能语音助手、语音输入法等场景,提供高精度的语音识别服务。
  • 多媒体内容理解:FireRedASR在视频字幕生成、歌词识别等多媒体内容理解场景中表现出色。
  • 日常场景应用:FireRedASR在短视频、直播、语音输入和智能助手等多种日常场景下表现出色,与业内领先的ASR服务提供商和Paraformer-Large相比,CER相对降低23.7%~40.0%。

FireRedASR相关链接:

  • 项目地址:https://github.com/FireRedTeam/FireRedASR
  • 论文地址:https://arxiv.org/abs/2501.14350

FireRedASR官网无法访问的常见原因及解决方案

如果你经常打不开FireRedASR网站,最可能的原因有以下一些。别怕,还有办法帮助你顺利访问网站。

一、可能被软件屏蔽:部分应用,如微信、QQ 等自带的浏览应用可能就屏蔽了部分网址不让打开。

解决方案:采用自己手机的浏览器打开该网址,如Safari、Chrome等,而不是用微信或QQ的浏览器。

二、浏览器拦截:有时浏览器会错误地将网站判断成不安全、为不良网站而封锁。实际上,这并不一定意味着网站有问题,是因为浏览器厂商在其封锁列表之中的缘故。

解决方案:通过其它浏览器可能打开,例如:iphone用户Safari,windows用户(微软),Edge。推荐独立浏览器:Alook浏览器、X 浏览器、VIA 浏览器等

三、网络连接问题:如果你的网络速度比较慢,或所在运营商没有对该网站进行最佳化,也会出现无法打开的情况。

解决方案:切换到其他网络环境(wifi、移动数据等)用网络加速器让访问更顺畅科学上网(如访问 google 网站)

以上方法应该能解决99.99%网站打不开了。如果这些也无济于事,你可以留言咨询或微信联系我们进行寻求帮助!

关于FireRedASR特别声明

本站新媒派提供的FireRedASR内容都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由新媒派实际控制,在2025年2月18日 下午8:56收录时,该网页上的内容,都属于合规合法,后期网页的内容如有出现违规,可以直接联系网站管理员进行删除,新媒派不承担任何责任。

相关导航

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...