新华网
【行业信息】支持30种方言混说 中国电信发布语音大模型-新华网
信息

【行业信息】支持30种方言混说 中国电信发布语音大模型

2024-05-27 21:19:31 来源: 中国电信福建公司
字体:

  近日,中国电信人工智能研究院(TeleAI)发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言。

  构建高质量方言数据库,是方言保护和研究的基础。当前,中国电信人工智能研究院已构建超30种、超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等层面均居于业内前列。

  中国电信人工智能研究院坚持自主研发创新,推出星辰语音大模型,通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别;研发团队首创“蒸馏+膨胀”联合训练算法,实现1B参数80层模型稳定训练;星辰语音大模型也是业内首个开源的基于离散语音表征的语音识别大模型,通过“从语音到token再到文本”的建模新范式,将推理时语音传输比特率降低数十倍。

  据悉,星辰语音大模型已广泛应用落地。星辰语音大模型已在福建、江西、广西、北京等地的中国电信万号智能客服试点应用。接入星辰大模型以后,万号智能客服秒懂30种方言,自然流畅地服务用户,实现日均处理约200万通电话。此外,星辰语音大模型还落地多地市的12345平台,赋能客服人员秒懂30种方言,更自然流畅理解更多市民需求,助力政务工作智能化升级。

  星辰语音大模型现已对外开源,携手合作伙伴及个人开发者,开发面向更多场景的应用,共同守护方言、传承语言文化,助力AI普惠。

[责任编辑:连雨欣]