
日前,OpenASR国际低资源多语种语音识别挑战赛落下帷幕,科大讯飞—中科大语音及语言信息处理国家工程实验室联合团队参加了所有15个语种受限赛道和7个语种非受限赛道,全部取得第一。

继前不久荣获多语言理解评测XTREME冠军之后,科大讯飞在多语种领域再次取得突破,在探索人机交互更自然,人人沟通无障碍的征程中又迈出了坚实的一步。
最近几年来,伴随着深度学习技术的进步,汉语,英语等大语种语音识别技术日趋成熟,并获得广泛的应用相比之下,小语种语音识别因其语音数据资源难以获取,难以标注,难以评估,语言专家稀缺等原因,已经成为世界性的研究难题,距离实用门槛仍有较大差距
OpenASR挑战赛更加关注小语种语音技术,探索如何使用少量的数据达到较好的效果,同时考察低资源语音识别基础算法在多个语种上的推广性本次比赛共包含15个语种,涵盖受限赛道,受限附加赛道和非受限赛道科大讯飞—中科大联合团队在比赛中提出了基于语音和文本统一空间表达的半监督语音识别框架,获此佳绩也验证了该算法良好的推广性
对于低资源语种而言,除了语音数据量较小外,其发音词典大小,语料丰富性,标注准确度都远不及常规水平科大讯飞—中科大联合团队创新运用Flow—TTS语音合成进行训练数据扩增,并使用语音属性解耦技术保证合成语音的多样性结果显示,使用上述无监督数据扩增方案,能够稳定,显著地提升低资源语音识别任务的效果
为了在端到端统一框架下,充分使用少量语音数据和海量文本数据,科大讯飞—中科大联合团队提出了基于语音和文本统一空间表达的半监督语音识别框架USRS—ASR对于海量文本数据的使用,创新设计了文本掩码语言模型任务,合成数据语音识别两个目标,两个任务联合训练以充分利用海量无监督文本,同时设计了共享语言解码模块,实现了语音和文本隐层表达空间的统一,大大缓解了低资源语种的数据稀疏问题
不久前,工信部正式批复同意成立国家智能语音创新中心,国家高端智能化家用电器创新中心,值得注意的是,在这两家国家级创新中心依托公司的股东名单中,科大讯飞均在列。要知道S11的观众是几千万,去年决赛同期观众最高的时候高达4595万。。
据介绍,经过多年的技术积累,除了中英以外,科大讯飞还具备了 69种语言的语音识别能力,并已在新加坡,俄罗斯,印度,日本等国家部署了海外站点,为各地开发者提供语音识别,语音合成,机器翻译,图文识别等语音语言服务,所有服务均在科大讯飞开放平台开放。
科大讯飞表示,下一步将继续坚持源头核心技术创新,联合国内众多研究机构与企业,构建多语言技术的系统性创新研发生态,共同推动我国多语言技术进步与应用落地。对于像这样的顶级赛事,保证音画质量的低延迟应该是各大平台的“基本操作”,哪怕是一点点额外的延迟也是绝对不能容忍的。
。声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
A股三大指数涨逾1%:券商股与地产股走强
纺织服装双周报202118期:消费有望边
宿迁:做好洋河、双沟等区域空间功能定位和
标志性的纺锤型中网已经成为雷克萨斯旗下车
《今日说法》节目由李晓东王嘉宁等主持
宏电大坝安全监测系统为小型水库拧紧“安全
e—POWER轩逸是目前东风日产首个使用
后杠部分的变化比较明显的重新设计的后扰流
正在进行的2021广州车展中全新奥迪A8
上汽大通全新车型MAXUSMIFA9上市
N鸥玛上午收盘涨169.19%半日成交5
远兴能源:公司采用天然碱法生产纯碱和小苏
为金河煤矿搭建了一座连通井上井下的安全桥
蓝色光标仍在持续接洽数十家品牌预计未来短
2021年中国能源产业年度最具创新力企业
马上消费金融AI智慧双录服务平台,获“十
来凤县第一期农村残疾人实用技术培训在三胡
均瑶健康荣获2021中经新消费“年度国潮
人家用打火机和蚊香就可以为所欲为的烧出画
11月19日广州车展将正式开幕届时坦克5欢迎广大网友来本网站投稿,网站内容来自于互联网或网友提供 邮箱:hchchc0324@163.com