您的位置:首页 > 经济 > 第二产业 > 工业 工业
打造领先的机器听觉
作者:王京生, 樊建平主编 ; 杨柳著 来源:《粤港澳大湾区战略性新兴产业研究. 人工智能卷》 责任编辑:forever 2022-12-12 人已围观
在政策方面,我国也在大力推动智能语音的发展。2017 年 12 月 14 日, 工信部印发《促进新一代人工智能产业发展三年行动计划(2018—2020 年)》,明确对智能语音的发展做出展望 :“到 2020 年,实现多场景下中文 语音识别平均准确率达到 96%,5 米远场语音识别率超过 92%,用户对话 意图识别准确率超过 90%。”
其实,当下无噪声环境下的近场语音识别已经达到了非常高的识别率, 但是真实环境下必然会受到噪声的干扰,要提高嘈杂环境下的语音识别率, 难点和重点就在于将人声与噪声进行分离。 大象声科研发团队提出的这种通用的单通道实时降噪方法,首次将计 算听觉场景分析理论和深度学习结合起来,将声源问题变成一个监督学习 问题,让机器通过深度学习的方式不断提高精度,不断接近理想二值模, 在声音还未重叠之前计算出来,不管噪声比目标的声音强多少倍,都能将 目标声音分离出来,从而实现实时降噪的功能。
助听器可成为常规随身标配
传统的助听器已经存在 100 多年了,全球排名靠前的 6 家助听器企业 是德国的西门子、瑞士峰力、丹麦瑞声达、丹麦奥迪康、丹麦唯听、美国斯达克,这 6 家企业都已经进入了中国市场。 中国有 180 多万听障患者需要使用助听器,但只有少部分人使用了助 听器,一方面是因为国内市场被价格昂贵的国外产品占领,洋品牌助听器动辄上万元 ;另一方面是因为,令很多潜在用户犹豫的最大问题是助听器 并不能区分同时发生的声音,如人的语音和汽车经过的声音。助听器同时 将两者音量调大,产生乱七八糟的音调,给佩戴者造成很大的困扰。
苗健彰认为“鸡尾酒会问题”这个行业难题,可通过深度神经网络的 机器学习来解决。将基于深度神经网络的机器学习应用到分离声音的任务 上,研制出的数字滤波器不仅可以放大声音,还可以隔离背景噪声和自动 调整每种声音的音量。“现有的助听器有一个最大问题,就是不能在噪声 环境下佩戴,降噪功能非常差,大象声科的技术在这方面将发挥巨大作用。
未来,助听器有望成为随时随地佩戴使用的可穿戴设备,而且除了听障患者外,普通人也可以佩戴,比如工地工人、KTV 服务员等,在噪声很大 的环境下进行沟通的时候可以帮助他们听得更加清晰准确。” 世界卫生组织估计,全世界有 15%的成年人(或大约 7.66 亿人)患有 听力障碍。随着人口增长,这一数字还将继续增大 ;而且在成年人群中,年 纪越大的人听力受损者所占的比例也越大。
这一切都是巨大的潜在市场。根 据在印度浦那市的市场研究公司 MarketsandMarkets 统计,目前 60 亿美 元的全球助听器产业市场预计将以 6%的年增长率增长,这一趋势将持续到 2020 年。但是要满足所有新客户的要求,就意味着要寻找到一个能够解决“鸡 尾酒会问题”的万全解决方法。
很赞哦! ( )
上一篇:太赫兹智能光电赋能传统行业
下一篇:矢量声学给机器装上敏锐耳朵
评论
0