您的位置：首页 > 经济 > 第二产业 > 工业工业

打造领先的机器听觉

作者：王京生, 樊建平主编 ; 杨柳著来源：《粤港澳大湾区战略性新兴产业研究. 人工智能卷》责任编辑：forever 2022-12-12 人已围观

在政策方面，我国也在大力推动智能语音的发展。2017 年 12 月 14 日，工信部印发《促进新一代人工智能产业发展三年行动计划（2018—2020 年）》，明确对智能语音的发展做出展望：“到 2020 年，实现多场景下中文语音识别平均准确率达到 96%，5 米远场语音识别率超过 92%，用户对话意图识别准确率超过 90%。”

其实，当下无噪声环境下的近场语音识别已经达到了非常高的识别率，但是真实环境下必然会受到噪声的干扰，要提高嘈杂环境下的语音识别率，难点和重点就在于将人声与噪声进行分离。大象声科研发团队提出的这种通用的单通道实时降噪方法，首次将计算听觉场景分析理论和深度学习结合起来，将声源问题变成一个监督学习问题，让机器通过深度学习的方式不断提高精度，不断接近理想二值模，在声音还未重叠之前计算出来，不管噪声比目标的声音强多少倍，都能将目标声音分离出来，从而实现实时降噪的功能。

助听器可成为常规随身标配

传统的助听器已经存在 100 多年了，全球排名靠前的 6 家助听器企业是德国的西门子、瑞士峰力、丹麦瑞声达、丹麦奥迪康、丹麦唯听、美国斯达克，这 6 家企业都已经进入了中国市场。中国有 180 多万听障患者需要使用助听器，但只有少部分人使用了助听器，一方面是因为国内市场被价格昂贵的国外产品占领，洋品牌助听器动辄上万元；另一方面是因为，令很多潜在用户犹豫的最大问题是助听器并不能区分同时发生的声音，如人的语音和汽车经过的声音。助听器同时将两者音量调大，产生乱七八糟的音调，给佩戴者造成很大的困扰。

苗健彰认为“鸡尾酒会问题”这个行业难题，可通过深度神经网络的机器学习来解决。将基于深度神经网络的机器学习应用到分离声音的任务上，研制出的数字滤波器不仅可以放大声音，还可以隔离背景噪声和自动调整每种声音的音量。“现有的助听器有一个最大问题，就是不能在噪声环境下佩戴，降噪功能非常差，大象声科的技术在这方面将发挥巨大作用。

未来，助听器有望成为随时随地佩戴使用的可穿戴设备，而且除了听障患者外，普通人也可以佩戴，比如工地工人、KTV 服务员等，在噪声很大的环境下进行沟通的时候可以帮助他们听得更加清晰准确。” 世界卫生组织估计，全世界有 15％的成年人（或大约 7.66 亿人）患有听力障碍。随着人口增长，这一数字还将继续增大；而且在成年人群中，年纪越大的人听力受损者所占的比例也越大。

这一切都是巨大的潜在市场。根据在印度浦那市的市场研究公司 MarketsandMarkets 统计，目前 60 亿美元的全球助听器产业市场预计将以 6％的年增长率增长，这一趋势将持续到 2020 年。但是要满足所有新客户的要求，就意味着要寻找到一个能够解决“鸡尾酒会问题”的万全解决方法。

2/5 首页上一页 1 2 3 4 5 下一页尾页

很赞哦！ ( )

上一篇：太赫兹智能光电赋能传统行业

下一篇：矢量声学给机器装上敏锐耳朵