加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS

您的位置:首页 > 名人 > 近现代人物 近现代人物

扫码关注

苗健彰:痴迷听得见的智能

作者:王京生, 樊建平主编 ; 杨柳著 来源:《粤港澳大湾区战略性新兴产业研究. 人工智能卷》 责任编辑:forever 2022-12-12 人已围观



▲大象声科AI 降噪技术在智能手机上的应用案例

大象声科希望成为新一代手机语音信号处理技术提供商,为手机通信 以及人机交互提供智能语音增强和智能语音交互服务,打造更清晰的机器 听觉体验。“由于手机覆盖的应用场景是各种硬件当中最多的,所以要让 基于深度学习技术的降噪解决方案在手机上得以应用,首要的其实是要解 决模型的泛化性能。我们在这方面投入了大量的研发工作,目前在保持模 型小型化的前提下,获得了最优的噪声环境覆盖。”苗健彰介绍道。

目前,大象声科的智能通话降噪解决方案已经支持包括高通骁龙平台在内的超过 10 种不同的软硬件平台。比如,高通骁龙 8 系列、7 系列和 6 系列平台。2018 年年底,在高通骁龙技术峰会上,大象声科和高通联合展 示了基于 855 最新旗舰平台的 Vocplus Telecom 智能通话降噪方案,通 过共同优化该方案在高通骁龙平台上的性能,进一步帮助代工厂商有效提 高软件移植效率,降低技术接入成本。

其实,这个智能通话降噪解决方案的用途相当广泛,从手机通信、云 通信,到在线教育、网络直播、音视频会议,再到改进助听器,都能提高 这些应用场景在噪声环境中的语音通话质量。这一技术可以让人们即使在 熙熙攘攘的街道上,也能毫无干扰、清晰地打电话 ;让人们在嘈杂的地铁上,也能不受环境干扰,清晰地与远在大洋彼岸的英语老师进行在线英语 对话练习 ;让听力障碍者再也不用忍受传统助听器的噪声太大的困扰,轻松地听清对方的讲话。

大象声科从成立以来,就想要解决的两大问题 :一是让“人”听得更 清楚,针对手机通信、云通信等领域所推出的智能通话降噪解决方案,能 够帮助用户过滤掉通话过程中的背景噪声,让语音通话更清晰 ;另一个是 让“机器”听得更清楚,为机器打造一双智能耳朵,赋予其更灵敏的机器 听觉。大象声科推出的智能语音交互解决方案,包含智能降噪、语音唤醒、 声纹识别等核心算法,能够为智能音箱、机器人、智能车载等行业带来更 清晰自然的语音交互体验。

人工智能作为互联网技术发展的下一个“风口”,带来的变革能量不亚 于工业革命。数据显示,目前在人工智能领域,计算机视觉占比 20.8%, 语音识别占比 10.7%,其中语音识别最受用户认可。在智能家居、智能机 器人、智能驾驶和个人助手等领域的进一步发展完善,都有赖于更加成熟 的语音识别技术。苗健彰谦逊地说 :“技术的追求是没有止境的,大象声 科目前已经验证了 CASA 可行性和深度学习在语音信号处理方面应用的前景,这也奠定了行业的发展趋势,但是距离实现机器像人类一样听声辨音 的理想,还任重道远。” “深圳作为中国电子信息产业重镇,凭借完善的产业链配套,在人工 智能领域拥有天然的优势和巨大的潜力。

很赞哦! ( )

评论

0

搜一搜