加入收藏 | 设为首页 | 会员中心 | 我要投稿 | RSS

您的位置:首页 > 名人 > 近现代人物 近现代人物

扫码关注

苗健彰:痴迷听得见的智能

作者:王京生, 樊建平主编 ; 杨柳著 来源:《粤港澳大湾区战略性新兴产业研究. 人工智能卷》 责任编辑:forever 2022-12-12 人已围观



究竟要从哪个细分领域切入呢?这个问题让他困惑,更让他着迷。 苗健彰看到,商汤科技成立不久即在全球计算机视觉领域声名鹊起 ; 作为机器视觉新锐的云天励飞 2015 年不仅获得了徐小平的天使投资,而 且获得了政府数千万元的支持。他观察到一个现象 :相比日益火热的机器 视觉产业,机器听觉领域的创业者要少得多,而听觉作为机器感知的一个 重要功能,显然还没有被更多创业者关注。科大讯飞是这个领域知名的开拓者。

那一年,科大讯飞发布了人机交互界面——AIUI,为用户提供语音 及人工智能交互服务。 苗健彰意识到,自己可以尝试进入机器听觉这个赛道,所以他拜访了 科大讯飞研究院院长,走访了多家沿海城市相关的科技企业,了解到机器听觉产业链上下游链条是如何配合的。机器听觉产业链上游是从信号处理、采集声音开始,再到将语音信号转化成文字,然后根据文字去理解意义, 即语义识别,最后到语音输出。

然而,前端信号处理的技术被国外几家公 司把控着,这块在国内还是空白。如何填补这个空白呢?苗健彰决定到美 国做技术调研。他本科学的是通信工程专业,通过他的大学同学,他幸运 地拜访到了这个领域的美国顶级教授汪教授。

“当我离开家去上大学时,我的母亲开始失去她的听力。我回家分享 我学到的东西,她会侧身倾听。很快发展到如果同时有多人说话她将很 难与人对话。现在,即使有了助听器,她仍然需要努力分辨每句话的声 音。当我的家人来用晚餐时,她仍然央求我们轮流和她说话。我母亲的 艰难处境也是助听器制造商所面临的一个典型问题。人类听觉系统能自 然地在嘈杂的房间中分辨目标声音,但是制造一个能模仿这种能力的助 听器已经困扰了信号处理专家、人工智能专家和听力学家数十年。1953 年, 英国认知科学家 Colin Cherry 首次将这称为‘鸡尾酒会问题’ (Cocktail Party Problem)。”

汪教授在 2016 年发表的一篇文章里如此写道。他从事 具备深度学习能力的助听器研究的时候,内心深处充满着对母亲的眷念和 关切,希望用所学的技术解决这个困扰听障患者的“鸡尾酒会问题”。当他面对这位面容清俊、充满创业激情的年轻人的来访,并真诚地邀请他作 为联合创始人的时候,汪教授觉得已经到了将这一技术产业化的时候了, 他可以把毕生所学转化成为实实在在的产品,帮助更多像母亲一样有听力障碍的人。

获得汪教授信任和嘱托的苗健彰,风尘仆仆回到深圳,于 2017 年 2 月在深圳南山留学生创业园注册成立大象声科,组织研发团队研究用深度 学习方法解决语音增强和语音交互的问题,目标是把汪教授 20 多年沉淀 的技术成果转化为成熟的科技产品,服务全社会。 2017 年 9 月,大象声科荣登清科“2017 中国最具投资价值企业 50 强” 榜单,并且首次亮相“2017 年中国国际信息通信展览会”,其领先的基于 深度学习的语音提取技术引起了业界的广泛关注。

很赞哦! ( )

评论

0

搜一搜