|
(原标题:在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快”(经济新方位·支持民营经济发展)) * Y0 X: O% ]( {: t
7 T( V# D+ l$ J* L0 J
5 H) k" w4 G& e0 n# f制图:沈亦伶
& c8 ~: [# n2 ]! x E) |1 A企业是科技创新的主体。习近平总书记强调:“有能力、有条件的民营企业要加强自主创新,在推进科技自立自强和科技成果转化中发挥更大作用。”
; |. ]1 ^; r4 g1 v越来越多的民营企业创新步伐不断加快,成为推动经济高质量发展的重要力量。在安徽合肥,记者走进国家智能语音创新中心。这是工业和信息化部2021年批复组建的4家国家制造业创新中心之一,由科大讯飞牵头,依托合肥智能语音创新发展有限公司,国内10多家智能语音企业和科研院所联手组建而成。中心与企业联动,充分发挥科技创新驱动作用,不断促进创新链产业链深度融合,为生产生活带来更多想象空间。
4 Z3 u P6 ?9 `# t' ?, U助生产提质增效——
& N2 ]$ S+ @$ |" n; \7 B* q S“智能耳朵”将质检效率提高2/3
; Y' j6 l+ H, J浙江捷昌线性驱动科技股份有限公司主营电机生产。“在传统工业场景中,电机设备一旦出现故障,发出异常声音,通常都是经验丰富的老师傅用耳朵听,来判断故障点。”公司新昌生产基地生产总监张巍峰介绍:“我们实现了电机在流水线组装完成后,通过声纹质检系统检测采集产品运转数据。”# h2 Z& ]8 _& r- c+ ~
一款系统,如何通过声音识别产品质量?* m' y6 K/ e# T" \* C
静音房中,电机运转,嗡嗡声响接连不断;显示屏上,声纹起伏,数据被采集捕捉;存在故障,通过数据分析,维修点位随即可以确定。一直以来,张巍峰都在琢磨怎样通过机器“听音”提高质检效率,“自个儿摸索两三年,没有取得一点进展”。! N4 Q4 U! v% R. ^8 s) L
机缘巧合,一次技术推介会上,得知国家智能语音创新中心正在开展工业声学方向的研究,张巍峰当即寻求合作:“我们有需求,他们懂技术,优势互补,说不定能研发出来。”
( @1 ~) J# ^( f u研发初期,中心委派的声纹分析工程师入厂调研,收集样本;质检工人现场听音,记录特征。6个多月时间,采集近5万条数据,算法选型、深度学习、参数调节,经过与人工听音多轮比拼试验,工业声纹质检系统初步建成。5 u& x) n S9 Q |+ r/ M6 E% e
国家智能语音创新中心总经理吴江照介绍,利用工业声学技术开展设备质检,除了民营企业自主创新,还离不开科研院所的大力支持。“发声位置、距离远近都会对收音造成影响,为了解决工业领域的麦克风阵列分布问题,我们和西北工业大学科研团队开展交流,共同探讨技术方案。”吴江照说。" U1 E) Q6 o* h( m! e
如今,这款“智能耳朵”已在产线投用,质检识别准确率达到95%。“一次联合研发,仅一条产线每年就能为我们节省成本近15万元!”张巍峰算了笔账,过去人工听音,易因疲劳而失准,现在使用工业声纹质检系统,不仅效率提高2/3,还增强了一致性。曾经难以分辨的齿轮或换向器故障点,通过声纹数据分析,有了改进方向。$ Q- s" b# z. A6 M6 X6 o
让生活智慧便捷——
8 o0 g& C) j+ R S8 z& y“全屋智控”识别用户指令更精准精确1 {) r+ E8 h( M4 K% i
一进门,灯光自动点亮,空调自行开启;一句语音指令,舒缓的音乐在耳边响起,阳台上的晾衣架开始升降;厨房里,感应装置监测到煤气泄漏,既能报警,还会开窗……走进合肥荣事达电子电器集团智能全屋体验生活馆,研发中心技术人员孙杰指向巴掌大小的控制面板:“能集中控制空调、音箱、窗帘等,启动各种智能情景。”7 V8 n& O6 a) R- \6 G/ \' @
一块屏幕,如何实现“全屋智控”?
?$ q4 T$ q8 a4 o从传统的按键控制到智能的语音交互,为实现多款产品集成,孙杰带领团队与国家智能语音创新中心一道攻关,花了约一年时间。% i% ^: o; D1 @
首先要解决的,是用户反映最多的“免唤醒”功能。孙杰介绍,唤醒词是为了激活设备进入运行状态,一般来说,唤醒词说出后,若能立刻给出反应,有利于提升用户体验。可如果每次使用智能设备都需要唤醒词,也会造成交互冗余,增添麻烦。0 D4 Q. J) K# h& P7 ?
为此,企业结合市场调研,分析常用指令,中心则利用声学技术,提供算法支持。通过具有AI(人工智能)交互能力的语音芯片加持,这款控制面板可以实现一分钟内“一次唤醒,多轮交互”。# q1 i6 o7 b) D/ Q r$ n- o
“误操作”是横在面前的另一道难题。“居家生活时,经常出现闲聊触发关键词、设备作出响应的情况,尤其是在开发‘免唤醒’功能后。”中心AI语音芯片部研发总监周正友介绍。2 r# D P* M D" T
是否可以通过识别声音、判断方向,进而给出正确回应?为了解决这个难题,周正友和同事们根据波速强度,算法分析音频,经过多次试验,系统识别准确度大幅提升。 {1 @1 `* D8 Y5 J3 I9 P
眼下,除了智能家居,这款具有语音交互功能的面板产品还被应用到其他领域。“医院、养老院、办公室等商用客户也很感兴趣!”孙杰表示,企业与中心联合攻关,既增强了创新能力,还开拓了应用市场。
5 h0 x) w! ?5 h( ~) ~) _- Q5 g为创新提供支撑——- |4 C# V- x4 @4 L& q0 |% b+ D
AR字幕眼镜带来“看得见的声音”
0 y9 U( ]3 n; g+ T- L5 C耳边,交流声音不断,眼前,文字逐句呈现。这让弱听患者刘烁感觉不错:“跟看剧一样!戴上眼镜,声音就能转化成文字显示在眼前,还可以调节字体大小、背景颜色,丝毫不影响视线。”- j- O u" s2 F4 B
这款AR(增强现实)字幕眼镜,由北京亮亮视野科技有限公司与国家智能语音创新中心联合研发,具备实时转写、语音翻译等功能,已为5000多名弱听患者带来“看得见的声音”。$ t. N, m* N" W s5 d' |
面向市场需求,兼具技术基础,新品研发按说应该很顺利。令亮亮视野系统研发部总监赵伟没想到的是,技术迁移并不简单。“我们想的是把眼镜和声学技术相结合,增强用户体验,可眼镜收集声音后,难以依托眼镜本体算力进行转写。”赵伟思来想去,决定“上云”一试。* l/ O4 c( [0 N5 S: E
这朵“云”,是国家智能语音创新中心构建的端云一体语音云平台,为金融、医疗、智能交通等领域企业提供技术服务,助力企业高效稳定运营,日交互量达20亿次。
- i7 x1 x; J& d+ @% y' p近半年时间里,赵伟在合肥、北京两地奔走,从拾音降噪到接入“云端”,企业、中心协同创新。如何精准识别人声?科研人员调节上千次麦克风阵列组合,确定声音增益最佳范围。怎样确保转写迅速稳定?技术人员将数据接入云平台,提供响应及时的算力支撑。( W" {- W4 s2 t8 w# p$ g% E. s6 h- Z
“简化操作步骤、调节字幕位置,产品去年研发成功以来,软件前后更新了三四个版本。现在,我们正在和中心讨论,如何增加语音控制开关功能,让用户操作更加便捷。”赵伟说。6 A+ n( K& d$ M6 w l0 f
近年来,为支持智能语音产业发展,工信部批复组建国家智能语音创新中心,给予专项支持;2021年,安徽省印发《支持中国声谷创新发展若干政策》,鼓励人工智能及智能语音产业发展和推广应用,引导企业协同创新发展。“政府有政策,企业有场景、有需求,中心有技术、有实力。依托这样的创新合作形式,可以更有效实现资源联动。创新链产业链深度融合,步伐更快。”吴江照说。
2 ?& ^. t1 @: w- _3 G4 ]' A' E `4 @3 b& H% r2 X
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|