京东11.11大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1104|回复: 0

在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快 ...

[复制链接]

1676

主题

740

回帖

6929

积分

论坛元老

积分
6929
发表于 2023-5-12 11:20:26 | 显示全部楼层 |阅读模式 来自 江苏苏州
(原标题:在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快”(经济新方位·支持民营经济发展))                    
7 o6 u/ a* G* [, _# ?" i0 S. Q                                        0 W- W) l$ s  |( y& J5 p2 q1 G

( b8 S8 {; K! d4 Q9 [. ~$ L; b: a6 d1 N) h制图:沈亦伶
2 q! F2 S5 a0 }$ k+ x, S/ e9 H企业是科技创新的主体。习近平总书记强调:“有能力、有条件的民营企业要加强自主创新,在推进科技自立自强和科技成果转化中发挥更大作用。”
% ?/ {$ w1 b' m% y越来越多的民营企业创新步伐不断加快,成为推动经济高质量发展的重要力量。在安徽合肥,记者走进国家智能语音创新中心。这是工业和信息化部2021年批复组建的4家国家制造业创新中心之一,由科大讯飞牵头,依托合肥智能语音创新发展有限公司,国内10多家智能语音企业和科研院所联手组建而成。中心与企业联动,充分发挥科技创新驱动作用,不断促进创新链产业链深度融合,为生产生活带来更多想象空间。$ j6 q- X6 R" P9 T
助生产提质增效——1 `8 ]' D0 Q! ^. Y
“智能耳朵”将质检效率提高2/3" H) {  W3 i; I; k5 b0 t+ x8 k
浙江捷昌线性驱动科技股份有限公司主营电机生产。“在传统工业场景中,电机设备一旦出现故障,发出异常声音,通常都是经验丰富的老师傅用耳朵听,来判断故障点。”公司新昌生产基地生产总监张巍峰介绍:“我们实现了电机在流水线组装完成后,通过声纹质检系统检测采集产品运转数据。”3 h0 [5 J& m+ n; J
一款系统,如何通过声音识别产品质量?. w+ o! i" L& _5 p) n5 z" d
静音房中,电机运转,嗡嗡声响接连不断;显示屏上,声纹起伏,数据被采集捕捉;存在故障,通过数据分析,维修点位随即可以确定。一直以来,张巍峰都在琢磨怎样通过机器“听音”提高质检效率,“自个儿摸索两三年,没有取得一点进展”。; }- J9 }! j- m( U
机缘巧合,一次技术推介会上,得知国家智能语音创新中心正在开展工业声学方向的研究,张巍峰当即寻求合作:“我们有需求,他们懂技术,优势互补,说不定能研发出来。”- K' ^8 ?* ^" K9 q2 H9 m8 a/ j
研发初期,中心委派的声纹分析工程师入厂调研,收集样本;质检工人现场听音,记录特征。6个多月时间,采集近5万条数据,算法选型、深度学习、参数调节,经过与人工听音多轮比拼试验,工业声纹质检系统初步建成。
' Y! D( l% Q- w* D5 m  c* ^国家智能语音创新中心总经理吴江照介绍,利用工业声学技术开展设备质检,除了民营企业自主创新,还离不开科研院所的大力支持。“发声位置、距离远近都会对收音造成影响,为了解决工业领域的麦克风阵列分布问题,我们和西北工业大学科研团队开展交流,共同探讨技术方案。”吴江照说。
9 f9 v% m* C# _6 m6 N" ^/ |如今,这款“智能耳朵”已在产线投用,质检识别准确率达到95%。“一次联合研发,仅一条产线每年就能为我们节省成本近15万元!”张巍峰算了笔账,过去人工听音,易因疲劳而失准,现在使用工业声纹质检系统,不仅效率提高2/3,还增强了一致性。曾经难以分辨的齿轮或换向器故障点,通过声纹数据分析,有了改进方向。; B/ C: f! N7 M! o$ ^. l4 T$ _
让生活智慧便捷——
+ T) N4 q1 V3 W# r$ k“全屋智控”识别用户指令更精准精确
$ `$ l3 m/ z6 C# l2 t+ i一进门,灯光自动点亮,空调自行开启;一句语音指令,舒缓的音乐在耳边响起,阳台上的晾衣架开始升降;厨房里,感应装置监测到煤气泄漏,既能报警,还会开窗……走进合肥荣事达电子电器集团智能全屋体验生活馆,研发中心技术人员孙杰指向巴掌大小的控制面板:“能集中控制空调、音箱、窗帘等,启动各种智能情景。”
7 e  D* g$ G5 [一块屏幕,如何实现“全屋智控”?+ q7 k' m- ^+ C2 F
从传统的按键控制到智能的语音交互,为实现多款产品集成,孙杰带领团队与国家智能语音创新中心一道攻关,花了约一年时间。
3 X1 U8 Z3 |1 p2 t) l; t; e首先要解决的,是用户反映最多的“免唤醒”功能。孙杰介绍,唤醒词是为了激活设备进入运行状态,一般来说,唤醒词说出后,若能立刻给出反应,有利于提升用户体验。可如果每次使用智能设备都需要唤醒词,也会造成交互冗余,增添麻烦。) B  g9 y& N7 Y4 i" w! G
为此,企业结合市场调研,分析常用指令,中心则利用声学技术,提供算法支持。通过具有AI(人工智能)交互能力的语音芯片加持,这款控制面板可以实现一分钟内“一次唤醒,多轮交互”。8 A# ], s" G: ~7 a3 Y0 f' _
“误操作”是横在面前的另一道难题。“居家生活时,经常出现闲聊触发关键词、设备作出响应的情况,尤其是在开发‘免唤醒’功能后。”中心AI语音芯片部研发总监周正友介绍。8 |. ]9 C" A0 T7 ^, A6 k$ d
是否可以通过识别声音、判断方向,进而给出正确回应?为了解决这个难题,周正友和同事们根据波速强度,算法分析音频,经过多次试验,系统识别准确度大幅提升。
) ]7 E/ ~# i# {眼下,除了智能家居,这款具有语音交互功能的面板产品还被应用到其他领域。“医院、养老院、办公室等商用客户也很感兴趣!”孙杰表示,企业与中心联合攻关,既增强了创新能力,还开拓了应用市场。
! \8 }  `8 i+ x为创新提供支撑——
9 N: R" ^& Q" d2 r- P( v) cAR字幕眼镜带来“看得见的声音”+ i% c( P% j6 \! h. G7 T
耳边,交流声音不断,眼前,文字逐句呈现。这让弱听患者刘烁感觉不错:“跟看剧一样!戴上眼镜,声音就能转化成文字显示在眼前,还可以调节字体大小、背景颜色,丝毫不影响视线。”9 \4 b" w0 J8 L. Y
这款AR(增强现实)字幕眼镜,由北京亮亮视野科技有限公司与国家智能语音创新中心联合研发,具备实时转写、语音翻译等功能,已为5000多名弱听患者带来“看得见的声音”。0 ?2 `+ _3 m5 ?' j6 k+ [7 F- l
面向市场需求,兼具技术基础,新品研发按说应该很顺利。令亮亮视野系统研发部总监赵伟没想到的是,技术迁移并不简单。“我们想的是把眼镜和声学技术相结合,增强用户体验,可眼镜收集声音后,难以依托眼镜本体算力进行转写。”赵伟思来想去,决定“上云”一试。/ `- _$ H3 N: S3 o) G4 [
这朵“云”,是国家智能语音创新中心构建的端云一体语音云平台,为金融、医疗、智能交通等领域企业提供技术服务,助力企业高效稳定运营,日交互量达20亿次。* _& L: c. t) S. z, S
近半年时间里,赵伟在合肥、北京两地奔走,从拾音降噪到接入“云端”,企业、中心协同创新。如何精准识别人声?科研人员调节上千次麦克风阵列组合,确定声音增益最佳范围。怎样确保转写迅速稳定?技术人员将数据接入云平台,提供响应及时的算力支撑。
. i- M- h8 [( u“简化操作步骤、调节字幕位置,产品去年研发成功以来,软件前后更新了三四个版本。现在,我们正在和中心讨论,如何增加语音控制开关功能,让用户操作更加便捷。”赵伟说。/ F" E5 v5 Y- \  p. \
近年来,为支持智能语音产业发展,工信部批复组建国家智能语音创新中心,给予专项支持;2021年,安徽省印发《支持中国声谷创新发展若干政策》,鼓励人工智能及智能语音产业发展和推广应用,引导企业协同创新发展。“政府有政策,企业有场景、有需求,中心有技术、有实力。依托这样的创新合作形式,可以更有效实现资源联动。创新链产业链深度融合,步伐更快。”吴江照说。
! B) K$ Z" L$ c0 `; k' W0 L5 z3 Y
' z% ?5 Z- k3 X+ l' _' w                    

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )

GMT+8, 2025-2-25 10:43 , Processed in 0.037806 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表