京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1185|回复: 0

在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快 ...

[复制链接]

1676

主题

740

回帖

6929

积分

论坛元老

积分
6929
发表于 2023-5-12 11:20:26 | 显示全部楼层 |阅读模式 来自 江苏苏州
(原标题:在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快”(经济新方位·支持民营经济发展))                    ) v6 r  }+ d0 f! j9 L! I4 U
                                        & c1 W6 `2 @5 A6 p6 d  K

% P) k# M: a7 D( V0 v  K制图:沈亦伶% Z+ Q6 ?$ j" K- t9 ?% k) D! Q2 S
企业是科技创新的主体。习近平总书记强调:“有能力、有条件的民营企业要加强自主创新,在推进科技自立自强和科技成果转化中发挥更大作用。”
+ A3 G' v( n* g) v- b越来越多的民营企业创新步伐不断加快,成为推动经济高质量发展的重要力量。在安徽合肥,记者走进国家智能语音创新中心。这是工业和信息化部2021年批复组建的4家国家制造业创新中心之一,由科大讯飞牵头,依托合肥智能语音创新发展有限公司,国内10多家智能语音企业和科研院所联手组建而成。中心与企业联动,充分发挥科技创新驱动作用,不断促进创新链产业链深度融合,为生产生活带来更多想象空间。
% ~: @% W! L$ h  `! S% I9 ]* o" }助生产提质增效——
+ k" Q9 s2 {' y1 y. U“智能耳朵”将质检效率提高2/3" s& \/ c4 k5 z8 z. a" n( w' ]2 H
浙江捷昌线性驱动科技股份有限公司主营电机生产。“在传统工业场景中,电机设备一旦出现故障,发出异常声音,通常都是经验丰富的老师傅用耳朵听,来判断故障点。”公司新昌生产基地生产总监张巍峰介绍:“我们实现了电机在流水线组装完成后,通过声纹质检系统检测采集产品运转数据。”
; _  l( I, X/ L一款系统,如何通过声音识别产品质量?" \8 r9 }) L7 F* s2 J' U
静音房中,电机运转,嗡嗡声响接连不断;显示屏上,声纹起伏,数据被采集捕捉;存在故障,通过数据分析,维修点位随即可以确定。一直以来,张巍峰都在琢磨怎样通过机器“听音”提高质检效率,“自个儿摸索两三年,没有取得一点进展”。- {- v* Y# t0 v- ?' s
机缘巧合,一次技术推介会上,得知国家智能语音创新中心正在开展工业声学方向的研究,张巍峰当即寻求合作:“我们有需求,他们懂技术,优势互补,说不定能研发出来。”
4 W% _" d- X" y: `# `) Y研发初期,中心委派的声纹分析工程师入厂调研,收集样本;质检工人现场听音,记录特征。6个多月时间,采集近5万条数据,算法选型、深度学习、参数调节,经过与人工听音多轮比拼试验,工业声纹质检系统初步建成。1 O8 v. l" I( r  o, _
国家智能语音创新中心总经理吴江照介绍,利用工业声学技术开展设备质检,除了民营企业自主创新,还离不开科研院所的大力支持。“发声位置、距离远近都会对收音造成影响,为了解决工业领域的麦克风阵列分布问题,我们和西北工业大学科研团队开展交流,共同探讨技术方案。”吴江照说。
. M2 G' ]! i* v# L) W: w7 Z5 Q如今,这款“智能耳朵”已在产线投用,质检识别准确率达到95%。“一次联合研发,仅一条产线每年就能为我们节省成本近15万元!”张巍峰算了笔账,过去人工听音,易因疲劳而失准,现在使用工业声纹质检系统,不仅效率提高2/3,还增强了一致性。曾经难以分辨的齿轮或换向器故障点,通过声纹数据分析,有了改进方向。( o: B2 L: R* w/ ^, m
让生活智慧便捷——
$ G. D5 a; b& n( h* n* o1 ?' C( a“全屋智控”识别用户指令更精准精确
5 k+ E/ ]! G" N6 o) r4 W4 l: x一进门,灯光自动点亮,空调自行开启;一句语音指令,舒缓的音乐在耳边响起,阳台上的晾衣架开始升降;厨房里,感应装置监测到煤气泄漏,既能报警,还会开窗……走进合肥荣事达电子电器集团智能全屋体验生活馆,研发中心技术人员孙杰指向巴掌大小的控制面板:“能集中控制空调、音箱、窗帘等,启动各种智能情景。”
: t1 g8 U% x$ B/ T8 T一块屏幕,如何实现“全屋智控”?
$ g/ Y. X- v+ X8 g5 }6 E$ R1 x( g$ U从传统的按键控制到智能的语音交互,为实现多款产品集成,孙杰带领团队与国家智能语音创新中心一道攻关,花了约一年时间。( k0 u) C2 z3 X% r
首先要解决的,是用户反映最多的“免唤醒”功能。孙杰介绍,唤醒词是为了激活设备进入运行状态,一般来说,唤醒词说出后,若能立刻给出反应,有利于提升用户体验。可如果每次使用智能设备都需要唤醒词,也会造成交互冗余,增添麻烦。
2 o* b$ ?: j4 X* O为此,企业结合市场调研,分析常用指令,中心则利用声学技术,提供算法支持。通过具有AI(人工智能)交互能力的语音芯片加持,这款控制面板可以实现一分钟内“一次唤醒,多轮交互”。; S5 e6 [* N& `2 w( I9 e" B* Y
“误操作”是横在面前的另一道难题。“居家生活时,经常出现闲聊触发关键词、设备作出响应的情况,尤其是在开发‘免唤醒’功能后。”中心AI语音芯片部研发总监周正友介绍。- C3 e0 @  B+ c+ q8 U8 ^3 {
是否可以通过识别声音、判断方向,进而给出正确回应?为了解决这个难题,周正友和同事们根据波速强度,算法分析音频,经过多次试验,系统识别准确度大幅提升。
( x* s( u5 b* y" V眼下,除了智能家居,这款具有语音交互功能的面板产品还被应用到其他领域。“医院、养老院、办公室等商用客户也很感兴趣!”孙杰表示,企业与中心联合攻关,既增强了创新能力,还开拓了应用市场。5 p& m8 {, @0 q' s7 K% x; [
为创新提供支撑——
+ u* s  ?2 ]+ R) `/ DAR字幕眼镜带来“看得见的声音”
6 d( F# p! A+ z: m$ a1 _* j8 f耳边,交流声音不断,眼前,文字逐句呈现。这让弱听患者刘烁感觉不错:“跟看剧一样!戴上眼镜,声音就能转化成文字显示在眼前,还可以调节字体大小、背景颜色,丝毫不影响视线。”
% A4 {, u: }( G1 l7 j这款AR(增强现实)字幕眼镜,由北京亮亮视野科技有限公司与国家智能语音创新中心联合研发,具备实时转写、语音翻译等功能,已为5000多名弱听患者带来“看得见的声音”。
" h5 ~% i7 h3 m: g# e' i/ W5 t5 F面向市场需求,兼具技术基础,新品研发按说应该很顺利。令亮亮视野系统研发部总监赵伟没想到的是,技术迁移并不简单。“我们想的是把眼镜和声学技术相结合,增强用户体验,可眼镜收集声音后,难以依托眼镜本体算力进行转写。”赵伟思来想去,决定“上云”一试。
8 a8 ]* [( [3 }9 d  f0 v这朵“云”,是国家智能语音创新中心构建的端云一体语音云平台,为金融、医疗、智能交通等领域企业提供技术服务,助力企业高效稳定运营,日交互量达20亿次。: B3 M3 G$ X$ z9 ~% l1 Z6 y
近半年时间里,赵伟在合肥、北京两地奔走,从拾音降噪到接入“云端”,企业、中心协同创新。如何精准识别人声?科研人员调节上千次麦克风阵列组合,确定声音增益最佳范围。怎样确保转写迅速稳定?技术人员将数据接入云平台,提供响应及时的算力支撑。
  Q, z) a+ \2 w1 b- g. r“简化操作步骤、调节字幕位置,产品去年研发成功以来,软件前后更新了三四个版本。现在,我们正在和中心讨论,如何增加语音控制开关功能,让用户操作更加便捷。”赵伟说。
, X8 D# G+ K/ W7 a近年来,为支持智能语音产业发展,工信部批复组建国家智能语音创新中心,给予专项支持;2021年,安徽省印发《支持中国声谷创新发展若干政策》,鼓励人工智能及智能语音产业发展和推广应用,引导企业协同创新发展。“政府有政策,企业有场景、有需求,中心有技术、有实力。依托这样的创新合作形式,可以更有效实现资源联动。创新链产业链深度融合,步伐更快。”吴江照说。* C, [, {0 C4 `8 @: N

3 [1 f2 R7 Q2 P& v6 a                    

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-12-18 01:01 , Processed in 0.045019 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表