京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1137|回复: 0

在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快 ...

[复制链接]

1676

主题

740

回帖

6929

积分

论坛元老

积分
6929
发表于 2023-5-12 11:20:26 | 显示全部楼层 |阅读模式 来自 江苏苏州
(原标题:在国家智能语音创新中心看民企活力—— “创新链产业链深度融合,步伐更快”(经济新方位·支持民营经济发展))                    $ o8 z! N5 v  p: t
                                        3 i6 {2 K3 L7 n

/ ]9 v5 v+ s, P) c制图:沈亦伶
2 y4 {* T( ~/ Z7 I! E企业是科技创新的主体。习近平总书记强调:“有能力、有条件的民营企业要加强自主创新,在推进科技自立自强和科技成果转化中发挥更大作用。”
4 t7 J+ @' R- n7 {* D+ g( D越来越多的民营企业创新步伐不断加快,成为推动经济高质量发展的重要力量。在安徽合肥,记者走进国家智能语音创新中心。这是工业和信息化部2021年批复组建的4家国家制造业创新中心之一,由科大讯飞牵头,依托合肥智能语音创新发展有限公司,国内10多家智能语音企业和科研院所联手组建而成。中心与企业联动,充分发挥科技创新驱动作用,不断促进创新链产业链深度融合,为生产生活带来更多想象空间。* A  v& l2 d  s1 ]% X/ \7 }4 u
助生产提质增效——
9 B& D8 U' F9 x8 d, o“智能耳朵”将质检效率提高2/38 ~; E1 D, _# h. b5 W
浙江捷昌线性驱动科技股份有限公司主营电机生产。“在传统工业场景中,电机设备一旦出现故障,发出异常声音,通常都是经验丰富的老师傅用耳朵听,来判断故障点。”公司新昌生产基地生产总监张巍峰介绍:“我们实现了电机在流水线组装完成后,通过声纹质检系统检测采集产品运转数据。”% s4 g4 `/ r! b% s  p7 }
一款系统,如何通过声音识别产品质量?
/ D2 w: D' k* N& `静音房中,电机运转,嗡嗡声响接连不断;显示屏上,声纹起伏,数据被采集捕捉;存在故障,通过数据分析,维修点位随即可以确定。一直以来,张巍峰都在琢磨怎样通过机器“听音”提高质检效率,“自个儿摸索两三年,没有取得一点进展”。
! f, _: H, Q4 M) g: c机缘巧合,一次技术推介会上,得知国家智能语音创新中心正在开展工业声学方向的研究,张巍峰当即寻求合作:“我们有需求,他们懂技术,优势互补,说不定能研发出来。”& a4 R  o& V" x3 \
研发初期,中心委派的声纹分析工程师入厂调研,收集样本;质检工人现场听音,记录特征。6个多月时间,采集近5万条数据,算法选型、深度学习、参数调节,经过与人工听音多轮比拼试验,工业声纹质检系统初步建成。
8 Z  {% c) F% t0 Q' o  j0 c) b国家智能语音创新中心总经理吴江照介绍,利用工业声学技术开展设备质检,除了民营企业自主创新,还离不开科研院所的大力支持。“发声位置、距离远近都会对收音造成影响,为了解决工业领域的麦克风阵列分布问题,我们和西北工业大学科研团队开展交流,共同探讨技术方案。”吴江照说。  k3 J% {. a9 f! E3 L( ]) w
如今,这款“智能耳朵”已在产线投用,质检识别准确率达到95%。“一次联合研发,仅一条产线每年就能为我们节省成本近15万元!”张巍峰算了笔账,过去人工听音,易因疲劳而失准,现在使用工业声纹质检系统,不仅效率提高2/3,还增强了一致性。曾经难以分辨的齿轮或换向器故障点,通过声纹数据分析,有了改进方向。' c$ @4 V( v( V
让生活智慧便捷——- z5 H9 f) ]; e# o& T
“全屋智控”识别用户指令更精准精确: I: I: t: z( @' B4 S
一进门,灯光自动点亮,空调自行开启;一句语音指令,舒缓的音乐在耳边响起,阳台上的晾衣架开始升降;厨房里,感应装置监测到煤气泄漏,既能报警,还会开窗……走进合肥荣事达电子电器集团智能全屋体验生活馆,研发中心技术人员孙杰指向巴掌大小的控制面板:“能集中控制空调、音箱、窗帘等,启动各种智能情景。”
/ F6 V3 P& d. H: T2 F% U4 t一块屏幕,如何实现“全屋智控”?
: |* C2 t9 O0 v! @: D% Z+ G0 ?! x/ x从传统的按键控制到智能的语音交互,为实现多款产品集成,孙杰带领团队与国家智能语音创新中心一道攻关,花了约一年时间。3 t8 `6 g( c; U, D6 {
首先要解决的,是用户反映最多的“免唤醒”功能。孙杰介绍,唤醒词是为了激活设备进入运行状态,一般来说,唤醒词说出后,若能立刻给出反应,有利于提升用户体验。可如果每次使用智能设备都需要唤醒词,也会造成交互冗余,增添麻烦。
6 Y5 Q& [( ]- ~; A' O为此,企业结合市场调研,分析常用指令,中心则利用声学技术,提供算法支持。通过具有AI(人工智能)交互能力的语音芯片加持,这款控制面板可以实现一分钟内“一次唤醒,多轮交互”。* J0 A/ U, @, p& w5 S# a" b6 x
“误操作”是横在面前的另一道难题。“居家生活时,经常出现闲聊触发关键词、设备作出响应的情况,尤其是在开发‘免唤醒’功能后。”中心AI语音芯片部研发总监周正友介绍。
# v* |/ W' H" e是否可以通过识别声音、判断方向,进而给出正确回应?为了解决这个难题,周正友和同事们根据波速强度,算法分析音频,经过多次试验,系统识别准确度大幅提升。7 W$ Q1 Q' g* v8 |8 G% v
眼下,除了智能家居,这款具有语音交互功能的面板产品还被应用到其他领域。“医院、养老院、办公室等商用客户也很感兴趣!”孙杰表示,企业与中心联合攻关,既增强了创新能力,还开拓了应用市场。1 I( l9 p1 I- M! i, r' S+ ?
为创新提供支撑——
, a# N, x3 P$ U4 |3 QAR字幕眼镜带来“看得见的声音”- ^* ~) v9 h' X' s* w% P/ }
耳边,交流声音不断,眼前,文字逐句呈现。这让弱听患者刘烁感觉不错:“跟看剧一样!戴上眼镜,声音就能转化成文字显示在眼前,还可以调节字体大小、背景颜色,丝毫不影响视线。”
$ h8 H; B9 V" R0 H0 z这款AR(增强现实)字幕眼镜,由北京亮亮视野科技有限公司与国家智能语音创新中心联合研发,具备实时转写、语音翻译等功能,已为5000多名弱听患者带来“看得见的声音”。/ G) ]6 n+ o# ]' j
面向市场需求,兼具技术基础,新品研发按说应该很顺利。令亮亮视野系统研发部总监赵伟没想到的是,技术迁移并不简单。“我们想的是把眼镜和声学技术相结合,增强用户体验,可眼镜收集声音后,难以依托眼镜本体算力进行转写。”赵伟思来想去,决定“上云”一试。1 \& m: `/ z# A! n0 N+ H  Z
这朵“云”,是国家智能语音创新中心构建的端云一体语音云平台,为金融、医疗、智能交通等领域企业提供技术服务,助力企业高效稳定运营,日交互量达20亿次。
8 z' I( r( K1 L8 `* u/ a* l近半年时间里,赵伟在合肥、北京两地奔走,从拾音降噪到接入“云端”,企业、中心协同创新。如何精准识别人声?科研人员调节上千次麦克风阵列组合,确定声音增益最佳范围。怎样确保转写迅速稳定?技术人员将数据接入云平台,提供响应及时的算力支撑。  p8 G  Q3 Q9 ?0 E* p$ J) D
“简化操作步骤、调节字幕位置,产品去年研发成功以来,软件前后更新了三四个版本。现在,我们正在和中心讨论,如何增加语音控制开关功能,让用户操作更加便捷。”赵伟说。" [1 J4 I' P* ]6 t3 N
近年来,为支持智能语音产业发展,工信部批复组建国家智能语音创新中心,给予专项支持;2021年,安徽省印发《支持中国声谷创新发展若干政策》,鼓励人工智能及智能语音产业发展和推广应用,引导企业协同创新发展。“政府有政策,企业有场景、有需求,中心有技术、有实力。依托这样的创新合作形式,可以更有效实现资源联动。创新链产业链深度融合,步伐更快。”吴江照说。- W+ q" G* R; k# {& q4 X# ]. ]) F
2 s- H8 a* X, F6 d
                    

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-23 22:57 , Processed in 0.051404 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表