|
|

+ y, A& n" X+ N6 r) @4 y3 k2 ?7 O' K* d" f D( S) o
, O' C6 Z6 D7 W) B
10月23日,在北京召开的2019 Arm技术峰会上,Arm正式发布了全新的Ethos-N77/N57/N37系列NPU IP,进一步加码人工智能(AI)计算。与此同时,Arm还推出了针对主流移动游戏市场的高能效的Mali G57 GPU和针对主流及入门级市场的单位面积最高效的Mali-D37 DPU。
8 ]) Y/ R5 R; P$ b$ z+ }' b8 l+ W, t+ ]3 i& O' j
! R; }; d3 u F" x2 Y* E$ v# e* V
ARMv8及后续架构将不受限制的继续支持中国合作伙伴!
8 }- a7 `) ~8 x& d4 z
% d7 }. t5 T+ O
( H2 F1 a/ i& A% d* f今年9月25日,Arm中国在深圳召开媒体沟通会,针对此前外界盛传的“Arm断供华为”一事,Arm表示与华为仍是合作伙伴,ARMv8及后续V9指令集可继续授权!
) \9 z4 }( X7 m' ? `$ \& n. v3 T
0 p0 n5 i2 b$ n/ ]3 U+ d$ o, Z10月23日,在2019 Arm技术峰会北京站上,Arm董事长兼CEO吴雄昂在开场致辞当中再度重申,经过法务严谨的调查及相关调整,目前无论是ARMv8,还是后续的V9架构都是源自英国的技术,将可不受限制的继续支持中国的合作伙伴!
! U( J1 w; U, X4 x3 y/ U9 ^1 T% E' v3 B6 @
/ u, d' {( W- ]& [/ v6 N) i- R& x
( [$ p0 u& i6 b# x0 k0 }- l! Y( t3 F5 K. U
5 r# Q/ F( v9 V, R5 k' p& C
此外,吴雄昂还指出,Arm在中国的合作伙伴已经超过200家,中国合作伙伴出货的基于Arm架构的芯片已超过了160亿颗,国产SoC芯片95%都是基于Arm架构的。% _/ T" q5 N# w! t; Y# l" W
" c* _' h8 @, \1 E
4 f! B7 d! k+ g7 ?; D吴雄昂强调,Arm是唯一非源于美国的主流计算架构。Arm中国承接Arm在中国的业务和技术,在Arm标准之下自主创新、赋能产能,把中国工程师能力调动起来打造知识产权。这些知识产权将不只是提供给中国产业,还要通过统一标准面向全球。# w/ v; j4 W- P- m) j8 f8 U9 d
7 h0 @' H; z( s3 T
. {( L# v! j# _' O加码AI计算,Arm发布Ethos系列NPU IP- Z+ V, X Y' p' G# R# `5 D
" t0 m+ K; L" D% o( H( t: J8 {: v* E
; K) d. ^* n3 L0 W% U+ L5 ]根据Arm及研究机构的预计,到 2028 年,移动设备的数量将从现在的17亿台增长到 22 亿台,智能的IP Camera将由现在的1.6亿台增长到13亿台。在终端侧具有人工智能的设备将会由现在的3亿台增长到32亿台。足见人工智能市场增长之迅速。# M& [' _( R% I( g
& J* r1 _5 N0 O; F
1 j. K6 ^( G3 {; _' O而随着AI技术的兴起和广泛应用,AI对于芯片的算力也提出了更高的要求。作为全球最大的处理器IP供应商,Arm的Cortex CPU和Mali GPU在以智能手机为代表的移动终端市场占据了极大的市场份额,但是在AI计算领域,Arm此前一直都是依托于其Cortex CPU、Mali GPU及相关软件开发工具来提升其AI计算的能力。
+ \/ ~& f+ S5 M3 {; U) N8 r K$ G, z
5 L2 ^ [) Z! m( P% G
' U m# {" T1 g但是,传统的CPU、GPU核心并不是AI计算的最佳载体。因此越来越多的芯片厂商开始推出了AI专用芯片,或者在SoC当中加入AI计算专用的NPU内核。比如华为2017年就率先推出了集成NPU内核的麒麟970处理器,同时苹果推出的A11处理器也首次集成了NPU内核。此后,高通、联发科、三星、展锐等手机芯片厂商也纷纷开始在SoC当中集成自己的NPU内核。; O/ V: V9 G2 C. b" k; N3 ]
0 E4 t& B' x0 g# y! g7 d# a2 } E
- j) ^6 Q3 ^5 u1 C在此趋势之下,为了应对市场对于AI内核的需求,Arm在2018年年初也公布了针对AI的Project Trillium项目,其中就包括了全新的机器学习处理器IP、目标检测处理器IP和神经网络软件库。经过了近两年的时间,现在Project Trillium项目的成果也开始正式产品化。 Y& w( V- _. r$ Q
7 `) e ~/ ~5 z0 K) j
' Y% I: I7 p( G$ ` t: k4 k
' N: K7 Q X; i: f1 m0 K& A4 j2 a6 s5 d, Q; M
4 w% I! g7 ?9 t" J
" V7 i. ]% |' g/ p + \/ L) e# T8 ]6 v9 f5 c5 l3 d
今天,Arm市场营销副总裁Ian Smythe 在Arm技术峰会上正式发布了全新的Ethos系列NPU IP,包括针对高端市场的Ethos-N77、针对主流市场的Ethos-N57和低端市场的Ethos-N37。. h: g/ M. \, t' {
2 c( V9 f: m+ E, M: K- {8 i( t$ Z' h

0 e4 k' q: ~; }7 y. R0 o 8 K) }. `/ M+ y& v& p# _1 |
* N7 j. ^; m H1 @' C' ]
' ?; v) | A7 C7 h) W3 REthos-N77实际上就是Arm去年公布的Project Trillium项目中的那款机器学习处理器IP,其内部集成了可配置的1-4MB的SRAM,在1GHz主频下,7nm工艺下,可以提供最高4 TOPS的AI算力,每瓦性能高达5 TOP。另外,之前Project Trillium项目公布的数据显示,Ethos-N77的单位面积算力为4.6 TOPs/mm²(最新发布的可能有进一步提升)。那么Ethos-N77的这个性能在市场上处于什么水平呢?5 [7 L/ l3 R4 B9 y6 p

8 i! D, a; Q+ I3 J7 h根据资料显示,华为麒麟970 NPU是基于寒武纪1A IP,算力是1.92TOPS。而苹果A11的NPU算力仅为0.6 TOPS,A12的NPU性能为5TOPS。而根据此前高通骁龙855发布之时的数据显示,其整体(包括CPU+GPU+DSP等)的AI算力(超过7 TOPS)是华为麒麟980的两倍,照此估算的话,麒麟980的NPU性能大概在3.5 TOPS左右。另外据芯智讯了解,华为麒麟980的NPU是基于寒武纪IH8,是针对低功耗场景视觉领域的NPU内核IP,而寒武纪IH8有 4 种可选的配置1T、2T、4T、8T OPS@1GHz,麒麟980应该是4TOPS的版本。而麒麟990系列的NPU并未公布具体的OPS数据,不过其采用了全新的达芬奇架构以及两个大核+一个小核的配置,性能应该更强。
) M' y3 u9 T& T! N g) y$ S
5 \) v2 W0 I. D8 b9 `* F* X0 B
1 ?/ u \0 \+ h; x4 ~
' C2 J, s) ]/ K在单位面积的算力方面,根据芯智讯此前的估算,麒麟970的NPU的单位面积性能大概是1.48 TOPs/mm²,而麒麟980和990没有相应数据可以参考。而根据TechInsights的拆解,苹果A12的NPU内核的面积为5.79mm²,也就是说苹果A12的NPU的单位面积算力约为0.86TOPS/mm²。
% x/ {/ a3 _; Y+ h! Y! u9 d5 [9 F( Q" Q' A( Y4 b: e
4 g9 k& u# t* ~" }, v2 w; z! h6 H1 S在每瓦算力方面,华为公布的资料显示,麒麟810的每瓦算力可以达到6TOPS。苹果的NPU未有相应数据。寒武纪新的NPU内核1M在7nm下每瓦性能为5TOPS。
: X* d8 U, R: Q9 L* J5 _) e9 x/ z6 t' {1 @) `2 l
+ {6 r6 M2 j+ k9 U- G" X, b/ a从上面的数据对比来看,Ethos-N77的AI性能与苹果A12和麒麟980的NPU相当,相比麒麟990系列的NPU性能可能要弱一些。在单位面积算力方面,远高于苹果A12和麒麟970的NPU。在每瓦算力方面,也是远高于苹果A12的NPU,略低于麒麟810。综合来看,Arm Ethos-N77各方面都还是比较出色的,达到了目前旗舰级NPU的水准。
; V( F" C5 n$ k! j: q- @2 y
- b) S& W0 I! u7 N/ |) w3 @" T6 @4 R# c: R2 n5 v. e
需要指出的是,4 TOPS的性能是单个Ethos-N77核心在1GHz主频下的性能,如果配置双核的话,那么性能无疑将进一步提升,当然功耗和面积会进一步提升。* z# x' J% o1 x ~0 } K
! q# | ?& A* O& t2 r+ I$ ~5 {. {" T' L, x. U9 _; W2 K& l" l
Arm此前就表示,Ethos系列IP是具有高可扩展性、兼容性和可编程的,可以提供计算性能最低从2 GOPS到超过70 TOPS的产品。1 W0 ^7 t, [( A! W f- N
. _; f) o) K; g1 ~* r0 y7 H! _# `9 [- s* k! b; g) q
另外,Arm还推出了针对主流市场的Ethos-N57,内置了512KB SRAM,在1GHz主频下,算力最高可达2TOPS;而针对低端市场的Ethos-N37,是为了提供面积最小的ML推论处理器(小于1mm²)而设计,其同样也内置了512KB SRAM,在1GHz主频下,算力可达1TOPS。4 s0 G0 d% y! `% w
6 e# V f) P. _7 u
6 \0 Q \9 {, [9 B; q# u6 E gArm表示,Ethos-N57和Ethos-N37针对Int8与Int16数据类型的支持性进行了优化,通过如创新的Winograd技术的落地,使性能比同类NPU提升超过200%,并且配备了先进的数据管理技术,以减少数据的移动与相关的耗电,在ML在性能与成本、面积、带宽与电池寿命之间达成了比较好的平衡。
5 P& @( i- H2 j7 k1 l. p2 V3 Z' {& J* v& d( D) E! O# H" ?' ^" g
& T4 |3 B, f% ~% a+ L' b据芯智讯了解,除了移动市场之外,Arm的Ethos系列IP未来也将会开始进入物联网、工业、汽车、网络以及服务器市场。
1 c( F3 F5 P7 \9 h' I7 k) a
' u) h9 z; x( J. i' h
7 |4 P" z |* d, }& ?$ T开源的AI开发框架Arm NN4 k( `) J% ^$ L) |4 c4 m. I3 ~
1 H9 S3 T4 k ^- ~% a1 w1 W
7 r( ^7 L. A! o1 B
我们都知道,此前高通骁龙845/855系列都并未内置专门的NPU内核,但是其仍然提供了较高的AI能力,而这一切得益于其神经网络引擎Neural Processing Engine的助力。即采用更为弹性的异构的机器学习架构,在通用平台内做内核优化,使得AI计算合理的分布在CPU、GPU、DSP等每个单元上,从而可以针对不同移动终端提供弹性调用各个处理单元来进行AI计算。
# ^: E+ P. S# ^% R. i7 y
. K6 v9 p. o. n8 k. Q) N# P) G, S
# q* R( h; Q2 L* K% i1 |; O& Y! ~" Y而Arm此次在发布Ethos系列NPU IP的同时,也推出了开源AI开发框架Arm NN,强化异构的AI计算,进一步提升整体的AI性能。) p* J2 w6 Q2 s; L/ |0 D! C
& T7 J% H- j# U9 f7 c u9 G" z, @
! \9 J# M' b6 b& t( W3 s& X
0 |: [$ c9 O- r
6 G$ {8 ^; v+ T9 T' Q4 G5 T# Y. T6 x
据介绍,Arm NN是属于偏底层的架构,而且在其基础之上,可以支持其他的更高层级第三方的NN框架,并提供完整工具链,可实现在AI计算上对于Arm CPU/GPU/NPU内核的合理调用,实现更高效的异构的AI计算。, z J$ Q4 w9 H( V& d+ y4 e
3 A; X4 v. G A$ B' M% q
( ^. v0 ^; _% T5 ?
Arm表示,由于不同的SoC对于AI的加速方法是不一样的,因此第三方应用及开发者要用到片上系统的加速能力是比较困难的。而开源的Arm NN的推出,将降低开发者调用Arm内核的难度,进一步提升开发人员的体验。) p3 F% \- K6 }( v) i6 Q
8 ?3 I3 x8 J. E6 s9 C* h1 Y$ W1 b3 ^/ Y6 q ~1 N8 o1 s; }

3 z" c5 e& j+ {2 `0 N& a
! |$ x3 ]0 H: x3 e) g% ~8 Q. r: \
* [. b g7 ^; j此外,为了推进基于Arm NN的内容创建和开发,Arm还与Unity(Unity最目前主要的3D引擎,50%的3D游戏,75%的VR内容都是基于Unity引擎开发)达成合作,进一步优化Unity引擎,使得基于Unity的开发者能够更容易的访问和更高效的利用Arm的内核,在Arm CPU/GPU/NPU之间获得更好的性能。可以实现一次开发,即可获得Arm全系列的内核的支持(即可支持众多基于Arm不同类型的内核的SoC),无需再重新编译。
+ `% d- v& y, [- p
' W$ Q6 p3 b$ w6 _4 `" B m2 k6 j) Q0 q6 H( o6 m
Mali G57 GPU:为主流市场带来智能与沉浸式体验
% Z! r( g( f7 h, s- e* x; S# Q. ]9 V9 T# ?5 q* B5 T: X
: d# @% v/ Y4 y4 w/ `* a) d6 d1 N
今年6月,Arm针对高端市场推出了首款基于全新Valhall架构的GPU——Mali-G77。今天,Arm针对游戏市场推出了第二款基于Valhall架构的高性能、高能效的GPU内核——Mali-G57。(Vahall架构进一步提升了并行执行的能力,同时在代码上也做了尽量的简化,从编译角度来讲也更加友好。)
7 M4 e, i$ h0 y/ L) E6 C( ?1 u& @* E* ^; X
7 q3 H* i. i! X1 _6 |
2 Q1 y- @0 u/ F" y
/ L8 Z/ k- j+ b
+ ?+ Y3 I* h9 n1 I
据介绍,Mali-G57的性能相比上一代的Mali-G52在能效上提升了30%,性能密度提升了30%,机器学习性能提升了60%。并且Mali-G57还加入了针对虚拟现实(VR)提供注视点渲染支持,再加上机器学习性能的提升,可以支持更复杂的XR实境应用。而且,Mali-G57还支持1-6个核心的配置,可以满足不同市场定位的智能手机的需求。
Y% O# B( D" C+ J$ c' R/ O2 z" R( K& }& k! N/ H( M& s2 ]
7 N; e. `, e& ^1 f% `Arm表示,Mali-G57可以将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。
& f( `8 z1 u) z3 X; j4 P5 N7 v2 P+ w0 n8 d
" ^4 B7 V6 f7 {7 B, _6 r. nMali-D37:Arm单位面积效率最高的DPU
8 c7 |( e; ^8 x. _/ `3 r( n- P3 q/ [* o
3 W0 I* p' W; ?9 ~在今天的技术论坛上,Arm还推出了目前单位面积最高效的显示处理器Mali-D37。
9 u# e7 l$ ~+ n5 z% c. x) m) B9 C7 Y$ Q+ a* a7 E
v/ K% ]/ t& r8 C' S7 j 3 J4 |3 B# ?/ p; `# x, H* ?
# p$ p( Y- {- |3 y/ R( R
/ x- W) t! Z4 Z$ g" N% `$ ] N
据介绍,Mali-D37是Arm第一个面向主流市场的基于Komeda架构DPU,拥有极高的单位面积效率,在支持全高清(Full HD)与2K分辨率的组态下,16nm制程的面积将小于1mm²。' _: u/ x* d& x) e9 W) e+ O5 m
* A$ I1 w& o/ r, I0 c7 K8 e# S$ p& L: l; p0 U) P1 ~
在性能方面,Mali-D37保留了高阶的Mali-D71关键的显示功能,包括与Assertive Display 5结合使用后,可混合显示高动态对比(HDR)与标准动态对比(SDR)的合成内容。另外,Mali-D37其通过将部分GPU核心显示的工作负载卸载到Mali-D37来工作,以减少GPU的工作以及对于内存的访问,使得系统的功耗可以降低30%。
( S3 q+ x+ O2 [: m# m0 d, p1 y
4 ~7 j' m* g6 V9 p4 w4 Y# p% V* T) ]( d) R# E. A2 @* |
Arm表示,Mali-D37可以支持入门级智能手机、平板电脑等成本较低的设备,获得2K级别的视觉效果与性能支持。
& F$ K" M' Q" D; j+ |( J! k6 \7 o: \! X+ K- r0 Q
8 G4 x! e6 u8 ^( z3 NArm的通用型NPU能否获得成功?+ ^& V+ p9 U" Q/ ?, y3 E" ]9 V+ e
5 l8 W: V# `$ u6 [9 Z
, v. a4 z. [/ ~) Z, f3 V! X
从目前的市场趋势来看,AI芯片正越来越向专用化的方向发展,越来越多的算法厂商也都纷纷基于自身的算法推出了自己的AI芯片。同样,正如前面我们所提到的,目前华为、苹果、高通、三星、展锐等众多的手机芯片厂商也都有推出自己的NPU内核。那么Arm的“通用型”的Ethos NPU IP真的有市场吗?% ]/ @2 i# I9 N [7 v
; M9 D; S! }5 o7 j/ c
1 h& |; f2 @% [! H8 k% \, T* g# J对此,Arm市场营销副总裁Ian Smythe表示,Arm的Ethos NPU IP并不是孤立存在的,其主要的优势在于,在其本身提供出色的AI性能的同时,可以更好与Arm的CPU、GPU进行协同,以实现异构的AI计算,从而进一步提升整个系统层级的AI性能、降低功耗。而且,目前AI市场还是在初期,很多的AI算法仍在快速迭代,选择“通用型”的NPU是比较安全的做法。8 k3 o: g) I, z+ p- D6 @, n6 f
1 E5 P! G* r5 l( R5 Y/ l( m9 ]! I0 ^& ]. g5 f1 n7 c
+ P9 q& \% C! X% f
' Y9 m; g/ ^5 W/ Y
% w ^) I# @" U5 G; `在采访当中,Ian Smythe向芯智讯确认,Arm的Ethos NPU IP也可被集成于比如RISC-V等其他架构的SoC当中,但是Ian Smythe也强调,这样并不能发挥出Ethos NPU与其它非Arm CPU/GPU在AI计算上的协同优势。) R/ [# o5 T' C5 g7 B8 `# `# q
/ A& B% d3 ]/ x" f- q: @. h
! _/ t3 @4 t7 g# h6 A
另外,Arm的Ethos NPU IP还实现了对于高中低阶的全面覆盖,但是目前众多的芯片厂商主要还是在其高端SoC当中集成了NPU,而随着AI计算向边缘侧部署的趋势,未来市场对于NPU的需求也将会越来越大。Ethos NPU IP的推出,将可帮助芯片设计厂商更简单、更低成本的获得不同档位的NPU内核的支持。
' Q; ~5 @$ C% X/ b( u( ?, o
v i; a) R9 ~
4 W) ~' Q% i3 X& w# n另一方面,目前的Android应用生态基本都是基于Arm架构的处理器,因此,如果采用Arm的Ethos NPU IP,结合开源的Arm NN框架,应用开发者将可以更简单、高效的调用Arm的CPU/GPU/NPU内核,可以为用户带来更为出色的AI体验。而且,可以实现一次开发,即可获得Arm全系列的内核的支持(这也意味着,可支持众多基于Arm不同类型的内核的SoC),无需再重新编译。而对于其他的芯片厂商的NPU来说,开发者要想实现灵活高效的调用NPU,充分发挥其AI性能,则需要针对性的进行优化,而且还需要其提供相应的权限和工具。即便是开发者开发应用实现对于A厂商的NPU调用,同样的应用要想实现对于B厂商NPU的调用,可能需要重新进行编译。显然,对于应用开发者来说,Arm的NPU所具备的生态优势无疑是其他厂商所无法比拟的。
@2 H3 N2 ], M0 N ]/ ]4 `8 R) Z6 ]+ v* ]" }5 d. N
' C) G5 z9 O3 F4 w最后,Ian Smythe强调,Arm对于AI性能的提升是多维度的,一方面会持续推出更高性能的NPU IP,同时也在不断提升Arm CPU/GPU的AI性能。0 \; C" j( E- i, n x
8 G# U# @, y* Y1 I5 I
6 B0 ]' c# [; O# o' h- q
, e0 }5 N6 ^/ i$ E" X# b. j
& h6 X2 A% ?! f) z' N8 K
* V4 n3 z' K( [& f& R V' n$ s值得一提的是,Ian Smythe在演讲当中透露,Arm在下下一代的大核架构Matterhorn当中,加入Matrix Multiple(MatMul),令其ML(机器学习)性能与前代CPU相比提升一倍。# ]; {+ x- Z3 ~7 c, W
4 |' g9 H) Z) q7 `! n5 A9 k
6 g7 c1 ^' D; G9 Z编辑:芯智讯-浪客剑
3 A1 _" F2 g. H) R t往期精彩文章
^3 [, J3 b- t0 X# j5 LVR市场迎来第二春:5G+VR云化将成最大推力!
, M0 v: w# |( q2 P E) X' ^6 O: a# Q" R% f* u
2019生物识别论坛成功落幕:这十大看点不容错过!
/ {2 w x$ G" a4 T9 _- D阿里平头哥正式开源RISC-V架构MCU芯片平台
" N; N, s9 |; A0 Q$ x首度杀入3D人脸识别门锁/门禁市场,英特尔为何选择与小钴科技结盟?' C$ I+ Y, ^1 Z* @9 O, }2 R
- X# d, N4 g5 D/ X5 B6 K- _- M7 O
展锐再推4G功能机芯片虎贲T117,意义何在?6 o7 b; h" I5 d) W/ K/ m
/ ~- z6 J c. ]历史首次!华为海思4G芯片Balong 711对外销售!# W6 o# ]3 V& ?+ ~$ O/ M
1 R: }4 \4 i0 J7 s不惧美国打压!华为已获得65份5G商用合同,5G基站发货超40万个!
9 o/ F$ ?5 T! @; c( U) x9 e
* [; B3 _0 q; l1 P: @" B) I巨额债务违约+资金链断裂?手机ODM厂商海派关厂裁员!* K1 e) h: M# b' i- F- C- m' l
& S4 g+ ?1 P# b8 L; m可穿戴巨头Fitbit宣布撤出中国!
# v) a6 ?8 W8 O3 O7 u' h; a4 D5 i! v* Y! ]0 C$ D
收购Intel基带芯片业务涉嫌违规?苹果遭市监总局启动问询7 T6 S) e" o1 Q- ~7 f
+ r6 A- Z$ ~; F& @* E/ c8 W% c
禁令之下,安防巨头海康与大华的应对之策!
; z& L! z$ `% D. j) }! q# d, r! r1 m5 Q0 t; i- c) i$ B
为应对RISC-V挑战?Arm CPU引入自定义指令功能!" X0 F& f0 I; s1 f( D5 J
行业交流、合作请加微信:icsmart01
7 ^7 h. X3 C, @4 ~. L0 S* U芯智讯官方交流群:221807116
3 x5 {& B- m* |9 w( ^4 h
0 s8 m- H; |' c7 n. Y8 ?5 a来源:http://mp.weixin.qq.com/s?src=11×tamp=1572103805&ver=1936&signature=jeCKwe1UBQzC*Pzs8GoY9TZBvEs1rdMAvR4c22h3Cpdg-qQ*TOrpE2uZ4YvRMx7pQMFu5Q-as9lkvJgPIZqWm1WA-*ncmgAC2Ls6p79VafFsjOW9cM78m6hG7c-lzR2Q&new=1
& A3 x- P+ Y/ ?2 n1 q免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|