京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 9612|回复: 0

华为重磅发布:史上算力最强AI芯片正式商用

[复制链接]

22

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-8-23 21:24:36 | 显示全部楼层 |阅读模式 来自 中国
点击上方“腾讯科技”,“星标或置顶公众号”

0 M7 `1 `8 x. L/ O$ e! d
关键时刻,第一时间送达
7 i( k/ R" ~# I( K0 j
& Y+ b( A; M, }! n) O

4 m' g8 E# g/ q: v6 k0 }3 M8 B2 p( I/ F2 u* |  F5 L* v9 u
来源 / 量子位(ID:QbitAI)
( f: u' x. M' O9 M, ~* `- E1 ^
作者 / 乾明 边策 一璞 
! o3 {1 Y+ U2 ~5 E6 p
欢迎下载腾讯新闻APP,查看更多科技热点新闻

0 M  x8 i2 N% m. l" L1 P

5 k* w/ B/ `; g8 n' k' k! q. n

6 ^7 U" t& z- d- s
视频:“昇腾910”来了!华为发布最新AI处理器,时长约20分53秒
9 K' I+ X$ F0 h, Y& L$ |9 D- K
# x0 Q/ s& }- M+ d' G

/ W& c- M5 H% r  V4 {* [8 e刚刚,华为业界算力最强的AI芯片正式商用。
, c+ p- W5 z8 M: U( C
0 G# t2 s3 u4 k( k6 F! P; k" y6 M! n2 q2 E
并且宣布自研AI框架MindSpore开源,直接对标业界两大主流框架——谷歌的Tensor Flow、Facebook的Pytorch。- R; g9 T$ r% f! _& I$ M; U8 O

2 H+ o0 ]+ d  o" r/ t& Y

4 i( f5 m" l+ V# \' B8 v
! D: ?7 e+ |# q% ?- P. A/ |, p! W7 {& f- G/ A
华为AI芯片昇腾910之前已经发布,现在正式商用,对标英伟达Tesla V100,主打深度学习的训练场景,跑分性能2倍于英伟达。
: D7 R* k5 T7 Z; @. k" L5 `+ t& m$ D2 G, Y; y

4 Z' O% w; D) v8 b
, n6 k& M& T; _  s
1 Y: {$ c" h4 f4 \4 D# T/ Q# Q( q华为轮值董事长徐直军说,这是华为全栈全场景AI战略的实践体现,也希望进一步实现华为新愿景:打造“万物互联的智能世界”。" D8 {& H3 |( o$ o1 R3 C, l
1 D( d$ Y. E3 S

9 i% u7 F& @5 J% e( o* ]1 Q# r但毫无疑问,华为入局,自研AI计算架构,肯定会进一步影响AI基础技术和架构格局,特别是美国公司的垄断。
$ r! p0 E9 X2 N  R' D. C7 a0 z% h
& s0 i; I: T  E
MindSpore发布后,华为已经实现了完整的AI生态链,加上此前发布的ModelArts开发平台、Atlas计算平台,囊括了从芯片、框架、部署平台到应用产品完整层级。
% f1 C  c0 I+ P9 g) E. l
8 X  i: g% ^8 b0 k* K

' b" l4 `0 Z9 _
( F+ r4 {# I, c/ C1 {) N2 }5 V: U$ `3 I: B3 B! R
在当下这个大环境中,这些动作也具备了自立自强、不受人掣肘的寓寄。) W1 v/ P, m3 l; f) n, f# x
- L+ E/ f$ u! R7 T, e
- K) C; v. x3 Z7 [0 S1 @
如今现状,AI领域的关键技术,比如算力、框架、算法等等,主要还是由少数几家美国公司提供。; H6 ]( Y2 Q0 r- v9 G+ |; M

7 D5 F4 N: F% d/ ]/ u+ S
' z, T' h  Y0 B, U. T& G, p比如训练芯片,主要由英伟达(GPU)、Google提供(TPU);框架则是Google的Tensor Flow、Facebook的Pytorch等成主导;原创AI算法的发明,也只是在少数几个厂商或者研究机构手中。
. m& Q. p) T4 g2 v8 [/ d/ U# \
/ ^; Y2 H. _1 s7 M& D2 v! v) a0 H- z
) t: k0 H" Q9 S7 t" w: e5 _这直接导致一些企业想要介入AI的时候,发现门槛很高,除了需要大量数据之外,还需要面临算力稀缺、硬件昂贵、人才难找等问题。' b8 N- ^+ V$ C3 S* X
! m' f9 A( B2 }6 G. z

. {! Q7 k9 D/ m0 E, o0 L0 G2 G现在,华为要用实际行动改变这一现状。
8 |1 I- e* `$ B8 `  t' u. m
6 H) ?; L' z1 s  ?) R' E6 l9 a, S2 n0 F: x$ q% }1 E/ |

, g6 |5 ?: I+ {% q( Y8 k
" `* n7 U5 V4 ?+ b4 X! G& k, f* ~& kAI领域的“鸿蒙OS”
7 Q& |& z7 M7 y, g, \* O+ z- C
( l& \8 O# }2 u  Z. t7 i5 S0 Y4 D7 s8 J3 |& e/ O3 n0 y+ j
MindSpore,与其他主流的框架不同,这是一款全场景的AI计算框架,也是一款“操作平台”。
3 e/ i. E3 W4 F) Y7 |1 L; Y7 w4 j8 K6 \5 r0 A$ K; j% q+ v
% N3 t( X' h' X3 G" s
不仅仅可以用于云计算场景,也能够应用到终端、边缘计算场景中。8 e9 m" m' O) V" u

% B/ v4 u- Z! F
; w5 `/ h& w' \1 Z; W3 i. t也不仅仅是一款推理(部署)框架,也可以用来训练模型。8 g1 k$ E: `+ m* h2 ~0 H  X
, W' i1 q; `) [7 j; b# Z
1 ]" k  R8 Y6 R1 N" ]6 ?+ a$ ]# y
徐直军表示,这背后可以实现统一架构,一次训练,到处部署,可降低部署门槛。( n8 N# P1 d4 t1 [* @' O. L0 |
" v$ u! p. H6 o. j; E6 J- D! Y( i9 |

/ K. a  b. k8 l! W$ U
% O+ p4 `1 q$ @2 o8 s6 w: i, }  }3 L
从这个角度来看,MindSpore也可以视为AI领域的“鸿蒙OS”。7 t$ q; m* P( y, q, v( q

+ J, `0 i' {5 [4 w8 l' {( t, ]" R3 w7 W
此外,这一框架面相的也不仅仅是开发者,也面向领域专家、数学家、算法专家等等在AI中角色越来越重要的人群。- H/ F5 D9 M; _+ p( j

, C8 R7 }- H/ Z$ x' x# L
8 }; _, g$ W+ f/ r6 c. d; \2 T徐直军介绍,MindSpore的界面上也更加友好,在表达AI问题求解的方程式时,更加便利,更易于算法的开放与创新,推动AI应用的普及。
. G. |& n- Z9 `8 T+ I6 D9 f* Q7 T2 f9 M8 _/ m6 |9 [8 o+ W

/ ?$ k! `8 X2 N8 T( p用MindSpore可降低核心代码量20%,开发门槛大大降低,效率整体提升50%以上。! m+ W3 ?8 x, Q# G: K

3 I6 q# H! g4 h# }  @6 \8 I+ k6 O: I4 \3 z$ Q2 ~; D9 h
通过MindSpore框架自身的技术创新及其与昇腾处理器协同优化,有效克服AI计算的复杂性和算力的多样性挑战,实现了运行态的高效,大大提高了计算性能。
! u3 p$ C0 k1 @' ^  h
8 C3 Z6 h- o. y' T, r$ F

7 M/ Q. I' ?+ l  {% k
/ A4 o: V+ T7 ~, v  u4 \- `+ ~; b+ f$ `) b3 @  \* W
除了昇腾处理器,MindSpore同时也支持GPU、CPU等其它处理器。2 ^8 w' ?3 M+ M% W' h
, ]8 v7 b* N0 R% ], @

1 M: v1 }+ q5 g7 X与此同时,MindSpore也采用新AI编程语言,单机程序可分布式运行,是一个全场景框架。全场景是指MindSpore可以在包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等环境上部署。# V) \" r4 B4 M3 b

  e6 I9 ~, D+ ^/ u  a, H+ R" X. U1 T. }
而且,这一框架将会开源开放,可灵活扩展第三方框架和芯片平台。
, A# e$ P2 U! [" D
6 U2 Z  F9 F: |8 n- }/ D; O% D4 q7 u4 ^( P3 ~- |
当然,徐直军说,如果用华为的昇腾系列芯片,效果会更好,可进行全离线模式执行运算,充分发挥神经网络芯片算力,实现最佳性能搭配。! r, a8 A7 K- Y3 K: w. E& m8 \
6 ]+ v) L4 f- \  s+ z" I! Z

/ s5 ?  J! q% X4 \  o$ f毕竟,MindSpore作为华为全栈全场景AI解决方案中的核心步骤,是首个Ascend Native开源AI计算框架,会更适合达芬奇架构的AI芯片,尤其是昇腾910。
4 c2 E8 ?! v4 l% D3 l! d  L  P
3 V7 P: P, T: i0 d4 k1 c2 m
0 @/ K( `( Z8 j8 Q1 [1 t+ g. h而且MindSpore针对现在越来越大的训练模型做了更多的优化,用户无需了解并行运算的细节,只需了解单芯片部署,就可以在计算集群上进行并行计算。
7 U" K7 ?) U  M( N% u$ ]1 S2 K$ b; l

* U! L7 T) o" J徐直军表示,MindSpore会在明年第一季度正式开源。
/ O! c: Q$ W, B
3 q0 i" O  R+ `5 s

# j- g2 q4 h- o7 E/ U! N2 w4 l2 {( g
' k6 O  K1 q8 }) p) ^4 {
, Z7 z- I5 A. k. k; r& a6 \
) u, {, H+ ?# ^+ ]7 [: y昇腾910正式商用
4 r1 s6 p% ^( R5 A# h3 r3 V
7 E. n3 U  q& @/ `# Z$ P
( c, @8 j1 ~& R, E0 d7 D" ]1 h7 A6 {昇腾910,在2018年10月华为全连接大会期间曝光,采用华为自研的达芬奇架构,号称“算力最强的AI处理器”,采用7nm工艺制程,最大功耗为350W,实测310W。
8 S* N" l" j- B/ S# U# @" f# Y7 E. _; b9 L, B) S  ]
/ j# V3 [- [% Z
此次发布用于上市商用,直接对标英伟达Tesla V100,主打深度学习的训练场景,主要客户面向AI数据科学家和工程师。5 b6 z6 }6 g0 K# i
  F, [; e' |9 l
( ]! e* c% ?# i1 T
主要性能数据如下:
* {) h1 m% L, ?- E7 X1 w
2 z6 w. ], t/ X8 l2 I
7 K! T0 N8 Z6 C; {( V; J
    , U; h; ~% }3 ~% M
  • 半精度为(FP 16):256 Tera FLOPS;
    3 x- c1 c4 P* m. j, }- t* p; l1 m
  • 整数精度(INT 8):512 Tera FLOPS,128通道 全高清 视频解码器- H.264/265。) E6 v; l: U2 x

0 a' e/ p9 g7 R& d5 n. a8 s2 |! _' Y9 Z% u
在去年全连接大会上,华为就和友商对比了一下,battle的参赛选手包括谷歌TPU v2、谷歌TPU v3、英伟达 V100和华为的昇腾910。. F; t3 K, I2 w  a% d  M
. L0 l) @: \$ V% x* n
- h' Y9 B3 S# q/ i7 P2 e3 E$ y
“可以达到256TFLOPS,比英伟达 V100还要高出1倍!”
/ M! O( w( |( U/ c# X' S; G2 w3 i; b/ s- b
- i# c+ L* o! @) s' b# S* g

1 _0 N+ H2 m1 _' c* ?* k7 r5 B; J7 t
, v$ _; }( K  U/ }6 a1 {' m相同的功耗下,昇腾910的算力是V100的两倍,训练速度更快,用户需要得出训练产出的时间会更短。在典型案例下,对比V100,昇腾910的计算速度可以提升50%-100%。6 I/ I% s- x4 f% u4 j$ x- }
* B, I7 i9 B" V2 M5 h
8 v# M; N  j7 ~2 `  ^. @7 M
在典型的ResNet50 网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比,显示出接近2倍的性能提升。
/ e8 z# H3 F6 G4 [+ |
0 M: j/ Y' u: w. J) R5 r( O/ \5 O  Z: {/ t+ J3 @
而且徐直军还在会后明确表示:价格还没定,但肯定不会高!- E* j! v2 p& S4 Q
5 v6 p9 B& z+ H$ g
/ _: ~9 @8 |' }/ O

0 O5 {1 ]+ c* ~: l, U% h' ]! L3 r7 d; S: Q
2 U4 `5 \! {3 [2 P: e9 ]
全球格局下的华为AI进展
, k  z- V" d  b5 U& h' v0 H% O
$ Q' d2 _) g: ?# u2 n! u9 H2 r; r) x1 i
2018年10月,在华为全连接大会上,徐直军公布了华为全栈全场景 AI 战略计划,将数据获取、训练、部署等各个环节囊括在自己的框架之内,主要目的是提升效率,让AI应用开发更加容易和便捷。
6 i$ b) m2 H8 `9 |% `
& P# F5 }* G; J/ b& L2 W7 E9 C6 z" ]/ L, }. ~2 a; W
0 O8 U- h9 n0 C

" |7 H$ ~0 t0 W( a  G/ G- N6 A全场景包括:消费终端 (Consumer Device)、公有云 (Public Cloud) 、私有云 (Private Cloud)、边缘计算 (Edge Computing)、IoT行业终端 (Industrial IoT Device) 这5大类场景。
0 C2 }$ X7 g# a) o. _& B
! N& v& E) O) B- I1 I
3 e$ N+ C/ E$ O/ C4 P8 k重点在于全栈,包含基于达芬奇架构的昇腾系列芯片(Max、Lite、Mini、Tiny、Nano)、高度自动化的算子开发工具CANN、MindSpore框架和机器学习PaaS (平台即服务) ModelArts。
  D: f5 O# \& G, E2 R! y. _4 ~
. {( x" g: o9 c: l
9 j$ j9 X  E; I0 {7 [随着昇腾910正式商用以及MindSpore框架正式推出,华为全栈全场景AI解决方案愈发完善,竞争力也会随之上升。
: c4 a! N% N  B/ o) f7 @
  J* n6 [% _7 v, Z- K

% G% Z3 b% `& j/ L. g+ _3 ?
. Q" Y# a) O- _+ g2 C% G) E+ J$ [9 X0 B; Y9 h
而且,华为之AI,也不仅仅是关乎华为本身业务,也应该从更加宏观的角度去审视。+ c: p! Y, ^- A) j3 ~

- ^4 ^) Q/ e! J
; Z2 `' a- F# d& o% V当下,AI落地已经成为无可争议的大趋势,大方向。
! h/ F( h, w$ O# p% W  s. I" \& Z$ H3 {1 L

2 G. c+ y5 I6 H- D' g/ e8 d但中美关系日趋紧张的情况下,中国到底如何,也引发了更多关注。1 u6 A8 Y8 u9 L6 D

" y9 H- p% v" r$ A8 v  P
# P( ]" J6 K( z; G0 m近日,Nature最新发表了一篇,名为“Will China lead the world in AI by 2030?”,提出问题的同时,也审视了中国AI发展的现状。
% G6 g8 R) r2 ~! U9 {4 q, B+ _; h% q# u! ?( j8 n- z) W* v" O) ?9 a

  ]# m* Y# `) y7 |7 B% O文章中援引艾伦人工智能研究所数据显示,在最顶级的10%高引用论文中,中国作者占比在2018年已经达到26.5%,非常接近美国的29%。如果这一趋势持续下去,中国将在今年超过美国。
  \; m5 D( g  Z; b8 J. `
! Q% k  u& u$ P2 _9 l9 w6 Q5 d3 P3 ?
/ {, x- O/ t% M" A6 J% Z3 @

0 m: y8 `4 _6 C* i+ W$ G6 [8 l9 Q; P- v8 i. @
需要场景?数据?金钱?人才?等等,这些都不差。7 O7 |* Y6 W- q; v  x  }* j( ~

7 t( }2 r! T- p/ W

7 y+ n/ w6 ~0 g+ Z) _/ f6 @" ^, P( x$ {8 O

7 i0 f0 I3 u2 A9 y$ {* p4 e但为什么,卡脖子隐忧,AI领域依然存在。. M. I5 y) Q! d1 G+ w. a, a
: t# ~+ T4 _5 T* s, _8 b# y1 ~

! R, ~1 Z0 q8 K0 @3 B, B7 n5 h核心还在于算力(芯片)与基础技术。* z: y6 I% g! _# h9 b

, W# U2 P, J* h$ o; O$ U& l( s, t/ t! [5 L0 b) @3 g5 |
Nature文章就指出,中国在人工智能的核心技术工具方面仍然落后。目前全世界的工业和学术界广泛应用的开源AI平台TensorFlow和Caffe,由美国公司和组织开发。/ N, Q0 P8 x  A$ s6 L4 K# _

- u1 k# r; n# B) E- ~8 z$ F$ n) a+ ?9 V2 T8 {  s
框架方面,百度的PaddlePaddle飞桨也不断突破,虽然发展势头非常好,却还是显得势单力簿。
2 l8 R/ S$ u* Z0 a$ I& g6 @; Y' y: d6 z! ]

! z' O1 t+ V0 A- U8 ?更关键的是,中国在AI硬件方面的落后非常明显。全球大多数领先的AI半导体芯片都是由美国公司制造的,如英伟达、英特尔、谷歌和AMD等。
1 T/ ?+ o2 \8 }( e4 ]- K$ T3 t; ~$ z. S" r# O. O# ~3 D6 |7 Z* E4 u4 M

0 P( }( Z, w& C4 i% Y中国工程院院士、西安交通大学人工智能与机器人研究所所长郑南宁,接受Nature采访时说:“我们在设计可支持高级AI系统的计算芯片方面也缺乏专业知识。”
# i! G* B, j! r  j/ N/ v" P4 Y, F4 x6 b8 b* N2 y2 t8 h! S, B
% g! e4 |' h' F& t1 P/ f
虽然国内也有不少公司在努力,比如阿里、百度、依图、地平线等等,都涉足了AI芯片领域,但大部分都聚焦在终端SoC和推理上面,用于训练的大型算力芯片并不多。' q% e5 Y  z$ M# V, {2 S
9 s' n" [: `2 X) N
0 i4 F& a% `1 T* X5 o9 {" c7 T
郑南宁预计,中国可能需要5到10年才能达到美国和英国基础理论和算法的创新水平,但中国会实现这一目标。
: y2 U2 B8 W% \& Z+ D" Z2 p
( W7 t) w7 s' I! \( R- i  h. ]
1 Y# Q) b7 |( \4 W. o来自柏林智库的政治学者Kristin Shi-Kupfer也表示,基础理论和技术方面的贡献,将是中国实现长期AI目标的关键所在。$ V$ o3 k/ O$ p$ }, z
& ]- v6 x8 a, w+ a

' L+ I4 w1 L! `; o她同时强调,如果没有在机器学习上没有真正的突破性进展,那么中国在人工智能领域的增长,将面临发展上限。
- L5 w8 ~( M, ~9 ~1 t7 Y4 q( v6 {0 H/ o0 a

. x. p0 X! C# @4 O$ h所以,Nature的问题:中国AI,到2030年能够领先全球吗?
, O  e" w+ {  A7 ?
" X5 h3 f" O1 K- {' a% y% c% x9 G5 B; g
今天华为给出一种解法,但一切还只是开始。6 d. o. {. h* Z) n( l' O/ K% H8 ]- Z

- T$ v4 f7 t( W. `6 a" u; v; U! e( X0 T/ U! j
你怎么看?
% p$ r( s( W5 g  I- t# X0 ~, V
* ^# Y9 J# m. g) J
) k3 G( T" m1 V$ o
) p: l/ s  l6 `9 ^& r0 U+ d. j$ u
. z3 Y, q9 a( s. `9 y- T( \5 u3 P
近期精选

, J7 j- C/ B  J
任正非推荐学习的博士PPT《认识5G,发展5G》
- J$ ?; C2 T0 Y: w4 {

6 X# k! m  a* \9 r/ @0 a
任正非:在这个关头,妥协是没有出路的
; e+ k( Y/ ^' O
; l  M: I( a. X* @
孟晚舟被非法扣留画面曝光

" s: y, s) j) u; c) U0 b; U, @" U
. l* m4 Y" \! |7 R
: o& A+ c) v7 f6 F* y) s% ?, [, m& j
来源:http://mp.weixin.qq.com/s?src=11&timestamp=1566565203&ver=1808&signature=kJiPqP7QMaNeTz4HOv0jnIxH4YoRTzdKYK3wAYtCz8JM8kRgPhB5pX*qTDty6UXLEgsrczHMUrteV0TsLSFM0YRvSMNGMiqH1qwZyEksN0NSswT5raVWjOdWiFASwre1&new=1
& V$ f0 q0 L- @# d* g$ U免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-9 02:43 , Processed in 0.047408 second(s), 28 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表