|
|
今年的《政府工作报告》中,首次写入了“智能+”相关命题与讨论。这一国家政策方针,指明了智能技术必须与产业结合,进入生产核心领域,才能达成为现有经济体解放生产力,提高生产效率的目标。* Y* `4 \- }( V; _
而“+智能”的实现,也为各行各业和服务于全社会的ICT基础设施提出了新的挑战。当智能化浪潮袭来,各行各业都将提出对计算的新应用、新场景和新需求。而为了应对这些变量,其实还有大量棘手的问题需要解决。7 D$ y6 c, E1 n0 Q3 y) @: }- F+ ]
其中最关键的问题,来自算力。
. L' I1 d$ |, ~& l; b% u( ^ m 根据OpenAI统计,从2012年到2018年,全球对AI算力的需求提高了30万倍,而算力供给却远远不足。而在普遍的算力饥渴中,最急待升级的算力输出口,应该就是数据中心。
$ n7 t& b6 k8 C# ~- n7 ]我们知道,在今天这个大数据时代,最主要的计算和存储都已经发生在了数据中心当中。数据中心就像整个计算世界的心脏,供给着所有计算相关的数据血液流动,驱动ICT产业正常运转。
C. P8 Q1 q7 Q/ _- ^如果说+智能是一套新的武功,那么能不能快速将其融会贯通,很大程度上将取决于习武者是否有一颗“大心脏”。否则刚练了没几下,心脏供血先不足了,那岂不是自讨没趣?
2 w; m( M4 j n$ G# N @为了练就智能计算时代强大的“心肺功能”,需要解决哪些问题?) z5 n! \, r) u: Q7 H+ A
据了解,从成立以来就接连有大动作出手的华为智能计算业务部,接下来将把目标对准计算世界的中央:数据中心与架设其中的服务器。那么不妨借这个机会,让我们先来了解一下,数据中心这颗计算世界的心脏,在今天到底面临着哪些问题。
0 n0 r1 U8 s1 u- }- p W计算需求在提速,数据中心跟得上吗?( O' P9 W( Z7 R |4 M2 M- q$ Q
在云计算和互联网带来的通用计算时代,数据中心实质上也就是全球计算系统的中枢。( t3 j% v/ u% e8 C8 X9 ]* P
1978年,英特尔推出了8060中央处理器,同时发布了x86指令集架构。此后,这一指令集成为了通用计算时代的代表。而随着计算需求日益庞大,网络传输能力日益增强,计算产业开始进行更加集成化的计算处理模式。于是就产生了集中计算、集中存储的数据中心模式。而基于x86指令集的计算服务器,依旧是传统数据中心的主要构成体。0 h( l! M6 j5 }5 r: B K; x2 w
然而随着技术的不断进步,数据中心也开始承担越来越多的压力。比如说视频和图像任务开始越来越多,AI更是提出了完全不同的、基于多层神经网络的运算任务需求,这些计算任务仅仅使用通用CPU计算,其效率会越来越差。
4 o( d; n) s3 z' g# ?& B 而随着对AI等智能计算任务的需求量大幅提升,相关数据呈现爆炸趋势,各行业开始产生不同的计算与存储要求,这就让传统数据中心更加难以负载。1 ?, v" [. U6 O) O" k- i
总体来说,这个问题有两种解决方案,一就是兴建更多大型数据中心,但这个显然不能作为绝对方案,二就是对现有数据中心,尤其是其使用的服务器进行智能化升级,让数据中心跟上智能时代的进化需求。
3 a f6 ~0 ?2 o7 F8 Z总体来说,数据中心的升级要解决两个宏观问题。
0 j; j% |# W$ m9 W% m2 q* x首先当然是针对视频图像、神经网络等新需求的算力提升,摆脱过度依赖CPU的历史。让算力供给充沛,把昂贵的算力成本降低,让算力适应新的计算需求。 }' Q1 T% E% D8 P6 I- E
其次,是对数据中心的运维管理进行升级。今天随着数据中心的处理数据越来越多,设备体系越来越复杂,已经陆续出现了“建得起,管不起”的现象,以至于人力根本无法承受数据中心运维任务的复杂程度加速。
$ J6 S, t# }8 Y此外,大型数据中心还在变成新型的“电老虎”,而其实饱和制冷模式要浪费大量的能源,这也是数据中心需要重新审视的问题。
% f. X0 Q: ~- U- p3 X. w3 f2 d- t由以上逻辑可以看出,数据中心的智能时代升级,主要需要解决两方面问题:内在的服务器迭代,以及运维场景的全局进化。4 A. f6 Q8 p' l9 y, R: \
智能计算的新需求:服务器本身的升级空间
0 E' i+ ~; u5 ?. u; Y/ b4 }让我们先来看看第一个问题,数据中心服务器在今天要进行哪些升级进化?% M9 O! I" n' x) N
AI的到来,事实上对计算提出了一个体系化的考验。比如说在自动驾驶场景中,训练计算需要处理视频和图像,这就需要对图像任务进行处理的针对性算力。然后还要拥有深度神经网络等AI算法的专项加速能力,确保训练效率可以达标。而在自动驾驶训练过程中,数据吞吐量是异常庞大的,网络需求和存储需求也都较互联网任务有着指数级提升。3 w( L* w& G! z
一般来说,在智能计算的任务需求下,服务器被要求进行三个方面的能力进化。
, \1 w3 u( V# H% `( S3 j$ n 1、性能更强,兼容性更好的异构计算能力,能够适应不同数据类型的大规模处理。' X4 a' A8 k# T4 J; L* a' S, t6 p
2、强大的网络处理能力,能够融合不同网络协议,确保低时延、大流量的网络传输。3 [4 \: E5 h9 F7 |
3、数据吞吐能力进一步升级,对主流数据库有更好的性能加持。2 C0 j3 v7 u) i: z B) i
服务器可以说是数据中心的核心,核心算力的进化才能确保智能进化准确完成。然而另一个角度看,数据中心本身也是一个不断复杂化的场景。数据中心的运维与节能,对于整个计算产业来说也是至关重要的。
* k$ D- x& c1 S# ~大数据,大中心:大规模部署场景的进化! M, e$ ?# {0 U3 k! r
如果我们把数据中心看作一个工厂,就会发现今天这间工厂,正在经历从传统工业的粗放型增长方式,逐步过渡到精细化、自动化增长方式的过度。0 J& S u8 {- l, @# Y3 |
比如说,为了提高算力,数据中心普遍都在经历越建越大的变化过程。不断增多的服务器,海量汇集的数据和存储卡,意味着数据中心本身在变得越来越复杂。这种趋势发展下去,将会面临两大问题,一是运维工作的复杂程度,很快将超过人工所能负载的极限;二是庞大的数据中心场景意味着饱和式制冷,将消耗过量的资源。
5 ?9 U9 X& A3 [7 [4 `2 y这两大问题的出现,要求数据中心自身的服务系统进行更多进化。总地来说,数据中心场景正在呼唤“四个进化”:4 ^: O0 J" e- d1 W
1、运维进化,降低人工干预次数以及运维难度,推升利用智能技术解决运维问题的解决方案,让复杂的运维变得简单易操作。
" s; G) u+ J3 P2 J1 i2、智能服务器部署与软件管理,对数据中心软硬件部署和管理实现整体优化,减少高频次重复劳动。
% H" Q+ J- S. r1 X3、自动诊断和修复,运用机器学习技术主动发现故障源,快速排查,机器自动修复,降低服务器故障率。
6 W+ e6 v, d% B2 [: x: D6 j4、功耗管理迈上新台阶,将服务器的耗电与制冷需求进行连接,实现数据中心L1与L2的联动。达成低功耗低能耗的目标,降低数据中心整体用电。5 l0 o3 j0 L! H/ s
这四个进化,意味着数据中心的进化方向,也是ICT产业本身实现智能化的标志之一。
* J. f( H0 }9 @" c; y0 F" E酝酿“大心脏“的华为( `, k. q9 `) [+ n! o
去年年底,华为成立了智能计算业务部,开始将智能计算产业作为整体需求,针对不同的计算需求与业务场景,提供相应的智能计算解决方案。$ g1 ~* J5 j6 ?" w9 S! }
迄今为止,华为智能计算业务部发布了Atlas人工智能计算平台(包括Atlas 200 AI加速模块、Atlas 300 AI加速卡、Atlas 500智能小站和Atlas 800 AI一体机)、智能驾驶计算平台心MDC 600、关键业务服务器KunLun V5等产品和解决方案,而下一步的重头戏,则很有可能聚焦在数据中心与服务器,这个智能计算的核心场景中。将目前x86系列产品中的主打产品,FusionServer服务器进行进一步升级。将数据中心在今天可能面对的内外两个系统问题、多种升级阻碍一网打尽。 J! }* k6 t4 \3 g. T
为酝酿一颗“大心脏”,迎接智能时代的快速到来,华为将在智能计算话题中给出哪些新的答案?让我们一同期待4月3日的发布会吧。
: ?. S4 f, p6 ` ~5 P2 {, }; |
: ^& E- S# r- @+ M! V, N3 u来源:http://www.yidianzixun.com/article/0LdFnRio
! H; D9 \5 b6 J# j- S免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|