|
|

: w' W; ^( f3 z' W& H/ p7 b7 R【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。; `3 [ c3 s4 B. `+ Q" W4 }7 P- A
r: M4 I' B) O( o" \8 Q7 A边缘智能被称作是人工智能的最后一公里。
9 W3 R9 u1 f7 v" a
1 s) Z" u* f( F8 Z$ rGoogle刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:) ^# c( L S6 e/ F: ^7 V% J/ Y

, U, Q2 O& m4 I, A8 R9 s' U + M7 m4 R+ I* @- Q; b L+ X* f
英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。6 i, b6 v+ ?4 g4 X
目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。4 c) J- d( N' [) ?/ O0 _
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。
8 c* U# {4 m p$ M/ R( g首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。
: `. C/ V: K2 w' }2 B2 i0 ~
" \7 A" ?, _$ V+ m' [对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。
8 v E8 ~0 ]% _. o5 V, Z" m O: J c: N/ k
对比结果 先来看最终的结果:+ q/ Z' F! A/ i1 A3 k, a6 u' D
% I) o9 q* S: R5 D) F
线性刻度,FPS
: N, [( v4 @- o5 X2 {, l- X: ?对数刻度,FPS
5 @1 |, J% D+ i2 T9 Z+ c! }4 Y# L! h& Z% y3 H& c/ |2 D
$ t9 p/ ~2 X! T: P
线性刻度,推理时间(250x)
' S8 @% c0 g% \+ i
# d8 o5 o/ S/ T6 G' w1 V4 H# D2 dSam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。7 _+ [8 S: A+ ^: t6 C7 B
对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。( C& I& g$ r4 A# u; p1 E" Q* v
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。( @# C- T; X/ C! M
NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
' L4 h. K" C: P5 @5 n2 G1 @, j7 V' j然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。$ L' E1 S5 U! a; |7 ]0 @
NVIDIA Jetson Nano
- t( k* k! a# {尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
1 ^7 t& u1 h; g, h它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。3 V3 m, Q) ]- W' a1 C6 `3 s/ i7 Q3 I

1 P b; c" R( L lGoogle Coral Edge TPU
' o* r( \5 f7 h iSam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。% t7 R( e. M' c5 a! @) W8 {

& z7 ^; Z( z7 C+ L+ K: KPenny for scale,来源:谷歌
$ W: m- L" [) e% Y; }0 z* e; s/ A1 p9 Q* d3 A; f# e7 c" p
Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。6 V% ^/ K2 U& Z

2 ~+ @! j+ a3 k( C1 l" u1 EGoogle Coral Edge TPU USB加速器, O" h' H2 B0 V4 ^
+ C4 P% ?* K8 E( h# [
下图显示了Edge TPU的基本原理。' W% M1 c% M/ _: }

" z, ^+ T; x2 k; ]3 _; S5 {像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
/ F! `' u, d# L S7 P! a
; }8 I4 z7 Z. [% Q7 R$ p卷积: G. s. }# |" [& L; O: B
5 I) `: X4 \# u# K# i6 [! _) v
这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。
' U; r+ I; `3 W0 H# Z. y我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。 X1 b# {$ L. F1 M6 e& f
总结 为什么GPU没有8位模型?
) B/ y$ N8 G8 T& l6 O+ dGPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
/ c5 S/ |" l9 G/ c- F为何选择MobileNetV2?
- w5 D" c4 R. I" N# m" G主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。6 k1 z8 ^# J/ S; V/ P
Edge TPU还有哪些其他产品?( b* E1 C g+ x6 s, w( a/ m
它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。& o9 n3 U! y. ]3 Z7 K4 e
Raspberry Pi + Coral与其他人相比
2 d) J; [1 K Z# U$ i) _, k为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。8 c1 c, X1 w& J3 L+ @ j! C2 A
i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。, A8 C, @( I5 g t- K

# f( i/ o/ G4 u& y' p
6 ?( U# y4 P$ x1 J( A! e) E【加入社群】$ M8 q: p% K, O0 |8 V3 H# Z+ l9 t
/ H7 K8 ~( L9 z1 c
' |. [$ o) s3 V. v: v) i: _5 \来源:http://www.yidianzixun.com/article/0Lt3VMHK2 c5 s+ k9 C. y/ W
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|