|
|
4 C% E* _4 u. R% I
【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。' H- T5 Y+ i, R
; z1 w1 v0 ^% U边缘智能被称作是人工智能的最后一公里。( j+ L3 o& E6 @5 n! T6 i; L
0 t e% d$ F7 {4 Z. @Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:
7 F- e% K' F$ j! }; @ # z: q8 A& W$ P0 Q/ E" M" X
$ P4 `# T& N. g$ J% x
英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。1 o% }. R- \0 w+ e, N: d+ L* M
目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。7 C* L, O- @/ }
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。
$ u6 k$ g Y7 Q! i& N. ]首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。" ^0 H! k$ o9 X0 \2 Z$ @0 l
# S" z3 v/ U1 s2 I9 t$ R/ h" [
对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。; D- G, G' S; T0 J' R% O9 q
& A& T) Z! K8 y2 u$ C
对比结果 先来看最终的结果:
# l% H2 L8 K3 H8 V : |, \ g8 T0 s
线性刻度,FPS 0 E- H5 J# f' l7 ?) {0 C3 z
对数刻度,FPS2 @. Q( }% @" P9 B. Y6 F ~
) O& _1 f# W9 N( d% N2 W) E
6 Q8 g/ Z! I: J$ d/ Q5 _8 Q9 R线性刻度,推理时间(250x)$ T8 b3 a' ~. ?; Q+ u4 ~
6 y! F* h5 D9 }5 R% o& G3 K4 NSam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。+ Q- f! `: ], }5 [
对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。
3 b# [: u1 V2 G0 ^4 V" [我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
D. C4 z+ o; }- n/ z% MNVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。2 h% @; q( P1 J1 w/ O; N# m0 k
然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。
0 @. M! Z% u) q A1 M4 C8 l* Z, \* J; ENVIDIA Jetson Nano& F5 M, C$ w: p4 k# `1 ^9 l
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:6 T1 a0 O9 Y4 M5 g# {) o
它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。7 L( ^& N; x+ w( C

! J c) C# Q( b1 a; N; GGoogle Coral Edge TPU
: Z. X9 m$ K* G! H- y6 e9 ESam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。 N& d: x0 \. _* G
} I& w( L8 h' x' ^* e$ s
Penny for scale,来源:谷歌: @5 @. D1 i9 l' T& { g
* e7 @' }0 J# Q4 P, j9 q/ m0 E7 `2 uEdge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。
; j/ k P9 j( m+ v# V5 X: v . i6 W T9 H, |2 g
Google Coral Edge TPU USB加速器: d) j7 G9 s1 D# P8 ]9 I% z3 N" h$ o
2 a' w4 C" ^! D l( K! m
下图显示了Edge TPU的基本原理。
9 A! r* F) q" ?( {, c# E ( R" v! ]5 Q# x6 j
像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
( b' ~5 z) U2 c0 z1 c( m+ m8 [2 \6 D
3 h& ?5 w- O% M* W卷积% L9 p/ P8 I/ t' {$ V3 [
2 ]' p- x! m6 c$ i" F! D y这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。
) r: _) G6 u7 r我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。1 D: r: c( K6 T% J) Q
总结 为什么GPU没有8位模型?
& g, k3 k& v* `GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。
( M! \% {1 N! A8 m6 D, m为何选择MobileNetV2?
( m! P! m8 O2 E" U主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。+ h% j/ p5 x( s! L: M$ s$ |7 U
Edge TPU还有哪些其他产品?7 A4 x5 D7 v; a' k( N0 f: Q
它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。
9 A2 n0 u. D* Y; p" MRaspberry Pi + Coral与其他人相比
- n% r" B% D- f; a5 }4 \为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。* r, S H$ O" e7 ?* L- t5 D
i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。( a' d) E- [5 k% M2 B6 j' B

$ V( J* X1 Q7 J- l. ~ ! ]' B% Q+ i& W( w3 N
【加入社群】# S, c4 L3 j: g. b2 L
, o; A9 Q% \; t5 z! I" \& L
( {/ L i9 y1 @/ K2 Z; S+ ^6 [0 T来源:http://www.yidianzixun.com/article/0Lt3VMHK3 {$ G# M0 N5 t2 w8 P& u( X4 H& `2 X
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|