|
|
4 y0 ~7 j! q! a+ y% H( o/ _
【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。/ D% N [3 k9 Y/ s$ i/ H
7 q5 b, n7 P, I# ]! R
边缘智能被称作是人工智能的最后一公里。( ]! ~) U9 j4 `1 P( p3 c0 ~% v6 y8 q
) n1 R2 z. H' x g2 ]9 ~
Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:" {9 _# q9 e/ q1 I4 Q& g- @

/ ~2 _# O; U3 z- n& q- Y - `4 E' ^. u i" J- E/ m
英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。
3 X. Z5 w, _7 ]# O Y8 i& E目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。
) e+ l% {, P4 ] A2 A9 v- p& JSam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。: @; p. u% ?9 n+ N9 b
首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。
3 \3 J) u2 a3 x8 z4 Z+ Q3 }0 ]9 p & ~1 O1 J1 F9 d9 H" M
对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。
9 D4 P! v5 G* ~3 |1 c/ r4 N0 Q6 p. o {
; e& G3 B6 v- o3 H对比结果 先来看最终的结果:" \5 `8 S$ W) e( L2 V+ h; K+ v
( {6 d( [5 ]( |7 B
线性刻度,FPS 3 o, \0 Y0 v5 S8 F1 N
对数刻度,FPS) K0 R3 g/ R% v1 {
8 u' Q* A+ s7 R" z
P" n! C9 c: R, Z线性刻度,推理时间(250x)
1 k; K& t# G. d9 a2 B2 m4 e \! V- @: u
: Z6 v1 _0 w9 b" y) {Sam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。
; h E( j& b! \5 V' J对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。3 ~& h, f4 H0 b* O- {
我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
0 G5 I, @$ Z) @, Z# a* Y; }NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
3 Z- O8 V( S2 \0 F' k' s7 {然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。$ U. s6 W4 |* Z/ t& V5 Z
NVIDIA Jetson Nano7 ], n6 K) U9 ?2 N7 o1 p
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:% C& `' r: q: o3 G" o( O
它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。+ m3 ~7 B0 U8 D8 Y A" y0 q

[: A$ x( S! S4 w, aGoogle Coral Edge TPU b, r8 I2 V& `
Sam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。( {# V7 v& L) W

9 J- A o, D- U4 lPenny for scale,来源:谷歌
9 [: {) k! G/ L+ k- x3 P9 W+ I# e1 D
Edge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。2 B, E# \" P' H) F# g
8 y2 @- P6 {1 v' E$ {% x3 M
Google Coral Edge TPU USB加速器
8 d+ D0 k* ?, I6 }+ J: ~+ C( |* q6 ^$ m. W
下图显示了Edge TPU的基本原理。
" J( o7 g) @6 u$ f
! M: C4 ?6 _ S像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:) ~" S' T+ \7 b* ~9 _4 ]

8 N" x) h. o- \# @% A0 B9 f+ K7 E卷积
3 b; f# t/ L0 R- P3 H0 i1 n$ G6 G
1 D8 k C; ^! W. G. I( c0 i0 l0 c9 Y这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。( Q& T- K& P0 u7 C. f8 s4 a
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。
$ o# O( T3 i8 [0 z" k总结 为什么GPU没有8位模型?/ l& f F( R7 N% O0 H
GPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。2 w: T1 c# b9 {3 }+ e
为何选择MobileNetV2?
+ e+ k! ^% ^; T主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。/ Q* F( `, S w. N6 B/ ~
Edge TPU还有哪些其他产品?
' s0 j6 a8 J8 a7 z! E; x它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。5 O$ b' J* c6 B+ s; p. g) o
Raspberry Pi + Coral与其他人相比2 w9 l; @' H5 O* P5 O
为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。& k, a! O: y% k$ ?
i7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。
3 E ^& m+ J. x$ H: O' P% S, T: T
: a5 i5 v1 M9 Z/ c# |' r' G6 l 0 f7 i3 ~, ~, D6 `1 C- q6 u& R
【加入社群】
; [8 P: ~- f; O D
" k* @* [+ [9 f) s- y9 K8 X5 Z0 G
; C* b. T, l3 m, V& m0 U+ K来源:http://www.yidianzixun.com/article/0Lt3VMHK/ x, E# e/ Z9 f! C
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|