|
|

+ g6 [8 v# j! Z( e. ~, O# S4 a【新智元导读】Google Coral Edge TPU和NVIDIA Jetson Nano大比拼!本文从分别对两款最新推出的EdgeAI芯片做了对比,分析了二者各自的优劣势。
6 k8 \( v: J/ w7 O' X& _
/ X- Z5 `+ Y# y; w) b边缘智能被称作是人工智能的最后一公里。
, A, o+ M8 g. d: G: ]5 P+ h6 K- _6 g! j4 s/ b
Google刚刚在3月份推出了Coral Edge TPU,是一款售价不到1000元人民币的开发板(Coral Dev Board),由Edge TPU模块和 Baseboard 组成。参数如下:2 a% A8 o0 f& A7 P v/ T* t9 e, V

5 A, h+ a) M1 G
4 l' G2 Q8 V: A/ B1 O7 g9 b英伟达同样在上个月发布了最新的NVIDIA Jetson Nano,Jetson Nano是一款类似于树莓派的嵌入式电脑设备,其搭载了四核Cortex-A57处理器,GPU则是拥有128个NVIDIA CUDA核心的NVIDIA麦克斯韦架构显卡,内存4GB LPDDR4,存储则为16GB eMMC 5.1,支持4K 60Hz视频解码。( c8 H) T9 w- M3 ^
目前位置并没有太多关于这两款产品的评测报告。今天新智元为大家带来一篇由网友Sam Sterckval对两款产品的评测,除此以外他还测试了i7-7700K + GTX1080(2560CUDA),Raspberry Pi 3B +,以及一个2014年的MacBook pro包含一个i7-4870HQ(没有支持CUDA的内核)。2 ~$ Z, O E" z a j+ p& Z
Sam使用MobileNetV2作为分类器,在imagenet数据集上进行预训练,直接从Keras使用这个模型,后端则使用TensorFlow。使用GPU的浮点权重,以及CPU和Coral Edge TPU的8bit量化tflite版本。3 M8 C) \( J! k/ u4 D& m
首先,加载模型以及一张喜鹊图像。先执行1个预测作为预热,Sam发现第一个预测总是比随后的预测更能说明问题。然后Sleep 1秒,确保所有的线程的活动都终止,然后对同一图像进行250次分类。
" u1 `% V1 L ^4 Q* \: q1 w# v 6 ~3 i) x+ L1 U$ _
对所有分类使用相同的图像,能够确保在整个测试过程中保持接近的数据总线。
( g& M, ~9 |! i( r
) q. I( S5 w! D; x7 R* e& T对比结果 先来看最终的结果:
# I2 O1 J* N2 B" \ ' r- [! z! ?6 P: |4 |" [+ D( |% B( H
线性刻度,FPS ! p# f$ E; x4 N4 `6 D a: Z$ j1 T
对数刻度,FPS& f. O1 s4 M. p# K& e, `1 \
( d) X, S1 K/ b. ?
, B4 `# p) F: ~ I3 f
线性刻度,推理时间(250x)
# l" ~3 n( t7 X' j3 M" I2 P
* z) Z' T( Q, `# ~8 _- GSam发现使用CPU的量化tflite模型得分是不同的,但似乎它总是返回与其它产品相同的预测结果,他怀疑模型有点奇怪,但能确保它不会影响性能。
1 e8 Y. \( Q- E0 Z' @对比分析 第一个柱状图中我们可以看到有3个比较突出的数据,其中两个2个是由Google Coral Edge TPU USB加速器实现的,第3个是由英特尔i7-7700K辅助NVIDIA GTX1080实现。
}+ d/ Y, Z5 j我们再仔细对比一下就会发现,GTX1080实际上完全无法跟Google的Coral对飚。要知道GTX1080的最大功率为180W,而Coral Edge TPU只有2.5W。
8 i+ E% N7 C/ o, W0 [NVIDIA Jetson Nano的得分并不高。虽然它有一个支持CUDA的GPU,但实际上并没比那台2014年MBP的i7-4870HQ快太多,但毕竟还是比这款四核,超线程的CPU要快。
5 I+ H- I8 s5 F, F6 N" Z然而相比i7 50W的能耗,Jetson Nano平均能耗始终保持在12.5W,也就是说功耗降低75%,性能提升了10%。
; O8 f, L" a) b# _; ONVIDIA Jetson Nano4 Z9 B* N# _3 f% y% B; W
尽管Jetson Nano并没有在MobileNetV2分类器中表现出令人印象深刻的FPS率,但它的优势非常明显:
3 c. h2 I2 P8 i, F; l: z2 h它很便宜,能耗低,更重要的是,它运行TensorFlow-gpu或任何其他ML平台的操作,和我们平时使用的其他设备一样。只要我们的脚本没有深入到CPU体系结构中,就可以运行与i7 + CUDA GPU完全相同的脚本,也可以进行训练!Sam强烈希望NVIDIA应该使用TensorFlow预加载L4T。
( {" C6 X& c( w1 G) t7 }4 N. Y s$ w" g4 N8 L# M1 Q2 t: i9 K
Google Coral Edge TPU$ v' ~5 T" R1 V$ D0 ^
Sam毫不掩饰的表达了他对Google Coral Edge TPU的精心设计以及高效率的喜爱。下图我们可以对比Edge TPU有多小。6 |% t- j# o( p* d! u
) R' Q L; b& a; l! P. q8 R
Penny for scale,来源:谷歌
: |8 G$ j6 l- w7 s3 ]- M4 z% }: n
1 p6 P% N; V7 n+ J8 j( z: i* gEdge TPU就是所谓的“ASIC”(专用集成电路),这意味着它具有FET等小型电子部件,以及能够直接在硅层上烧制,这样它就可以加快在特定场景下的推力速度。但Edge TPU无法执行反向传播。
* {! b, \/ s( D) C7 G5 x* C y
- ~) Q, ]4 M/ i! J" e- iGoogle Coral Edge TPU USB加速器( {% E0 s x5 N
6 Z7 ^! k3 @8 G7 M7 |( Z
下图显示了Edge TPU的基本原理。3 R0 i& I+ `0 n9 S7 A# _

3 t6 }; @; T) T; j$ ?2 W; F像MobileNetV2这样的网络主要由后面带有激活层的卷积组成。公式如下:
; B/ O" N& X/ g. @
; d) f. @0 z* K卷积
. T7 U, A( n. B$ z+ ?/ J; d7 M5 m
/ X, ~' }# q( X) [, G这意味着将图像的每个元素(像素)与内核的每个像素相乘,然后将这些结果相加,以创建新的“图像”(特征图)。这正是Edge TPU的主要工作。将所有内容同时相乘,然后以疯狂的速度添加所有内容。这背后没有CPU,只要你将数据泵入左边的缓冲区就可以了。5 U5 D @! |% z0 r- d5 M* w
我们看到Coral在性能/瓦特的对比中,差异如此大的原因,它是一堆电子设备,旨在完成所需的按位操作,基本上没有任何开销。
2 I$ D9 a. `9 a. Q w1 U q总结 为什么GPU没有8位模型?
1 }' z- f" e' m7 O* uGPU本质上被设计为细粒度并行浮点计算器。而Edge TPU设计用于执行8位操作,并且CPU具有比完全位宽浮点数更快的8位内容更快的方法,因为它们在很多情况下必须处理这个问题。% n5 F* d$ s( H" k
为何选择MobileNetV2?! F$ d0 j) {0 Q1 i: _- g$ K, p0 D
主要原因是,MobileNetV2是谷歌为Edge TPU提供的预编译模型之一。% X3 d& O- ^* F. A5 P
Edge TPU还有哪些其他产品?
* ~3 L; e8 D' u9 E: ]它曾经是不同版本的MobileNet和Inception,截至上周末,谷歌推出了一个更新,允许我们编译自定义TensorFlow Lite模型。但仅限于TensorFlow Lite模型。而反观Jetson Nano就没有这方面的限制。7 J# [) ~* J- s) s
Raspberry Pi + Coral与其他人相比4 P% X0 U w C- J: S
为什么连接到Raspberry Pi时Coral看起来要慢得多?因为Raspberry Pi只有USB 2.0端口。
# C+ g3 \- X: w4 ^" r/ i- ii7-7700K在Coral和Jetson Nano上的速度都会更快一些,但仍然无法和后两者比肩。因此推测瓶颈是数据速率,不是Edge TPU。1 `- p& f! e o" ^! y( c" ?
1 P/ e7 K9 j( F! A$ J: v* g' J

1 Y# u ?4 B# p& B: s【加入社群】
5 @3 O' H8 Q, u" V7 Y 0 [2 F( _# f$ d
; L5 d+ T' |" u/ u3 `9 F! B& X! [来源:http://www.yidianzixun.com/article/0Lt3VMHK9 F, b% @! v+ I7 u( G
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作! |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|