目录

一. Jetson概述

二. Jetson系列

2.1 产品图谱

2.2 参数对比

2.3Xavier NX模组

三. NVIDIA GPU

3.1 架构演变

3.2 Volta GPU

四. Xavier NX开发套件


一. Jetson概述

NVIDIA®Jetson是世界领先的平台,适用于自主机器和其他嵌入式应用进行边缘计算部署。例如自主机器人,便携式医疗设备等。

Jetson平台被广泛应用于,智能工业,零售,医疗等行业。

Grundium 数字切片扫描仪Ouva 医患行为监控

NVIDIA®Jetson平台包括 Jetson 模组(外形小巧的高性能计算机)、用于加速软件的 NVIDIA JetPackSDK,以及包含传感器、SDK、服务和产品的生态系统,从而加快开发速度。

Jetson平台具有体积小,功耗低,软硬件均可裁剪,可定制化程度高,系统开源等优势。

二. Jetson系列

2.1 产品图谱

Jetson系列模组尺寸小巧,但能提供强大AI算力,尺寸在100mm以内,AI算力最高可达几百TOPS,其中Xavier NX70mm x 45mmAI算力为21TOPS

注:TOPS:万亿次/秒,GOPS:亿次/

2.2 参数对比

2.3Xavier NX模组

后续采用的开发板是基于Xavier NX模组,所以这里着重介绍下NX模组的参数。

Xavier NX模组拥有384CUDA cores,48Tensor Cores,6个基于Arm-V8架构的核心,最高16GBDDR4,支持音视频硬件解码和编码,还有丰富的外设接口,如USBEthernetUARTIICCANGPIO

三. NVIDIA GPU

Jetson模组内部集成用于AI算法GPU,是整个模组的关键,也是英伟达的看家本领,这里介绍下其GPU。

3.1 架构演变

英伟达GPU架构历经多次演变,从2008年的Tesla架构到2020年的Ampere架构。

2017年发布的Volta架构完全以深度学习为核心,并引入了Tensor Core进行矩阵乘法运算。

3.2 Volta GPU

Xavier NX模组采用的是适用于深度学习的 Volta架构GPU,所以这里着重讲一下。

1.Cuda Core

GPU内部的运算单元,可提供INTFloat类型的运算

Volta架构中Cuda Core拆分为1FP32 Core+1INT32 Core,可以同时执行FP32INT32的操作

2. Tensor Core

专门针对Deep Learning应用而设计的计算单元,实际上是一种矩阵乘累加的计算单元。矩阵乘累加计算在Deep Learning网络层算法中,比如卷积层、全连接层等是最重要、最耗时的一部分

四. Xavier NX开发套件

后续的环境搭建,以及AI应用的部署,都在此开发套件进行

Xavier NX开发套件拥有DPHDMI接口可连接显示器,两个CSI接口用于摄像头,M.2接口扩展固态硬盘,4USB3.1口,一路以太网口,还引出了40PIN IO口按需使用。 开发套件支持Jetpack开发包,可搭载Ubunt20.04系统,支持主流深度学习框架,TensorFlowPyTorch,Caffe等。

从下一篇开始,开始写在Xavier NX开发套件进行环境搭建,和应用部署