目录
一. Jetson概述
二. Jetson系列
2.1 产品图谱
2.2 参数对比
2.3Xavier NX模组
三. NVIDIA GPU
3.1 架构演变
3.2 Volta GPU
四. Xavier NX开发套件
一. Jetson概述
NVIDIA®Jetson™是世界领先的平台,适用于自主机器和其他嵌入式应用进行边缘计算部署。例如自主机器人,便携式医疗设备等。
Jetson平台被广泛应用于,智能工业,零售,医疗等行业。
Grundium 数字切片扫描仪Ouva 医患行为监控
NVIDIA®Jetson™平台包括 Jetson 模组(外形小巧的高性能计算机)、用于加速软件的 NVIDIA JetPack™SDK,以及包含传感器、SDK、服务和产品的生态系统,从而加快开发速度。
Jetson平台具有体积小,功耗低,软硬件均可裁剪,可定制化程度高,系统开源等优势。
二. Jetson系列
2.1 产品图谱
Jetson系列模组尺寸小巧,但能提供强大AI算力,尺寸在100mm以内,AI算力最高可达几百TOPS,其中Xavier NX为70mm x 45mm,AI算力为21TOPS。
注:TOPS:万亿次/秒,GOPS:亿次/秒
2.2 参数对比
2.3Xavier NX模组
后续采用的开发板是基于Xavier NX模组,所以这里着重介绍下NX模组的参数。
Xavier NX模组拥有384个CUDA cores,48个Tensor Cores,6个基于Arm-V8架构的核心,最高16GB的DDR4,支持音视频硬件解码和编码,还有丰富的外设接口,如USB,Ethernet,UART,IIC,CAN,GPIO等。
三. NVIDIA GPU
Jetson模组内部集成用于AI算法GPU,是整个模组的关键,也是英伟达的看家本领,这里介绍下其GPU。
3.1 架构演变
英伟达GPU架构历经多次演变,从2008年的Tesla架构到2020年的Ampere架构。
2017年发布的Volta架构完全以深度学习为核心,并引入了Tensor Core进行矩阵乘法运算。
3.2 Volta GPU
Xavier NX模组采用的是适用于深度学习的 Volta架构GPU,所以这里着重讲一下。
1.Cuda Core
GPU内部的运算单元,可提供INT和Float类型的运算。
Volta架构中Cuda Core拆分为1个FP32 Core+1个INT32 Core,可以同时执行FP32和INT32的操作。
2. Tensor Core
专门针对Deep Learning应用而设计的计算单元,实际上是一种矩阵乘累加的计算单元。矩阵乘累加计算在Deep Learning网络层算法中,比如卷积层、全连接层等是最重要、最耗时的一部分。
四. Xavier NX开发套件
后续的环境搭建,以及AI应用的部署,都在此开发套件进行
Xavier NX开发套件拥有DP和HDMI接口可连接显示器,两个CSI接口用于摄像头,M.2接口扩展固态硬盘,4个USB3.1口,一路以太网口,还引出了40PIN IO口按需使用。 开发套件支持Jetpack开发包,可搭载Ubunt20.04系统,支持主流深度学习框架,TensorFlow,PyTorch,Caffe等。
从下一篇开始,开始写在Xavier NX开发套件进行环境搭建,和应用部署