如何查看CUDA算力/内存总量/架构信息等

终端进到装CUDA的目录C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\extras\demo_suite

然后输入deviceQuery

如果报错，就加个./deviceQuery

结果如下所示：

这段信息是与 NVIDIA GeForce RTX 4090 显卡相关的设备信息。下面对每一行进行解释：

Device 0: “NVIDIA GeForce RTX 4090”: 表示设备索引为0，型号为”NVIDIA GeForce RTX 4090″的显卡。
CUDA Driver Version / Runtime Version: CUDA驱动程序版本和运行时版本分别为12.0和11.6。
CUDA Capability Major/Minor version number: 显卡的CUDA计算能力主/次版本号为8.9。
Total amount of global memory: 显存总量为24564 MBytes（25756696576字节）。
MapSMtoCores for SM 8.9 is undefined. Default to use 128 Cores/SM: 对于8.9版本的SM（Streaming Multiprocessor），128个CUDA核心/SM是默认值。
(128) Multiprocessors, (128) CUDA Cores/MP: 总共有128个多处理器（Multiprocessors），每个多处理器有128个CUDA核心。
GPU Max Clock rate: 显卡的最大时钟频率为2535 MHz（2.54 GHz）。
Memory Clock rate: 显存的时钟频率为10501 Mhz。
Memory Bus Width: 显存总线宽度为384位。
L2 Cache Size: L2缓存大小为75497472字节。
Maximum Texture Dimension Size (x,y,z): 最大纹理维度大小为1D=(131072)，2D=(131072, 65536)，3D=(16384, 16384, 16384)。
Maximum Layered 1D/2D Texture Size: 最大分层纹理大小为1D=(32768)，2048层；2D=(32768, 32768)，2048层。
Total amount of constant memory: 常量内存总量（zu为占位符）。
Total amount of shared memory per block: 每个线程块的共享内存总量（zu为占位符）。
Total number of registers available per block: 每个线程块可用的寄存器数为65536个。
Warp size: 线程束（warp）大小为32个线程。
Maximum number of threads per multiprocessor/block: 每个多处理器/线程块中的最大线程数分别为1536和1024个。
Max dimension size of a thread block/grid size: 线程块/网格的最大维度大小分别为(x,y,z)=(1024, 1024, 64)和(x,y,z)=(2147483647, 65535, 65535)。
Maximum memory pitch: 最大内存跨度（pitch）大小（zu为占位符）。
Texture alignment: 纹理内存对齐要求（zu为占位符）。
Concurrent copy and kernel execution: 是否支持并发的数据拷贝和核函数执行，这里是支持的。
Run time limit on kernels: 核函数的运行时间限制，这里是支持的。
Integrated GPU sharing Host Memory: 是否与主机内存共享，这里是不支持的。
Support host page-locked memory mapping: 是否支持主机页锁定内存映射，这里是支持的。
Alignment requirement for Surfaces: 表面（Surface）内存对齐要求，这里是支持的。
Device has ECC support: 设备是否支持ECC（Error Correcting Code）校验，这里是禁用的。
CUDA Device Driver Mode (TCC or WDDM): CUDA设备驱动程序模式，这里是WDDM（Windows显示驱动模型）。
Device supports Unified Addressing (UVA): 设备是否支持统一寻址（Unified Addressing），这里是支持的。
Device supports Compute Preemption: 设备是否支持计算抢占，这里是支持的。
Supports Cooperative Kernel Launch: 是否支持协作式核函数启动，这里是支持的。
Supports MultiDevice Co-op Kernel Launch: 是否支持多设备的协作式核函数启动，这里是不支持的。
Device PCI Domain ID / Bus ID / location ID: 设备的PCI域ID、总线ID和位置ID。
Compute Mode: 计算模式，默认是多个主机线程可同时使用::cudaSetDevice()来访问设备。
deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.0, CUDA Runtime Version = 11.6, NumDevs = 1, Device0 = NVIDIA GeForce RTX 4090: CUDA设备查询的结果。
Result = PASS: 查询结果通过验证。

如何查看CUDA算力/内存总量/架构信息等

最新关注

热文推荐

ERC20（发币）

前端h5页面和后端php服务的几种部署方式

信息系统项目管理（五）信息系统安全技术

【蓝桥杯嵌入式】蓝桥杯嵌入式第十四届省赛程序真题，真题分析与代码讲解

misc刷题

VUE常见知识疑点问题总结

如何查看CUDA算力/内存总量/架构信息等

相关文章

最新关注

热文推荐