(在苹果系统下,如果文章中的图片不能正常显示,请升级Safari浏览器到最新版本,或者使用Chrome、Firefox浏览器打开。)
做深度学习离不开算力,就像到达诗和远方的旅途离不开交通工具。本文面向深度学习用户整理市面上常用的各个版本GPU的关键参数,进行汇总整理,方便大家随时查阅。如果数据有误,或有新GPU问世,或者需要补充的参数维度,各位看官可以及时通过联系方式来找我更新数据。
注:仅统计Memory在 11GB以上、发售时间在2016年及以后、算力性能满足深度学习计算要求(Cuda算力性能>=3.5)的GPU。若表中单元格为空,则为暂无数据或数据待补充。博主将不定期移除上市时间最久、已停产过时、市面上已大量退役的GPU数据信息项。
(当前数据整理截止为2024年9月)
GeForce系列
版本 | 型号 | Memory | CUDA Core | CUDA性能 | 半精度TFLOPs | 单精度TFLOPs | 双精度TFLOPs | 显存位宽 | 总线带宽 | 最大功率 | 发布时间 | 原价¥ |
50系 | RTX 5090 | 24GB | 未上市 | 15999 19999 | ||||||||
40系 | RTX 4090 Ti | 24GB | 未上市 | 15999 | ||||||||
40系 | RTX 4090 | 24GB GDDR6X | 16384 | 8.9 | 330 | 82.6 | 384位 | 1008GB/s | 450w | 2022 10.12 | 12999 | |
40系 | RTX 4090D | 24GB | 14592 | 8.9 | 384位 | 1008GB/s | 425w | 2023 12.28 | 11999 | |||
40系 | RTX 4080 Super | 16GB | 10240 | 8.9 | 256位 | 736GB/s | 320w | 2024 01.31 | 8099 | |||
40系 | RTX 4080 Ti | 20GB | 未上市 | 9599 | ||||||||
40系 | RTX 4080 | 16GB | 9728 | 8.9 | 256位 | 716.8GB/s | 320w | 2022 11.16 | 9499 | |||
40系 | RTX 4070 Ti Super | 16GB | 8448 | 8.9 | 256位 | 672GB/s | 285w | 2024 01.24 | 6499 | |||
40系 | RTX 4070 Ti | 12GB | 7680 | 8.9 | 192位 | 504.2GB/s | 285w | 2023 01.05 | 6499 | |||
40系 | RTX 4070 Super | 12GB | 7168 | 8.9 | 192位 | 504.2GB/s | 220w | 2024 01.17 | 4899 | |||
40系 | RTX 4070 | 12GB | 5888 | 8.9 | 192位 | 504.2GB/s | 200w | 2023 04.13 | 4799 | |||
30系 | RTX 3090 Ti | 24GB | 10752 | 8.6 | 33.54 39.99 | 33.54 39.99 | 0.524 0.625 | 384位 | 1008GB/s | 450w | 2022 03.29 | 14999 |
30系 | RTX 3090 | 24GB | 10496 | 8.6 | 29.38 35.68 | 29.28 35.58 | 0.459 0.558 | 384位 | 935.8GB/s | 350w | 2020 09.02 | 11999 |
30系 | RTX 3080 Ti | 12GB | 10240 | 8.6 | 28.06 34.10 | 28.57 34.71 | 0.438 0.533 | 384位 | 912.4GB/s | 350w | 2021 06.03 | 8999 |
30系 | RTX 3080 | 12GB 10GB | 8960 8704 | 8.6 | 25.06 29.76 | 25.07 29.77 | 0.392 0.465 | 384位 320位 | 760GB/s | 350w 320w | 2021 06.03 | 6357 |
20系 | RTX 2080 Ti | 11GB GDDR6 | 4352 | 7.5 | 23.5 (26.9) | 11.8 (13.4) | 0.37 (0.42) | 352位 | 616GB/s | 260w | 2018 09.20 | 9999 |
10系 | GTX 1080 Ti | 11GB GDDR5X | 3584 | 6.1 | 0.166 (0.177) | 10.609 (11.34) | 0.332 (0.354) | 352位 | 484GB/s | 250w | 2017 03.10 | 5699 |
Tesla系列
版本 | 型号 | Memory | CUDA Core | CUDA性能 | 半精度TFLOPs | 单精度TFLOPs | 双精度TFLOPs | 总线位宽 | 总线带宽 | 最大功率 | 发布时间 | 原价¥ |
H系 | H100 | 80GB HBM2e/HBM3 | 14592 16896 | 9.0 | 756.449 989.43 | 51.2 66.9 | 25.6 33.5 | 5120位 | 2039GB/s | 350w 700w | ||
L系 | L40 | 48GB GDDR6 | 18176 | 8.9 | 362.066 | 90.516 | 1.414 | 384位 | 864GB/s | 300w | ||
L系 | L4 | 24GB GDDR6 | 7424 | 8.9 | 121 | 30.3 | 0.49 | 192位 | 300GB/s | 72w | ||
A系 | A100 | 40GB/80GB HBM2 | 6912 | 8.0 | 312 | 19.5 | 9.7 | 5120位 | 1555GB/s | 250w | ||
A系 | A40 | 48GB GDDR6 | 10752 | 8.6 | 149.68 | 37.42 | 1.168 | 384位 | 695.8GB/s | 300w | ||
A系 | A30 | 24GB HBM2 | 3584 | 8.0 | 165.12 | 10.32 | 5.161 | 3072位 | 933.1GB/s | 165w | ||
A系 | A10 | 24GB GDDR6 | 9216 | 8.6 | 124.96 | 31.24 | 0.976 | 384位 | 600GB/s | 150w | ||
A系 | A16 | 4*16GB GDDR6 | 4*1280 | 8.6 | 4*18.432 | 4*4.608 | 1.0848 | 4*128位 | 4*200GB/s | 250w | ||
A系 | A2 | 16GB GDDR6 | 1280 | 8.6 | 18.124 | 4.531 | 0.14 | 128位 | 200GB/s | 40-60w | ||
T系 | T4 | 16GB GDDR6 | 2560 | 7.5 | 64.8 | 8.1 | 256位 | 320GB/s | 70w | |||
V系 | V100 | 16GB/32GB HBM2 | 5120 | 7.0 | 119.192 112.224 105.680 | 14.899 14.028 13.210 | 7.450 7.014 6.605 | 4096位 | 900GB/s 829.44GB/s | 250w | ||
P系 | P100 | 16GB/12GB HBM2 | 3584 | 6.0 | 不支持 | 8.071‒9.34 | 4.036‒4.67 | 4096位 3072位 | 732GB/s 549GB/s | 250w | ||
P系 | P40 | 24GB GDDR5 | 3840 | 6.1 | 不支持 | 10.007–11.758 | 0.3127–0.3674 | 384位 | 345.6GB/s | 250w |
Quadro系列
型号 | Memory | CUDA Core | CUDA性能 | 半精度TFLOPs | 单精度TFLOPs | 双精度TFLOPs | 显存位宽 | 总线带宽 | 最大功率 | 发布时间 | 原价¥ |
RTX 6000 | |||||||||||
RTX A6000 | |||||||||||
RTX A5000 | |||||||||||
RTX A4000 | |||||||||||
T1000 | |||||||||||
T600 | |||||||||||
T400 | |||||||||||
Quadro RTX 8000 | |||||||||||
Quadro RTX 6000 | |||||||||||
Quadro RTX 5000 | |||||||||||
Quadro RTX 4000 | |||||||||||
Quadro GV100 | |||||||||||
Quadro GP100 | |||||||||||
Quadro P6000 | |||||||||||
Quadro P5000 | |||||||||||
Quadro P4000 | |||||||||||
Quadro P2200 | |||||||||||
Quadro P2000 | |||||||||||
Quadro P1000 | |||||||||||
Quadro P620 | |||||||||||
Quadro P600 | |||||||||||
Quadro P400 | |||||||||||
Quadro M6000 24GB | |||||||||||
Quadro M6000 | |||||||||||
Quadro M5000 | |||||||||||
Quadro M4000 | |||||||||||
Quadro M2000 |
参考来源
- https://www.nvidia.cn/geforce/graphics-cards/40-series/
- https://www.nvidia.com/en-us/geforce/graphics-cards/40-series/rtx-4090/
- https://www.nvidia.cn/geforce/graphics-cards/30-series/
- https://www.nvidia.cn/geforce/graphics-cards/compare/
- https://detail.zol.com.cn/1208/1207097/param.shtml
- https://developer.nvidia.com/cuda-gpus
- https://zh.wikipedia.org/wiki/NVIDIA_Tesla
- https://www.bilibili.com/read/cv33922816/
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_40%E7%B3%BB%E5%88%97
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_30%E7%B3%BB%E5%88%97
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_20%E7%B3%BB%E5%88%97
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_10%E7%B3%BB%E5%88%97
- https://ai.oldpan.me/t/topic/287
版权声明本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。本文地址: https://blog.ailemon.net/2024/09/25/nvidia-gpu-params-for-deep-learning/ All articles are under Attribution-NonCommercial-ShareAlike 4.0 |