做深度学习离不开算力,就像到达诗和远方的旅途离不开交通工具。本文面向深度学习用户整理市面上常用的各个版本GPU的关键参数,进行汇总整理,方便大家随时查阅。如果数据有误,或有新GPU问世,或者需要补充的参数维度,各位看官可以及时通过联系方式来找我更新数据。
注:仅统计Memory在 11GB以上、发售时间在2016年及以后、算力性能满足深度学习计算要求(Cuda算力性能>=3.5)的GPU。若表中单元格为空,则为暂无数据或数据待补充。博主将不定期移除上市时间最久、已停产过时、市面上已大量退役的GPU数据信息项。
(当前数据整理截止为2024年11月)
GeForce系列
版本 | 型号 | Memory | CUDA Core | CUDA性能 | 半精度TFLOPs | 单精度TFLOPs | 双精度TFLOPs | 显存位宽 | 总线带宽 | 最大功率 | 发布时间 | 原价¥ |
50系 | RTX 5090 | 32GB GDDR7 | 21760 | 512位 | 600w | 未上市 | 15999 19999 | |||||
50系 | RTX 5080 | 16GB GDDR7 | 10752 | 256位 | 400w | 未上市 | ||||||
40系 | RTX 4090 Ti | 24GB | 未上市 | 15999 | ||||||||
40系 | RTX 4090 | 24GB GDDR6X | 16384 | 8.9 | 82.58 | 82.58 | 1.290 | 384位 | 1008GB/s | 450w | 2022 10.12 | 12999 |
40系 | RTX 4090D | 24GB | 14592 | 8.9 | 73.54 | 73.54 | 1.149 | 384位 | 1008GB/s | 425w | 2023 12.28 | 11999 |
40系 | RTX 4080 Super | 16GB | 10240 | 8.9 | 51.3 | 51.3 | 0.802 | 256位 | 736GB/s | 320w | 2024 01.31 | 8099 |
40系 | RTX 4080 | 16GB | 9728 | 8.9 | 48.74 | 48.74 | 0.762 | 256位 | 716.8GB/s | 320w | 2022 11.16 | 9499 |
40系 | RTX 4070 Ti Super | 16GB | 8448 | 8.9 | 44.1 | 44.1 | 0.689 | 256位 | 672GB/s | 285w | 2024 01.24 | 6499 |
40系 | RTX 4070 Ti | 12GB | 7680 | 8.9 | 40.09 | 40.09 | 0.626 | 192位 | 504.2GB/s | 285w | 2023 01.05 | 6499 |
40系 | RTX 4070 Super | 12GB | 7168 | 8.9 | 35.48 | 35.48 | 0.554 | 192位 | 504.2GB/s | 220w | 2024 01.17 | 4899 |
40系 | RTX 4070 | 12GB | 5888 | 8.9 | 29.15 | 29.15 | 0.455 | 192位 | 504.2GB/s | 200w | 2023 04.13 | 4799 |
30系 | RTX 3090 Ti | 24GB | 10752 | 8.6 | 33.54 39.99 | 33.54 39.99 | 0.524 0.625 | 384位 | 1008GB/s | 450w | 2022 03.29 | 14999 |
30系 | RTX 3090 | 24GB | 10496 | 8.6 | 29.38 35.68 | 29.28 35.58 | 0.459 0.558 | 384位 | 935.8GB/s | 350w | 2020 09.02 | 11999 |
30系 | RTX 3080 Ti | 12GB | 10240 | 8.6 | 28.06 34.10 | 28.57 34.71 | 0.438 0.533 | 384位 | 912.4GB/s | 350w | 2021 06.03 | 8999 |
30系 | RTX 3080 | 12GB 10GB | 8960 8704 | 8.6 | 25.06 29.76 | 25.07 29.77 | 0.392 0.465 | 384位 320位 | 760GB/s | 350w 320w | 2021 06.03 | 6357 |
20系 | RTX 2080 Ti | 11GB GDDR6 | 4352 | 7.5 | 23.5 (26.9) | 11.8 (13.4) | 0.37 (0.42) | 352位 | 616GB/s | 260w | 2018 09.20 | 9999 |
10系 | GTX 1080 Ti | 11GB GDDR5X | 3584 | 6.1 | 0.166 (0.177) | 10.609 (11.34) | 0.332 (0.354) | 352位 | 484GB/s | 250w | 2017 03.10 | 5699 |
Tesla系列
版本 | 型号 | Memory | CUDA Core | CUDA性能 | 半精度TFLOPs | 单精度TFLOPs | 双精度TFLOPs | 总线位宽 | 总线带宽 | 最大功率 | 发布时间 | 原价¥ |
H系 | H100 | 80GB HBM2e/HBM3 | 14592 16896 | 9.0 | 756.449 989.43 | 51.2 66.9 | 25.6 33.5 | 5120位 | 2039GB/s | 350w 700w | 2022.03.22 | |
L系 | L40 | 48GB GDDR6 | 18176 | 8.9 | 362.066 | 90.516 | 1.414 | 384位 | 864GB/s | 300w | 2022.10.13 | |
L系 | L4 | 24GB GDDR6 | 7424 | 8.9 | 121 | 30.3 | 0.49 | 192位 | 300GB/s | 72w | 2023.03.21 | |
A系 | A100 | 40GB/80GB HBM2 | 6912 | 8.0 | 312 | 19.5 | 9.7 | 5120位 | 1555GB/s | 250w | 2020.05.14 | |
A系 | A40 | 48GB GDDR6 | 10752 | 8.6 | 149.68 | 37.42 | 1.168 | 384位 | 695.8GB/s | 300w | 2020.10.05 | |
A系 | A30 | 24GB HBM2 | 3584 | 8.0 | 165.12 | 10.32 | 5.161 | 3072位 | 933.1GB/s | 165w | 2021.04.12 | |
A系 | A10 | 24GB GDDR6 | 9216 | 8.6 | 124.96 | 31.24 | 0.976 | 384位 | 600GB/s | 150w | 2021.04.12 | |
A系 | A16 | 4*16GB GDDR6 | 4*1280 | 8.6 | 4*18.432 | 4*4.608 | 1.0848 | 4*128位 | 4*200GB/s | 250w | 2021.04.12 | |
A系 | A2 | 16GB GDDR6 | 1280 | 8.6 | 18.124 | 4.531 | 0.14 | 128位 | 200GB/s | 40-60w | 2021.11.10 | |
T系 | T4 | 16GB GDDR6 | 2560 | 7.5 | 64.8 | 8.1 | 256位 | 320GB/s | 70w | 2018.09.12 | ||
V系 | V100 | 16GB/32GB HBM2 | 5120 | 7.0 | 119.192 112.224 105.680 | 14.899 14.028 13.210 | 7.450 7.014 6.605 | 4096位 | 900GB/s 829.44GB/s | 250w | 2017.05.10 | |
P系 | P100 | 16GB/12GB HBM2 | 3584 | 6.0 | 不支持 | 8.071‒9.34 | 4.036‒4.67 | 4096位 3072位 | 732GB/s 549GB/s | 250w | 2016.04.05 | |
P系 | P40 | 24GB GDDR5 | 3840 | 6.1 | 不支持 | 10.007–11.758 | 0.3127–0.3674 | 384位 | 345.6GB/s | 250w | 2016.09.13 |
Quadro系列
型号 | Memory | CUDA Core | CUDA性能 | 半精度TFLOPs | 单精度TFLOPs | 双精度TFLOPs | 显存位宽 | 总线带宽 | 最大功率 | 发布时间 | 原价¥ |
RTX 6000 | 48GB GDDR6 | 18176 | 8.9 | 91.1 | 384位 | 960GB/s | 300w | ||||
RTX 5000 | 32GB GDDR6 | 250w | |||||||||
RTX 4500 | 24GB GDDR6 | 210w | |||||||||
RTX 4000 | 20GB GDDR6 | 130w | |||||||||
RTX 4000 SFF | 20GB GDDR6 | 70w | |||||||||
RTX 2000 | 16GB GDDR6 | 70w | |||||||||
RTX A6000 | 48GB GDDR6 | 8.6 | 300w | ||||||||
RTX A5000 | 24GB GDDR6 | 8.6 | 230w | ||||||||
RTX A4500 | 20GB GDDR6 | 200w | |||||||||
RTX A4000 | 16GB GDDR6 | 8.6 | 140w | ||||||||
Quadro RTX 8000 | 48GB GDDR6 | 7.5 | |||||||||
Quadro RTX 6000 | 24GB GDDR6 | 7.5 | |||||||||
Quadro RTX 5000 | 16GB GDDR6 | 7.5 | |||||||||
Quadro GV100 | 32GB HBM2 | 7.0 | |||||||||
Quadro GP100 | 16GB HBM2 | 6.0 | 2017 | ||||||||
Quadro P6000 | 24GB GDDR5X | 6.1 | |||||||||
Quadro P5000 | 16GB GDDR5X | 6.1 | |||||||||
Quadro M6000 24GB | 24GB GDDR5 | 5.2 | 2016.03.05 |
参考来源
- https://www.nvidia.cn/geforce/graphics-cards/40-series/
- https://www.nvidia.com/en-us/geforce/graphics-cards/40-series/rtx-4090/
- https://www.nvidia.cn/geforce/graphics-cards/30-series/
- https://www.nvidia.cn/geforce/graphics-cards/compare/
- https://detail.zol.com.cn/1208/1207097/param.shtml
- https://developer.nvidia.com/cuda-gpus
- https://zh.wikipedia.org/wiki/NVIDIA_Tesla
- https://www.bilibili.com/read/cv33922816/
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_40%E7%B3%BB%E5%88%97
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_30%E7%B3%BB%E5%88%97
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_20%E7%B3%BB%E5%88%97
- https://zh.wikipedia.org/wiki/NVIDIA_GeForce_10%E7%B3%BB%E5%88%97
- https://ai.oldpan.me/t/topic/287
- https://en.wikipedia.org/wiki/GeForce_40_series
- https://www.nvidia.com/en-us/design-visualization/rtx-6000/
- https://www.nvidia.com/en-us/design-visualization/desktop-graphics/
- https://resources.nvidia.com/en-us-design-viz-stories-ep/l40-linecard?lx=CCKW39&&search=professional%20graphics
- https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/quadro-product-literature/NV-DS-Quadro-M6000-24GB-US-NV-fnl-HR.pdf
- https://images.nvidia.com/content/pdf/quadro/data-sheets/192195-DS-NV-Quadro-P5000-US-12Sept-NV-FNL-WEB.pdf
- https://images.nvidia.com/content/pdf/quadro/data-sheets/192152-NV-DS-Quadro-P6000-US-12Sept-NV-FNL-WEB.pdf
- https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/productspage/quadro/quadro-desktop/quadro-pascal-gp100-data-sheet-us-nv-704562-r1.pdf
- https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/productspage/quadro/quadro-desktop/quadro-volta-gv100-data-sheet-us-nvidia-704619-r3-web.pdf
- https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/quadro-product-literature/quadro-rtx-5000-data-sheet-us-nvidia-704120-r4-web.pdf
- https://www.nvidia.cn/design-visualization/rtx-5000/
- https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/quadro-product-literature/quadro-rtx-6000-us-nvidia-704093-r4-web.pdf
- https://www.nvidia.com/content/dam/en-zz/Solutions/design-visualization/quadro-product-literature/quadro-rtx-8000-us-nvidia-946977-r1-web.pdf
版权声明本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。本文地址: https://blog.ailemon.net/2024/09/25/nvidia-gpu-params-for-deep-learning/ All articles are under Attribution-NonCommercial-ShareAlike 4.0 |