[学习小结] Microbenchmarking Nvidia’s RTX 4090
原文:Microbenchmarking Nvidia’s RTX 4090 作者:clamchowderNVIDIA RTX4090,架构代号Ada Lovelace,采用台积电4nm技术,核心代号AD102。RTX4090除了NV官方大肆宣扬的光追性能外,拥有128个SMs(实际上AD102有144个,GA102有84个)。此文中的对比试验主要是来自OpenCL写的Microbenchmark
原文:Microbenchmarking Nvidia’s RTX 4090 作者:clamchowderNVIDIA RTX4090,架构代号Ada Lovelace,采用台积电4nm技术,核心代号AD102。RTX4090除了NV官方大肆宣扬的光追性能外,拥有128个SMs(实际上AD102有144个,GA102有84个)。此文中的对比试验主要是来自OpenCL写的Microbenchmark
FILIPPONE S, CARDELLINI V, BARBIERI D, 等. Sparse Matrix-Vector Multiplication on GPGPUs[J/OL]. ACM Transactions on Mathematical Software, 2017, 43(4): 1-49. DOI:10.1145/3017994.本篇文章为2017年的工作,主要讨论SpMV在