CPU的时间流逝法
在某些Benchmark或者计算Kernel的性能测试场景下,需要对绑定执行的CPU核进行锁频,以获得可以复现(reproducible)的结果,更好地实现横向对比,排除CPU频率动态调度对于性...
在某些Benchmark或者计算Kernel的性能测试场景下,需要对绑定执行的CPU核进行锁频,以获得可以复现(reproducible)的结果,更好地实现横向对比,排除CPU频率动态调度对于性...
前几天,在进行C++机试的时候遇到一些小问题和小技巧,在这里记录一下。getline()和cin>>ACM模式的机试需要自己从标准输入stdin读入,从标准输出stdout输出结果。...
#pragma是程序员和编译器之间通话的重要途径,通过它可以更好地指导编译器对代码进行优化,从某种程度上说也是程序员对编译器的主权体现。#pragma unroll (n) 是能够利用编译器对循...
原文:Microbenchmarking Nvidia’s RTX 4090 作者:clamchowderNVIDIA RTX4090,架构代号Ada Lovelace,采用台积电4nm技术,核...
图神经网络(Graph Neural Network, GNN)是一种建立在神经网络理论之上对图数据进行分析、学习的模型。其核心是图信号处理,包括对图信号的卷积滤波等等。从任务的角度,对图数据的...
FILIPPONE S, CARDELLINI V, BARBIERI D, 等. Sparse Matrix-Vector Multiplication on GPGPUs[J/OL]. AC...
本文记录在尝试测试AMD上某个AVX2 benchmark过程中遇到的问题和一些值得吐槽的点。跑这个测试的一个主要的目标是,将支持AVX512的kernel降级成支持AV...
今天又是深夜,新栽的薄荷盆栽让我的心情格外地好,踱步出工位,四下无人,更开心了。白天的雨水被拉扯到深夜。我向来是小雨不打伞、大雨不出门的。不打伞倒不是因为耍帅装酷,一则是细雨能让我更真实的感受到...