难得的机会,可以跟着导师出差换换环境。出差对于导师来说,各种项目的洽谈可能是重头戏,但是对于我来说,人情世故和表达交流是调料,技术追求和价值情怀是食材,这...
-
-
CPU的时间流逝法
在某些Benchmark或者计算Kernel的性能测试场景下,需要对绑定执行的CPU核进行锁频,以获得可以复现(reproducible)的结果,更好地实...
-
一个机试小总结
前几天,在进行C++机试的时候遇到一些小问题和小技巧,在这里记录一下。getline()和cin>>ACM模式的机试需要自己从标准输入stdi...
-
#pragma unroll 二三事
#pragma是程序员和编译器之间通话的重要途径,通过它可以更好地指导编译器对代码进行优化,从某种程度上说也是程序员对编译器的主权体现。#pragma u...
-
[学习小结] Microbenchmarking Nvidia’s RTX 4090
原文:Microbenchmarking Nvidia’s RTX 4090 作者:clamchowderNVIDIA RTX4090,架构代号Ada L...
-
图神经网络的计算
图神经网络(Graph Neural Network, GNN)是一种建立在神经网络理论之上对图数据进行分析、学习的模型。其核心是图信号处理,包括对图信号...
-
【综述学习】SpMV在GPGPU上的应用
FILIPPONE S, CARDELLINI V, BARBIERI D, 等. Sparse Matrix-Vector Multiplication...
-
AMD AVX2测试记录
本文记录在尝试测试AMD上某个AVX2 benchmark过程中遇到的问题和一些值得吐槽的点。跑这个测试的一个主要的目标是,将支持...