#pragma unroll 二三事

#pragma是程序员和编译器之间通话的重要途径,通过它可以更好地指导编译器对代码进行优化,从某种程度上说也是程序员对编译器的主权体现。#pragma unroll (n) 是能够利用编译器对循环(for、while、do)进行展开,n表示展开的程度,不加表示完全展开。这是在LLVM的框架下,在GNU下则要是#pragma GCC unroll n。具体的使用说明可以见GCC的Loop-Speci

- 阅读全文 -

[学习小结] Microbenchmarking Nvidia’s RTX 4090

原文:Microbenchmarking Nvidia’s RTX 4090 作者:clamchowderNVIDIA RTX4090,架构代号Ada Lovelace,采用台积电4nm技术,核心代号AD102。RTX4090除了NV官方大肆宣扬的光追性能外,拥有128个SMs(实际上AD102有144个,GA102有84个)。此文中的对比试验主要是来自OpenCL写的Microbenchmark

- 阅读全文 -

最新文章

最近回复

  • ImCaO: 只有停下脚步才能真正感知到时光的流逝,愿你成为你曾经想成为的人 ...
  • 永恒末匕: 我到佛山有几个月了,还没有好好逛过佛山,佛山这几天天气很热哦
  • ruoran: 鱼还是好吃,啊
  • 果果: 呜呜,我也喜欢罗罗 |´・ω・)ノ
  • Kezhi: 好耶 ヾ(≧∇≦*)ゝ
  • ruoran: 羡慕free days (ó﹏ò。)
  • Mioz: 很难得的思考,写的都很有意思,希望作者即使工作了也可以有空安静的...
  • ruoran: 永远爱你 OωO
  • Andy烧麦: 这个 往北的 小环线 也是相当不错的
  • Kezhi: 怎么是19年吖,不是最近去的吗 OωO

分类

标签

归档

其它