Avoid block stride loop on AMD GPUs to increase performance for FEM kernels #495

artv3 · 2024-11-25T18:55:41Z

It has been observed that performing block stride loops on AMD decreases performance, to increase performance use a direct mapping. Please see FEM kernels under apps.

MrBurmark · 2024-11-25T19:28:34Z

This is specifically for block stride loops and not grid stride loops?

artv3 · 2024-11-25T19:46:41Z

The kernel that prompted this had block stride loops, but yes I think we have seen lower performance with grid stride loops as well in other contexts as well.

artv3 self-assigned this Nov 25, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Avoid block stride loop on AMD GPUs to increase performance for FEM kernels #495

Avoid block stride loop on AMD GPUs to increase performance for FEM kernels #495

artv3 commented Nov 25, 2024

MrBurmark commented Nov 25, 2024

artv3 commented Nov 25, 2024 •

edited

Loading

Avoid block stride loop on AMD GPUs to increase performance for FEM kernels #495

Avoid block stride loop on AMD GPUs to increase performance for FEM kernels #495

Comments

artv3 commented Nov 25, 2024

MrBurmark commented Nov 25, 2024

artv3 commented Nov 25, 2024 • edited Loading

artv3 commented Nov 25, 2024 •

edited

Loading