y-twist cont.

y-twist-test

上次只用一個 thread 算 y-twist 的時候成效不彰,這次便把它拆成一堆 thread blocks 來試試看!!

Continue reading

Advertisements

SIMT 與 threads 配置的兩三事…

因為 CUDA 程式的執行效能存有太多和硬體實作相關的變因,所以在進一步改善 y-twist 小實驗的執行效能之前,先稍微把目前所瞭解的資訊作個概略的整理,希望能讓自己在未來優化程式時更有方向感… 若文中有任何錯誤的地方還煩請大家不吝指導!! 🙂
Continue reading