SIMT 與 threads 配置的兩三事…

因為 CUDA 程式的執行效能存有太多和硬體實作相關的變因,所以在進一步改善 y-twist 小實驗的執行效能之前,先稍微把目前所瞭解的資訊作個概略的整理,希望能讓自己在未來優化程式時更有方向感… 若文中有任何錯誤的地方還煩請大家不吝指導!! 🙂
Continue reading