当前GPU不支持性能调优可能有以下原因:
延迟 。目前CUDA还不能单独为某个处理核心分配任务,因此必须先缓冲一定量的数据,再交给GPU进行计算。这样的方式可以获得很高的数据吞吐量,不过单个数据经过缓冲、传输到GPU计算、再拷贝回内存的延迟比直接由CPU进行串行处理要长很多。
计算量 。如果计算量太小,使用GPU进行性能调优是不合算的。衡量计算量有绝对和相对两种方式。从绝对量来说,如果要优化的程序使用频率比较低,并且每次调用需要的时间也可以接受,那么使用GPU优化并不会显著改善使用体验。