Я использую OpenCL для выполнения некоторых вычислений на GPU, и мне сложно вычислить FLOPS моей карты. Формула для FLOPS в float, которую я использую, довольно проста:

frequency * cores * (instructions/cycle)
where: instructions/cycle is 4 for CPU and 2 for GPU

Проблема в том, как я могу вычислить теоретическую пиковую производительность для конкретной карты с двойной точностью. Моя карта - GeForce GTX 580.

--Daniel.

1 ответ1

0

Из https://devtalk.nvidia.com/default/topic/495177/cuda-programming-and-performance/what-is-the-double-precision-flops-rating-of-the-gtx580-/ :

[1.544 GHz] * [512 CUDA Cores] * [2 double precision floating point operations/8 clock cycles] = 198 GFLOPS.

Особенно этот комментарий Сейберта в вышеупомянутой теме углубляется в детали того, где 2/8 приходит к уравнению.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .