Я пытаюсь сравнить быстродействие i5-3210M @ 2,5 ГГц с оперативной памятью 6 ГБ и i7 970 @ 3,2 ГГц с оперативной памятью 24 ГБ. Результаты настолько неожиданны, что я предполагаю, что либо делаю что-то очень неправильное, либо что-то не так с i7.
В качестве справочной информации, информация на следующем сайте показывает, что i7 лучше во всех отношениях (кроме того, что он был более старой моделью процессора примерно на 2 года).
http://www.cpubenchmark.net/compare.php?cmp[]=840&cmp[]=815
Операционные системы на обоих компьютерах идентичны (Arch Linux x86_64). Оба компьютера одинаково стабильны и никогда не выходят из строя.
Я использую xlinpack_xeon64, который я получил здесь https://aur.archlinux.org/packages/linpack/
Этот тест «... использует параллелизм SMP и по умолчанию генерирует столько потоков выполнения, сколько число процессоров в системе SMP». Я могу убедиться, что это происходит, посмотрев top/htop. Кроме того, когда я явно устанавливаю переменную среды OMP_NUM_THREADS в переменное число потоков, я могу наблюдать с помощью top/htop, что указанные числа используются.
Используя это, я обнаружил, что i5 быстрее, чем i7, иногда в 1,2 раза. Я вставил результаты для обоих полностью ниже.
Первоначально я ожидал, что в этих очень параллельных тестах i7 превзойдет i5, возможно, в три раза (у i7 6 физических ядер, а у i5 2).
Я использовал системный тест, чтобы увидеть, есть ли здесь что-то особенное в linpack, и это дало почти идентичные результаты (i5 быстрее примерно в 1,2 раза).
Наконец, я проверил записанные gflops для двух процессоров, о которых сообщалось на этом сайте http://www.intel.com/support/processors/sb/CS-017346.htm
Здесь, указанный gflops для i5 составляет 40. Так что более менее точно, что показывают результаты linpack. С другой стороны, указанный gflops для i7 составляет около 79. И я получаю около половины этого.
Я сбит с толку, но я предполагаю, что i7 (будь то сам процессор, или оперативная память, или mb) работает со сбоями. Действительно, изменчивость результатов для i7, а также полное отсутствие изменчивости для i5 также свидетельствует о том, что с i7 что-то не так.
Любое понимание было бы очень полезно.
-m
======= Результаты =================
============================================================================
========== i7 linpack test =================================================
============================================================================
Input data or print help ? Type [data]/help :
Number of equations to solve (problem size): 20000
Leading dimension of array: 20000
Number of trials to run: 4
Data alignment value (in Kbytes): 4
Current date/time: Wed May 21 23:51:14 2014
CPU frequency: 3.206 GHz
Number of CPUs: 1
Number of cores: 6
Number of threads: 12
Parameters are set to:
Number of tests: 1
Number of equations to solve (problem size) : 20000
Leading dimension of array : 20000
Number of trials to run : 4
Data alignment value (in Kbytes) : 4
Maximum memory requested that can be used=3200404096, at the size=20000
=================== Timing linear equation system solver ===================
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
20000 20000 4 149.874 35.5909 3.288586e-10 2.911119e-02 pass
20000 20000 4 135.832 39.2701 3.288586e-10 2.911119e-02 pass
20000 20000 4 142.117 37.5334 3.288586e-10 2.911119e-02 pass
20000 20000 4 121.434 43.9262 3.288586e-10 2.911119e-02 pass
Performance Summary (GFlops)
Size LDA Align. Average Maximal
20000 20000 4 39.0801 43.9262
Residual checks PASSED
End of tests
============================================================================
========== i5 linpack test =================================================
============================================================================
Input data or print help ? Type [data]/help :
Number of equations to solve (problem size): 20000
Leading dimension of array: 20000
Number of trials to run: 4
Data alignment value (in Kbytes): 4
Current date/time: Wed May 21 23:54:15 2014
CPU frequency: 3.092 GHz
Number of CPUs: 1
Number of cores: 2
Number of threads: 4
Parameters are set to:
Number of tests: 1
Number of equations to solve (problem size) : 20000
Leading dimension of array : 20000
Number of trials to run : 4
Data alignment value (in Kbytes) : 4
Maximum memory requested that can be used=3200404096, at the size=20000
=================== Timing linear equation system solver ===================
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
20000 20000 4 125.668 42.4461 4.097986e-10 3.627616e-02 pass
20000 20000 4 125.602 42.4686 4.097986e-10 3.627616e-02 pass
20000 20000 4 125.551 42.4856 4.097986e-10 3.627616e-02 pass
20000 20000 4 125.550 42.4861 4.097986e-10 3.627616e-02 pass
Performance Summary (GFlops)
Size LDA Align. Average Maximal
20000 20000 4 42.4716 42.4861
Residual checks PASSED
End of tests