Это зависит от программы, объема данных, которые вы пишете (размер кэша), и скорости хранения относительно данных, которые вы пишете. Например, если у меня есть тривиальная программа, которая добавляет бесконечное количество 64-битных целых чисел, ясно, что программа будет работать быстрее, если будет скомпилирована с использованием 64-битного процессора (вместо использования 32-битных параллельных инструкций). ). Однако проделанная работа тривиальна, и процессор может сложить числа гораздо быстрее, чем вы можете сохранить их на жестком диске / твердотельном накопителе (таким образом, заполняя кэш на диске, ограничивая работу скоростью хранения).
Однако, если мы посмотрим на операции, выполняемые ЦП, мы увидим, что 32-битная версия займет больше времени, только выполняя работу и копируя 32-битную память за раз в контроллер кеша (с использованием прямого доступ к памяти (DMA)). В этом случае 64-разрядная операция теоретически могла бы заполнить контроллер кэша диска быстрее для операций пакетной обработки, более вероятно, что в обоих случаях кэш будет заполнен, а скорость работы будет ограничена в основном скоростью записи на диск. сам.