Я использую программу (*) под Unix / Linux (различные версии) на разных серверах и кластерах, программа поддерживает многопоточность. Я могу указать, сколько потоков я хочу с помощью параметра командной строки.

Вообще говоря, как я могу определить, сколько потоков я должен указать для многопоточности (чтобы получить максимальную скорость)?

Должно ли количество потоков быть меньше или равно количеству аппаратных потоков, поддерживаемых соответствующим процессором? Есть ли эмпирическое правило или отправная точка?

Если да, как я могу узнать, сколько аппаратных потоков поддерживает процессор?

Я должен также упомянуть, что компьютеры, на которых я работаю, обычно имеют несколько процессоров, каждый с несколькими ядрами. Неясно, если одно ядро = один поток.

(*) Я использую программу bwa, программу для выравнивания последовательностей ДНК. Но мой вопрос носит общий характер.

2 ответа2

0

Что ж, в этом вопросе есть несколько частей - в общем, хорошее практическое правило - запускать не больше потоков, чем у вас есть логические процессоры - хотя это обычно для всей системы и может зависеть от нагрузки. Чтобы узнать, сколько у вас физических ядер процессора, вы можете использовать cat /proc/sysinfo . Он напечатает набор строк для каждого логического ядра, поэтому прокрутите вниз и посмотрите на последнее (у меня 8 почти идентичных на моем четырехъядерном ядре, системе HT)

processor       : 7
vendor_id       : GenuineIntel
cpu family      : 6
model           : 58
model name      : Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz
stepping        : 9
microcode       : 0x16
cpu MHz         : 3401.000
cache size      : 8192 KB
physical id     : 0
siblings        : 8
core id         : 3
cpu cores       : 4
apicid          : 7
initial apicid  : 7
fpu             : yes
fpu_exception   : yes
cpuid level     : 13
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc aperfmperf pni pclmulqdq dtes64 monitor ds_cpl vmx smx est tm2 ssse3 cx16 xtpr pdcm pcid sse4_1 sse4_2 x2apic popcnt tsc_deadline_timer aes xsave avx f16c rdrand lahf_lm ida arat epb xsaveopt pln pts dtherm tpr_shadow vnmi flexpriority ept vpid fsgsbase smep erms
bogomips        : 6819.66
clflush size    : 64
cache_alignment : 64
address sizes   : 36 bits physical, 48 bits virtual
power management: 

Здесь я выделю важные строки: физический идентификатор: 0 (это первый сокет - если вы используете более одного сокета, то проверьте ядра процессора и процессора для каждого физического jd - если это число больше 0, у вас есть несколько Розетки)

Процессор: 7 (это число начинается с 0, до n-1, это восьмое логическое ядро в сокете - смотря на самое большое число, которое у вас есть для набора значений, разделяющих физический идентификатор)

ядер процессора: 4 (у меня есть 4 физических ядра - это будет одинаково для каждого ядра, и, поскольку SMP обычно использует идентичные ядра, должно быть одинаковым в системе с двумя сокетами)

Мой процессор должен позволять мне запускать 8 потоков одновременно, предполагая ядро на поток. Тем не менее, в зависимости от времени выполнения и других факторов, вы можете уйти с более

У SO есть довольно много вопросов по этому вопросу, и, выбирая два из них, ответы на этот вопрос предполагают, что один поток на логическое ядро является хорошей идеей, хотя этот предполагает, что вы можете пойти выше. Таким образом, к сожалению, ответ заключается в том, чтобы начинать с одного потока на процесс и настраивать его выше - что может быть невероятно большим количеством потоков, если они не работают долго, потоки, требующие памяти.

0

Grid Engine - это специальная программа, которая делает ваш вопрос спорным, если вы его используете. Весь смысл в том, чтобы управлять ресурсами и заданиями в разных системах, чтобы конечным пользователям не приходилось думать об этом уровне детализации.

Вступление

Программное обеспечение Oracle Grid Engine представляет собой систему распределенного управления ресурсами (DRM), которая обеспечивает более высокое использование, лучшую пропускную способность рабочей нагрузки и более высокую производительность конечных пользователей за счет существующих вычислительных ресурсов. Благодаря прозрачному выбору ресурсов, которые лучше всего подходят для каждого сегмента работы, программное обеспечение Oracle Grid Engine способно эффективно распределять рабочую нагрузку по пулу ресурсов, защищая конечных пользователей от внутренней работы вычислительного кластера.

Ссылка: Руководство для начинающих на веб-сайте Oracle Grid Engine.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .