19

Последовательный: for i in {1..1000}; do do_something $i; done - слишком медленно

Параллельно: for i in {1..1000}; do do_something $i& done - слишком большая нагрузка

Как выполнять команды параллельно, но не более, например, 20 экземпляров в минуту?

Теперь обычно используем hack, как for i in {1..1000}; do do_something $i& sleep 5; done , но это не хорошее решение.

Обновление 2: преобразовал принятый ответ в скрипт: http://vi-server.org/vi/parallel

#!/bin/bash

NUM=$1; shift

if [ -z "$NUM" ]; then
    echo "Usage: parallel <number_of_tasks> command"
    echo "    Sets environment variable i from 1 to number_of_tasks"
    echo "    Defaults to 20 processes at a time, use like \"MAKEOPTS='-j5' parallel ...\" to override."
    echo "Example: parallel 100 'echo \$i; sleep \`echo \$RANDOM/6553 | bc -l\`'"
    exit 1
fi

export CMD="$@";

true ${MAKEOPTS:="-j20"}

cat << EOF | make -f - -s $MAKEOPTS
PHONY=jobs
jobs=\$(shell echo {1..$NUM})

all: \${jobs}

\${jobs}:
        i=\$@ sh -c "\$\$CMD"
EOF

Обратите внимание, что вы должны заменить 8 пробелов на 2 табуляции перед "i =", чтобы это работало.

7 ответов7

13

GNU Parallel сделан для этого.

seq 1 1000 | parallel -j20 do_something

Он даже может запускать задания на удаленных компьютерах. Вот пример перекодирования MP3 в OGG с использованием server2 и локального компьютера, выполняющего 1 задание на ядро ЦП:

parallel --trc {.}.ogg -j+0 -S server2,: \
     'mpg321 -w - {} | oggenc -q0 - -o {.}.ogg' ::: *.mp3

Смотрите вступительное видео для GNU Parallel здесь:

http://www.youtube.com/watch?v=OpaiGYxkSuQ

4

Не bash-решение, но вы должны использовать Makefile, возможно, с -l чтобы не превышать какую-то максимальную загрузку.

NJOBS=1000

.PHONY = jobs
jobs = $(shell echo {1..$(NJOBS)})

all: $(jobs)

$(jobs):
    do_something $@

Затем, чтобы начать 20 работ одновременно

$ make -j20

или начать как можно больше заданий, не превышая нагрузку 5

$ make -j -l5
1

Одна простая идея:

Проверьте по модулю 20 и выполните команду оболочки shell перед do_something.

1
for i in {1..1000}; do 
     (echo $i ; sleep `expr $RANDOM % 5` ) &
     while [ `jobs | wc -l` -ge 20 ] ; do 
         sleep 1 
     done
done
1

Вы можете использовать ps чтобы подсчитать, сколько процессов у вас запущено, и всякий раз, когда это падает ниже определенного порога, вы запускаете другой процесс.

Псевдокод:

i = 1
MAX_PROCESSES=20
NUM_TASKS=1000
do
  get num_processes using ps
  if num_processes < MAX_PROCESSES
    start process $i
    $i = $i + 1
  endif
  sleep 1 # add this to prevent thrashing with ps
until $i > NUM_TASKS
1

размещение сценария в вопросе с форматированием:

#!/bin/bash

NUM=$1; shift

if [ -z "$NUM" ]; then
    echo "Usage: parallel <number_of_tasks> command"
    echo "    Sets environment variable i from 1 to number_of_tasks"
    echo "    Defaults to 20 processes at a time, use like \"MAKEOPTS='-j5' parallel ...\" to override."
    echo "Example: parallel 100 'echo \$i; sleep \`echo \$RANDOM/6553 | bc -l\`'"
    exit 1
fi

export CMD="$@";

true ${MAKEOPTS:="-j20"}

cat << EOF | make -f - -s $MAKEOPTS
PHONY=jobs
jobs=\$(shell echo {1..$NUM})

all: \${jobs}

\${jobs}:
        i=\$@ sh -c "\$\$CMD"
EOF

Обратите внимание, что перед «i =» вы должны заменить 8 пробелов двумя вкладками.

0

Вы можете сделать это так.

threads=20
tempfifo=$PMS_HOME/$$.fifo

trap "exec 1000>&-;exec 1000<&-;exit 0" 2
mkfifo $tempfifo
exec 1000<>$tempfifo
rm -rf $tempfifo

for ((i=1; i<=$threads; i++))
do
    echo >&1000
done

for ((j=1; j<=1000; j++))
do
    read -u1000
    {
        echo $j
        echo >&1000
    } &
done

wait
echo "done!!!!!!!!!!"

используя именованные каналы, каждый раз он запускает 20 вспомогательных оболочек параллельно.

Надеюсь, это поможет :)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .