У меня есть около 3000 файлов по 300 МБ каждый, и я бы хотел как можно быстрее найти серию подстрок с моим 16-ядерным сервером.
Это то, что я пытался, но не похоже, чтобы распараллеливать поиск файлов.
sudo find /mnt2/preprocessed/preprocessed/mo* | sudo xargs awk '/substring/ {c++} END {print c}' | paste -sd+ | bc
Он склеен из разных инструкций, я не до конца понимаю. Есть ли у вас какие-либо предложения о том, как я могу разделить обработку файлов?