Новые вопросы с тегом «gnu-parallel»

Всего найдено 31 вопрос

2
голосов
1
ответ
240
просмотров

Параллельная GNU не делит работу равномерно

Насколько я понимаю, опция -X должна равномерно распределять аргументы между заданиями. Тем не менее, я получаю очень искаженный дистрибутив: user@host:/tmp/ptest$ count() { > echo $# > } user@host:/tmp/ptest$ export -f count user@host:/tmp/ptest$ count *.jpg 5825 user@host:/tmp/ptest$ parall...
спросил Zoltan 5 лет назад

2
голосов
2
ответа
437
просмотров

GNU "Параллельный --pipe" не обрабатывает стандартный ввод по строкам

Я очень озадачен тем, как использовать GNU параллельно для передачи стандартного ввода в команду задания. У меня есть то, что я представлял себе как очень распространенный вариант использования. У меня есть процесс, xxdкоторый делает что-то с stdin и выводит на stdout. У меня есть некоторый способ г...
спросил ThorSummoner 5 лет назад

1
голосов
1
ответ
225
просмотров

Gnu параллельные и множественные узлы, использующие rsh вместо ssh

Могу ли я использовать rsh вместо ssh для разделения заданий между узлами в настройке hpc? Или GNU-параллель только может отправлять различные задания по SSH?
спросил user528025 6 лет назад

3
голосов
2
ответа
263
просмотра

Добиться лучшего сжатия для нескольких сжатых файлов

У меня есть несколько каталогов, содержащих тысячи файлов gzip (в целом речь идет о файлах 1M). Некоторые из этих файлов повреждены, и большинство из них действительно маленькие (пара КБ). Почти все они очень похожи по содержанию, поэтому сжатие всех вместе должно улучшить степень сжатия по сравнени...
спросил nopper 6 лет назад

1
голосов
1
ответ
640
просмотров

Параллельный локоть с файлом ввода и вывода имени файла на оболочке Linux

Я обычно скачиваю файлы параллельно с curl и urls в файл, подобный этому: cat links.txt | parallel --will-cite curl --connect-timeout 5 --max-time 10 --retry-max-time 40 --retry 5 --retry-delay 0 -s -f -O -C - Где links.txt имеет один URL на строку. Теперь мне нужно назначить пользовательское имя...
спросил kurokirasama 6 лет назад

1
голосов
1
ответ
542
просмотра

Параллельно: ограниченное количество многопоточных процессов

Я использую GNU параллельно выполнять несколько заданий параллельно, как это: parallel python3 main.py arg ::: args*. В случае однопоточных заданий я использовал одно -j 100%сопоставление для одного задания. Теперь у каждой работы четыре потока, а у меня 32 ядра. Я хочу распределить задания так, что...

4
голосов
2
ответа
671
просмотр

GNU Parallel - глобальные переменные и функции

У меня есть этот скрипт: GLOBAL_VAR="some global value" function test { echo $1 echo $ } export -f test parallel --jobs 5 --linebuffer test ::: "$" Как я могу $GLOBAL_VARвидеть из параллели?
спросил Martin Perry 6 лет назад

1
голосов
2
ответа
465
просмотров

Распараллеливание удаленного tar и получение вывода по каналу ssh

Я пытался распараллелить сценарий, который я использую, но пока что GNU Parallel очень сложен. У меня есть 2 файла - один, содержащий хосты для запуска команды, а второй с параметрами для команды. Ниже приведены примеры данных: $ cat workers.host foo@192.168.0.7 bar@192.168.0.8 jerry@192.168.0.9 to...
спросил Johnny_Bit 7 лет назад

3
голосов
2
ответа
1467
просмотров

Многократное чтение из txt-файла в bash (параллельная обработка)

Вот простой bash-скрипт для кода статуса HTTP while read url do urlstatus=$(curl -o /dev/null --silent --head --write-out '%' "$" --max-time 5 ) echo "$url $urlstatus" >> urlstatus.txt done < $1 Я читаю URL из текстового файла, но он обрабатывает только по одному за раз, что занимает слишк...
спросил user7423959 7 лет назад

1
голосов
0
ответов
253
просмотра

Параллельно GNU не перечитывает sshloginfile во время работы

Пытаюсь получить параллельное динамическое добавление / удаление узлов обработки, и я могу указать, какие хосты использовать на --sshloginfile. К сожалению, изменение записей в sshloginfile во время параллельной работы, похоже, не меняет используемых хостов (т.е. sshloginfile, кажется, не перечитыв...
спросил teikjoon 7 лет назад

1
голосов
1
ответ
795
просмотров

GNU параллельно удалить escape перед пробелами в команде

В настоящее время я тестирую GNU параллельно, чтобы распределить команду сравнения по нескольким серверам, используя bash. В своей основной функции эта команда сравнения принимает два входа для сравнения (доступ к базе данных Oracle) и требует имя выходного файла через -o. Программа требует как мини...
спросил Carambakaracho 7 лет назад

-1
голосов
1
ответ
361
просмотр

Какую версию я должен скачать для этой ОС Linux?

Я хотел бы установить GNU параллельно на компьютерном кластере. Я вижу, что есть несколько версий GNU-параллели, которые можно скачать (см. Ссылку выше в разделе «Загрузка GNU Parallel»). Я полагаю, что версии, представляющие для меня основной интерес: Arch Linux Alpine Linux Alt Linux Mageia Linux...

2
голосов
1
ответ
881
просмотр

Использование GNU Parallel для поиска большого файла с разбивкой по частям на хост

Я использую Ansible для настройки некоторой конфигурации на нескольких узлах, и в рамках этой настройки мне нужно разделить один большой файл на n строк и скопировать каждую часть в удаленный файл без создания локальной копии каждого чанка (например, команда bash split). делает). Ansible не может сд...
спросил Enchantner 7 лет назад

3
голосов
2
ответа
817
просмотров

выполнить команду для каждой строки стандартного ввода немедленно?

Как выполнить команду для каждой строки stdinсразу? Пример : (echo abc; sleep 10; echo def;) | ??? xargsИнструмент не делает работу, потому что он блокирует до тех пор, пока не увидит все данные (ждет, пока стандартный вывод, чтобы закрыть). Тем не менее, я должен выполнять команды сразу же, как то...
спросил VasyaNovikov 8 лет назад

1
голосов
1
ответ
505
просмотров

невозможно установить GNU параллельно в Ubuntu 12.04

Travis CI использует Ubuntu 12.04. Я хочу установить GNU Parallel на него и раньше мог, sudo apt-get install parallelно сейчас не могу. Что мне нужно сделать? Нужно ли сейчас скомпилировать его с нуля?
спросил neubert 8 лет назад

1
голосов
0
ответов
278
просмотров

почему мой главный узел простаивает при параллельном запуске gnu?

Я использую gnu -rallel для параллельного запуска нескольких сценариев Python на нескольких компьютерах в моей гигабитной сети. Обрабатываемые файлы находятся в папке tmpfs (RAM) на моем главном узле. Когда я запускаю параллельный процесс, я вижу, что все ядра в удаленном узле работают, но мой масте...
спросил Mr Purple 8 лет назад

1
голосов
2
ответа
1153
просмотра

обнулить большое блочное устройство с распараллеленным дд

У нас есть шестьдесят терабайтное блочное устройство, которое мы хотим обнулить с помощью dd. Можно ли распараллелить эту операцию, чтобы уменьшить количество времени, которое требуется? Я попытался выполнить следующую команду, но это не совсем то, что я ищу: seq 1 5 | parallel dd if=/dev/zero of=/d...
спросил palmbardier 8 лет назад

2
голосов
1
ответ
416
просмотров

GNU-параллельное шифрование файлов с пробелами или специальными символами?

Я пытаюсь зашифровать кучу файлов с помощью кода ниже: find . -name "*.vi" | sort | parallel --gnu -j 4 --workdir "$PWD" ' echo "Encrypting {/.} ..." gpg -r user@myemail.com -o "/tank/test/{/.}.gpg" -e "{}" '; Это прекрасно работает, но только если в именах файлов нет пробелов и специальных символо...
спросил Weekender 8 лет назад

2
голосов
2
ответа
523
просмотра

Параллельно GNU: перенаправить все stdin всем процессам

Я пытаюсь обрабатывать ввод разными способами параллельно, записывая получающиеся строки по мере их поступления. Мой текущий подход заключается в следующем: # process_parallel.sh read input parallel --colsep ' ' --linebuffer 'echo $input | {}' \ ::: 'python process1.py' ./process2.sh ./process3 Кон...
спросил Mr. Wonko 8 лет назад

2
голосов
1
ответ
472
просмотра

Как заставить gnuparallel последовательно выполнять набор команд?

Gnu Parallels - это мощный инструмент, который я использую для запуска множества независимых команд BASH в виде одного набора параллельно. Я хотел бы иметь возможность запускать те же команды ПОСЛЕДОВАТЕЛЬНО без существенных изменений в команде, которую я использую. Я знаю, что есть переключатель, к...
спросил Mr Purple 9 лет назад

4
голосов
1
ответ
1414
просмотров

Подавление stderr в GNU Parallel

Я использую GNU Parallel для одновременного запуска команды несколько тысяч раз. Чтобы получить логи исполнения я использую --filesи --results. Чтобы получить хороший индикатор выполнения, пока он работает, я использую --etaи --progress. Теперь моя проблема в том, что, хотя STDERR перенаправляется в...
спросил Jasiu 9 лет назад

3
голосов
1
ответ
1587
просмотров

Использование sed с параллельным доступом дает пустой вывод при перенаправлении в файл

Я использую zshоболочку. Я пытаюсь использовать sedдля замены текста во многих файлах, используя параллельные, чтобы ускорить процесс. Когда я проверил это на одном файле и разрешил вывод команды, stdoutя увидел ожидаемый результат. Когда я попытался перенаправить этот вывод в файл, я получил пустой...
спросил Simon O'Hanlon 9 лет назад

4
голосов
3
ответа
578
просмотров

Гну параллельно и акк не играет красиво из-за stdin, труба

Я пытаюсь использовать parallelи ackвместе, чтобы сделать поиск параллельно. Тем не менее, ackкажется, настаивает на использовании, stdinесли он оказывается в трубе, даже если вы даете ему файлы для поиска: $ echo hello > test.txt $ ack hello test.txt hello $ echo test.txt | xargs ack hello hel...
спросил mgalgs 9 лет назад

3
голосов
1
ответ
1167
просмотров

Gnu Parallel зависает как один процесс "спит"

Я параллельно запускаю команду, используя Gnu Parallel, которая имеет два параметра в качестве входных данных: каталог и файл conf: parallel --gnu my_command ::: (ls -d dir*test) ::: properties.conf Я запускаю его на многоядерном процессоре (24 ядра), и «my_command» выполняется на каждом ядре в общ...
спросил Randomize 10 лет назад

0
голосов
2
ответа
239
просмотров

Отладочный вывод

Я попытался ускорить импорт большого набора данных с папкой, полной файлов .sql ls -rS *.sql | parallel -j16 mysql -uusername -ppassword dbname "<" Вскоре после запуска я получаю сообщение об ошибке: ERROR 1146 (42S02) at line 65: Table 'dbname.some_table' doesn't exist ERROR 1146 (42S02) at lin...
спросил Justin 10 лет назад

3
голосов
1
ответ
3737
просмотров

Пакетная загрузка URL-адресов из многопоточной командной строки

У меня есть 100 000 URL-адресов небольших файлов для загрузки. Хотелось бы использовать 10 нитей и конвейерная обработка является обязательным условием. Я объединяю результат в один файл. Текущий подход: cat URLS | xargs -P5 -- curl >> OUTPUT Есть ли лучший вариант, который покажет прогресс в...
спросил William Entriken 10 лет назад

6
голосов
2
ответа
5462
просмотра

Как использовать GNU параллельно с gunzip

У меня есть полный каталог .gz, я хочу расширить каждый архив параллельно с GNU параллельно. Однако я ничего не добился. Я старался parallel 'gunzip {}' ::: `ls *.gz` parallel gunzip `ls *.gz` без результатов, bash говорит мне: /bin/bash: archive1.gz: command not found ... Что я делаю неправильно?...
спросил gc5 10 лет назад

1
голосов
2
ответа
1299
просмотров

используя awk с параллельным

У меня есть около 3000 файлов по 300 МБ каждый, и я хотел бы как можно быстрее найти серию подстрок с моим 16-ядерным сервером. Это то, что я пытался, но не похоже, чтобы распараллеливать поиск файлов. sudo find /mnt2/preprocessed/preprocessed/mo* | sudo xargs awk '/substring/ END ' | paste -sd+ |...
спросил kelorek 11 лет назад

7
голосов
1
ответ
2784
просмотра

Как я могу установить GNU Parallel вместе с Moreutils?

Доморощенный имеет формулу для moreutilsи GNUparallel . GNU Parallel конфликтует с Moreutils, поскольку в нем также есть двоичный файл с именем parallel, который просто менее полезен. Однако я все же хотел бы установить обе формулы одновременно. Как я могу это сделать? В идеале я бы установил GNU Pa...
спросил slhck 11 лет назад

3
голосов
2
ответа
2153
просмотра

Как использовать опцию «фильтр» для GNU split с параллельной GNU?

Я пытаюсь разбить несколько огромных файлов gz на сжатые по N-строке фрагменты. Чтобы продемонстрировать, давайте рассмотрим следующее: seq 100 | gzip > big_file0.gz Я могу разделить это на несколько сжатых файлов по 10 строк следующим образом: zcat big_file0.gz | split -l 10 --filter='gzip >...
спросил saffsd 11 лет назад