Новые вопросы с тегом «slurm»
Всего найдено 8 вопросов
0
голосов
1
ответ
372
просмотра
Прекращение работы зомби SLURM
Я столкнулся со следующей проблемой во время первого жесткого отключения кластера отдела, за который я отвечаю. Система работает под управлением SLURM 17.11 и использует MariaDB / SQL для хранения учетных данных. Чтобы выполнить обновление памяти, мне пришлось отключить сервер управления и базы данн...
спросил Nox 5 лет назад
0
голосов
0
ответов
385
просмотров
Ansys RSM с кластером SLURM
Я пытаюсь подключить Ansys Remote Solver Manager (RSM) на ПК с Windows к кластеру SLURM. Очевидно, нужно добавить / отредактировать hpc_commands.xmlфайл, чтобы настроить интеграцию на стороне клиента. Но я борюсь с моим XML-файлом. Как мне это написать?
спросил Anatol 5 лет назад
0
голосов
0
ответов
296
просмотров
Как использовать SLURM's --dependency = expand:<jobid> правильно </jobid>
У меня есть 1 незавершенное задание из 5, которое выполняется 19 часов, и я обеспокоен тем, что оно настанет до наступления рабочего дня. Я не администратор, и сейчас выходные, поэтому я хотел бы попробовать использовать эту функцию, которую я обнаружил недавно, показанную в этом примере: $ salloc -...
спросил hepcat72 5 лет назад
1
голосов
0
ответов
444
просмотра
Сбой инициализации слёрма
Я пытаюсь настроить Slurm в кластере малины с Raspbian 9.4. Я могу запустить slurmctld, но когда я пытаюсь запустить slurmd, я получаю следующий вывод: pi@node1:~ $ slurmd -Dvvvc slurmd: debug: Log file re-opened slurmd: error: Domain socket directory /SHARED/slurm/var/slurmd.node1: No such file or...
спросил Bub Espinja 6 лет назад
1
голосов
1
ответ
497
просмотров
Ansys Remote Solver с кластером SLURM
Я пытаюсь подключить Ansys, работающий на CentOS 7, к нашему кластеру HPC, который использует SLURM в качестве планировщика. Я просмотрел все файлы конфигурации, которые мог придумать. Я даже написал свой пользовательский hps_commands_SLURM.xmlфайл, я получаю ошибку Ansys.Rsm.Utilities.InvalidJobCon...
спросил Shahan M 6 лет назад
0
голосов
1
ответ
290
просмотров
slurm позволяет аутентификацию без выделения
Я использую грязь с Munge. За исключением одного узла все остальные работают нормально. Но на одном узле можно подключиться к нему по ssh, даже без какого-либо допустимого выделения. Я проверил файл sshd и system-auth. Они абсолютно одинаковы на всех узлах. Я проверил, что Munge способен декодироват...
спросил knightrider 7 лет назад
1
голосов
1
ответ
724
просмотра
Конфигурация SLURM: cons_res с CR_Core либо не могут выделить ресурс, либо задания оказываются в состоянии CG
Я новичок в SLURM. Я пытаюсь настроить slurm в новом кластере. У меня есть 4 узла, каждый имеет 14 ядер. Я хотел разделить узлы таким образом, чтобы каждое ядро могло работать независимо (т. Е. Узел 01 может иметь одновременно 14 независимых последовательных заданий), но ни одно ядро не должно з...
спросил Somesh 7 лет назад
1
голосов
0
ответов
427
просмотров
удалить команду slurm sacct двойные записи: "extern"
Работы, которые в данный момент выполняются, показывают две записи, одна из которых имеет .externсуффикс. Заполненные (или не удалось) рабочие места также имеют третью запись: .batch. Есть ли способ удалить (или не показывать это) из sacctвывода? Что это за записи?
спросил DilithiumMatrix 7 лет назад