Новые вопросы с тегом «slurm»

Всего найдено 8 вопросов

0
голосов
1
ответ
332
просмотра

Прекращение работы зомби SLURM

Я столкнулся со следующей проблемой во время первого жесткого отключения кластера отдела, за который я отвечаю. Система работает под управлением SLURM 17.11 и использует MariaDB / SQL для хранения учетных данных. Чтобы выполнить обновление памяти, мне пришлось отключить сервер управления и базы данн...
спросил Nox 5 лет назад

0
голосов
0
ответов
346
просмотров

Ansys RSM с ​​кластером SLURM

Я пытаюсь подключить Ansys Remote Solver Manager (RSM) на ПК с Windows к кластеру SLURM. Очевидно, нужно добавить / отредактировать hpc_commands.xmlфайл, чтобы настроить интеграцию на стороне клиента. Но я борюсь с моим XML-файлом. Как мне это написать?
спросил Anatol 5 лет назад

0
голосов
0
ответов
260
просмотров

Как использовать SLURM's --dependency = expand:<jobid> правильно </jobid>

У меня есть 1 незавершенное задание из 5, которое выполняется 19 часов, и я обеспокоен тем, что оно настанет до наступления рабочего дня. Я не администратор, и сейчас выходные, поэтому я хотел бы попробовать использовать эту функцию, которую я обнаружил недавно, показанную в этом примере: $ salloc -...
спросил hepcat72 5 лет назад

1
голосов
0
ответов
410
просмотров

Сбой инициализации слёрма

Я пытаюсь настроить Slurm в кластере малины с Raspbian 9.4. Я могу запустить slurmctld, но когда я пытаюсь запустить slurmd, я получаю следующий вывод: pi@node1:~ $ slurmd -Dvvvc slurmd: debug: Log file re-opened slurmd: error: Domain socket directory /SHARED/slurm/var/slurmd.node1: No such file or...
спросил Bub Espinja 5 лет назад

1
голосов
1
ответ
459
просмотров

Ansys Remote Solver с кластером SLURM

Я пытаюсь подключить Ansys, работающий на CentOS 7, к нашему кластеру HPC, который использует SLURM в качестве планировщика. Я просмотрел все файлы конфигурации, которые мог придумать. Я даже написал свой пользовательский hps_commands_SLURM.xmlфайл, я получаю ошибку Ansys.Rsm.Utilities.InvalidJobCon...
спросил Shahan M 6 лет назад

0
голосов
1
ответ
257
просмотров

slurm позволяет аутентификацию без выделения

Я использую грязь с Munge. За исключением одного узла все остальные работают нормально. Но на одном узле можно подключиться к нему по ssh, даже без какого-либо допустимого выделения. Я проверил файл sshd и system-auth. Они абсолютно одинаковы на всех узлах. Я проверил, что Munge способен декодироват...
спросил knightrider 6 лет назад

1
голосов
1
ответ
673
просмотра

Конфигурация SLURM: cons_res с CR_Core либо не могут выделить ресурс, либо задания оказываются в состоянии CG

Я новичок в SLURM. Я пытаюсь настроить slurm в новом кластере. У меня есть 4 узла, каждый имеет 14 ядер. Я хотел разделить узлы таким образом, чтобы каждое ядро ​​могло работать независимо (т. Е. Узел 01 может иметь одновременно 14 независимых последовательных заданий), но ни одно ядро ​​не должно з...
спросил Somesh 7 лет назад

1
голосов
0
ответов
390
просмотров

удалить команду slurm sacct двойные записи: "extern"

Работы, которые в данный момент выполняются, показывают две записи, одна из которых имеет .externсуффикс. Заполненные (или не удалось) рабочие места также имеют третью запись: .batch. Есть ли способ удалить (или не показывать это) из sacctвывода? Что это за записи?
спросил DilithiumMatrix 7 лет назад