Partitions

  • Il y a une liste globale des calculs en cours (jobs) et des calculs en attente des ressources demandées.
  • Un utilisateur peut exécuter 80 jobs en même temps et faire 100 soumissions maximum.
  • Les partitions, parfois nommées files d’attente, ont des caractéristiques.
  • Les partitions risk-xxx ont moins de limitations mais les jobs qui y sont exécutés peuvent être stoppés par une autre soumission faite dans une partition « non-risk ». Autrement dit : Les partitions « risk-nom » sont en mode de préemption. Ne pas hésiter à utiliser les partitions risk-xxx qui auraient pu se nommer overlimit-xxx car elle permettent de soumettre des calculs au delà de limites « classiques ».

Commande MatriCS digest
Commande listant les partitions actives : scontrol show partition | grep PartitionName
Commande listant les paramètres d’une partition : scontrol show partition Nom_Partition

shortnormalbigmembigpuquadgpunormal-amdbigmem-amdfpgaquad-a100midmemgpu
Mémoire maximum par nœud125 Go125 Go500 Go375 Go750 Go250 Go1000 Go1000 Go1000 Go375 Go29 Go
Nombre de cœurs maximum
par nœuds
2828284040646464644016
Mémoire maximum
par utilisateur
125 Go2000 Go2000 Go750 Go750 Go2000 Go2000 Go2000 Go1000 Go3000 Go29 Go
Nombre maximum
de cœurs par job et par utilisateur
2844811280405121281286432016
Ratio mémoire optimal
par cœur
4000 Mo4 Go
4096 Mo
16 Go
16384 Mo
9 Go
9216 Mo
18 Go
18432 Mo
4000 Mo16000 Mo16000 Mo16000 Mo9 Go
9216 Mo
1875 Mo
Temps maximum par job5 h
(10 h)
15 jours (50)15 jours (50)15 jours15 jours10 jours
(15)
10 jours (15)10 jours (15)5 jours (10)50 jours (5)50 jours
(5)
Nombre de nœuds maximum
par job
1 (10)12 (16)3 (4)2 (3)1 (2)6 (8)1 (2)1 (2)18 (2)1
Nombre maximum de GPU
par utilisateur
4441
Nombre maximum de FPGA
par utilisateur
6
Partitions (particularité risk entre parenthèses)

Partitions short et risk-short

Intègre tous les serveurs CPU pour une exécution rapide d’une soumission.

Partitions normal et risk-normal

Intègre 48 serveurs bi-processeur Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz, 128 Go de mémoire.

Partitions bigmem et risk-bigmem

Intègre 12 serveurs bi-processeur Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz, 512 Go de mémoire.

Partitions bigpu et risk-bigpu

Intègre 6 serveurs bi-processeur Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 384 Go de mémoire et 2 cartes GPUs Tesla V100-32G.

Partitions quadgpu et risk-quadgpu

Intègre 2 serveurs bi-processeur Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 768 Go de mémoire et 4 cartes GPUs Tesla V100 SXM2-32G-NVLink.

Partitions normal-amd et risk-normal-amd

File d’attente par défaut. Intègre 24 serveurs bi-processeur AMD EPYC 7513 @ 2.60GHz, 256 Go de mémoire.

Partitions bigmem-amd et risk-bigmem-amd

Intègre 4 serveurs bi-processeur AMD EPYC 7513 @ 2.60GHz, 1 To de mémoire.

Partitions fpga et risk-fpga

Intègre 4 serveurs bi-processeur AMD EPYC 7502 @ 2.50GHz, 1 To de mémoire et 3 cartes FPGA Xilinx U280.

Partitions quad-a100 et risk-quad-a100

Intègre un serveur bi-processeur AMD EPYC 7513 @ 2.60GHz, 1 To de mémoire et 4 GPU Tesla A100 SXM4-40G.

Partition midmem et risk-midmem

Partition midmem réservée au projet ARTISTIC du LRCS. Intègre 8 serveurs bi-processeur Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz, 384 Go de mémoire.

Partition gpu et risk-gpu

Partition gpu réservée aux chercheurs du LAMFA. Intègre 1 serveur bi-processeur Intel(R) Xeon(R) Silver 4309Y CPU @ 2.80GHz, 32 Go de mémoire et 1 GPU Tesla T4

Partition magma (priorité au logiciel magma).

Intègre 2 serveurs bi-processeur Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz, 512 Go de mémoire
Pour des raisons de licence, l’utilisation du logiciel magma impose le choix de la partition magma et les jobs non-magma sur bignode12 sont susceptibles d’être annulées en cas de demande de job magma.
Temps maximum par job : 50 jours / Nombre de nœuds maximum par job : 1

Partition visugpu

Intègre un serveur bi-processeur Intel(R) Xeon(R) Gold 6150 CPU @ 2.70GHz, 192 Go de mémoire et une carte GPU Tesla P40

  • Mémoire maximum instanciable : 187 Go
  • Nombre de cœurs : 36
  • Ratio mémoire optimal par cœur : 5 Go (5120 Mo)
  • Temps maximum par job : 1 jour