Cluster en Pruebas (mansci2)

Nodo compute-gpu-3-1

Caracteristica
Descripción

Memoria

768 GB

CPU

2 x AMD EPYC 9374F (64 cores totales)

GPU

8 x NVIDIA H100 NVL ( 94 GB memoria) con 12 NVLINK

Uso de gpu

Para usar el nodo se recomienda usar sbatch

gpu.slurm
#!/bin/bash
# save this file as gpu.slurm
# nodes request and configuration	
#SBATCH --job-name=test_gpu	        # job Name
#SBATCH --gres=gpu:h100:1               # gpu type and quantity 
#SBATCH --ntasks=1                      # CPU quantity  
#SBATCH --mem=10G                       # total of memory requested 
#SBATCH --output=%u_%x_%j.out           # output  userName_jobName_jobId.out
#SBATCH --partition=compute-gpu-h100
#load cuda module                       # replace for all modules needed
module load cuda/12.5
# Put your software in this line
nvcc hello.cu -o  hello
./hello
sbatch gpu.slurm

Modo interactivo

# request 2 cpus, 1 gpu h100, 10 gb Ram for 2 hours
srun --partition=compute-gpu-h100 --nodes=1 --ntasks=2  --gres=gpu:h100:1 --mem=10g --time=2:00:00 --pty bash -i

El modo interactivo sólo permite máximo 4 horas de uso

Usuarios externos

Los usuarios externos (Su home se encuentra en /nfs_ssd/nombreUsuario) usan el almacenamiento ssd del servidor compute-gpu-3-1 durante el tiempo de vigencia de su cuenta posteriormente los datos serán eliminados.

Last updated