CASI DI NETWORKING
1. Infiniband Mellanox ConnectX-3 e Pro
modello: CX354A
modello: CX312A
Procedura se le schede non vengono viste nella scheda NETWORK della WEB GUI di Proxmox:
-
Debugging:
$ lspci -v | grep -i mellanox # esempio risultato: 04:00.0 Network controller: Mellanox Technologies MT27500 Family [ConnectX-3] # è probabile che questa scheda non venga riconosciuta ma per la conferma dobbiamo installare alcuni package extra per la gestione della mellanox: $ apt search mellanox $ apt install mstflint/stable $ apt install ibverbs-providers/stable
Per i dettagli del comando mstflint vedi github link
# eseguiamo una verifica dello stato dell scheda:
$ mstconfig -d 04.00.0 query
Se nel risultato trovate per esempio:
LINK_TYPE_P1 VPI(3)
LINK_TYPE_P2 VPI(3)
Allora è sicuro che le schede non funzioneranno per sistemare la cosa basta semplicimente:
$ mstconfig -d 04:00.0 s LINK_TYPE_P1=ETH LINK_TYPE_P2=ETH
Il risultato sarà del tipo:
LINK_TYPE_P1 ETH(2)
LINK_TYPE_P2 ETH(2)
Ora verrà richiesto di riavviare il server.
Dopo il riavvio, andate nel Nodo -> System -> Network e dovreste vedere la vostra scheda infiniband
Se il problema persiste allora bisogna verificare il driver usato e i log. Alcuni comandi utili:
-
lsmod grep -i mlx4 => visualizza driver usato - modprobe -r mlx4_core => rimuove il driver
- modprobe -v mlx4_core => ricarca il driver
-
lspci -v grep -i mellanox -
dmesg grep -i [valore 04:00.0 oppure mlx4]