[Linuxtrent] Server blade HP e interfaccia di rete Emulex - ovvero il problema spesso non è dove te lo aspetti

  • From: Roberto Resoli <roberto.resoli@xxxxxxxxx>
  • To: linuxtrent <linuxtrent@xxxxxxxxxxxxx>
  • Date: Tue, 21 Aug 2012 20:49:51 +0200

Ciao a tutti,

Lascio traccia anche qui di questo problema risolto di recente, anche
perchè probabilmente non siamo i soli ad avere questo hardware ...

In sintesi, la questione la trovate in questo thread sul forum proxmox:

http://forum.proxmox.com/threads/10632-bonding-and-be2net

Si tratta delle interfacce di rete Emulex integrate nella mainboard
dei blade HP BL460c G7 ( driver "be2net" ); al contrario delle altre
due interfacce aggiuntive Broadcom, rimangono attive anche quando si
rimuove manualmente il cavo dal connettore sull'enclosure (i blade
sono collegati tramite cavi appositi alle prese ethernet che stanno
sullo chassis che accoglie le varie "lame").

Le interfacce sono configurate a due a due in bonding, in modo da
garantire ridondanza se uno switch oppure un interfaccia va in avaria.
Ovviamente, dato che le interfacce Emulex non rispondono alla perdita
di link fisico, siamo forzati ad usare il metodo "arp monitoring" che
usa dei pacchetti arp verso un IP per testare lo stato della
connessione. Purtroppo, mentre questo sulla versione 1.9 di PVE
funzionava egregiamente, sulla nuova 2.1 non c'è verso di inserire in
un bridge l'interfaccia bond1 che risulta dall'accoppiata delle due
Emulex; non appena la si aggiunge al bridge entrambe le eth vanno giù.
Scopro che l'unico modo di evitare questo è rimuovere l'opzione
"arp_validate 3" che convalida le risposte arp.

In un paio di settimane provo un po'di tutto, convinto che il problema
stia nel driver be2net: aggiorno il firmware all'ultima versione, e
arrivo a ricompilarlo dai sorgenti usando l'ultima versione sul sito
hp.

Niente da fare.

Alla fine, mi imbatto in questo advisory HP:
http://h20000.www2.hp.com/bizsupport/TechSupport/Document.jsp?lang=en&cc=us&objectID=c02473928&prodTypeId=329290&prodSeriesId=4085948

Controllo, e mi accorgo che sono esattamente in questa situazione: il
firmware dell'Enclosure è stato aggiornato, ma non è stato applicato
quello dei moduli di interconnessione. Applico, e improvvisamente le
interfacce rispondono correttamente alla perdita di link.

Morale: prima di pensare alle soluzioni complesse, cercare di esaurire
quelle semplici ....

ciao,
rob

PS: Il problema del bonding con arp monitoring + bridge è noto, ma
probabilmente risolto solo in versioni avanzate del kernel:
http://forum.proxmox.com/threads/10632-bonding-and-be2net?p=59630#post59630
--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts:

  • » [Linuxtrent] Server blade HP e interfaccia di rete Emulex - ovvero il problema spesso non è dove te lo aspetti - Roberto Resoli