Posted By: Pindagi (Maly a vysmaty ;-)) on 'CZunix'
Title:     Re: SAN monitoring
Date:      Tue Oct 14 17:09:20 2014

Jo jeste jedna vec - v tom redhatim postu je pekne popsany ze ten driver 
podporuje lepsi logovani - zapnul bych ho at mas vic informaci. 

Dale jsem nasel podobnej problem na qlogicu, ale tohle reseni bych nechal az 
po tom upgradu:

http://qlogic.force.com/SupportCenter/Customer_support_main?id=90680000000CbiDA
AS 

> > problemu muze bejt mraky. Zacinal bych analyzou logu primo na swistich,
> > pokud 
> > mate Brocade (coz predpokladam) nemel by to byt problem. Pokracoval revizi
> 
> > zonovani a lun mapingu. Brocady maji peknou podporu SNMP, ktaze posbiranim
> 
> > spravnejch dat a porovnanim je s pruserovym casem by se melo dat zjistit
> kdo
> 
> Switche tu jsou Brocade, ale nemam k nim pristup, takze bych to musel
> domluvit 
> se sitarema a musel bych vedet co sledovat. 
> 
> > na co pristupuje. Dalsi prima tool kterej by ti moh poct je na host strane
> 
> > sar -A + ksar kterej kresli pekny grafy a kde je fajn si vsimat hodnot
> > awwait 
> > a awserv (cekani na pozadavek a doba zpracovani). Taky bych si prosel 
> 
> Pri problemech se v messages objevuji tahovehle hlasky :
> kernel: qla2xxx [0000:05:00.0]-801c:1: Abort command issued nexus=1:1:17 -- 
> 1 
> 2002.
> v iostat vyskoci %util na 100, nekde naroste svctm a pak v podstate
> prestanou 
> diskove operace a util nekterych disku zustane na 100. Ve vetsine pripadu se
> 
> psk diskove operace rozbehnou, pokud to trva dyl nez minutu, tak server 
> vetsinou sestreli clusterware, ktery se stara o ocfs2 sdilene uloziste. 
> 
> > konfiguraci jednotlivych raidu na poli a logickych disku. TReba na
> midrange 
> > od IBM je to delano tak ze mas jeden raid a nd nim tvoris konkretni luny 
> > ktere pak mapujes na dalsi hosty. Pokud ti jeden raid vyuziva vice hostu
> tak
> > pak je na problem zadelano. Dalsi hint - zkontrolovat na poli preferovane 
> > cesty - muze bejt pretizenej kontroler. BTW jake tam mate pole ? Pokud 
> > nevykoumate kde by ten problem moh bejt zacal bych s patchovanim....
> > Objevuje 
> > se problem pouze na jednom hostu nebo na vice hostech ?
> 
> Projevuje se to na vice serverech a diskove pole mame 2xHP EVA 4400, nekolik
> 
> starsich HP MSA a pak SW pole s SSD disky.
> Vetsina LUNu je samozrejme sdilena pro vice serveru. 
> 
>                                         Libor Vejpustek
>                                         Ceska zemedelska univerzita Praha
> http://web.czu.cz/~vejpuste/            E-mail : vejpuste@uvt.czu.cz
co ja vim

Search the boards