Posted By: Pindagi (Maly a vysmaty ;-)) on 'CZunix' Title: Re: SAN monitoring Date: Mon Oct 13 16:32:48 2014 Ahoj, problemu muze bejt mraky. Zacinal bych analyzou logu primo na swistich, pokud mate Brocade (coz predpokladam) nemel by to byt problem. Pokracoval revizi zonovani a lun mapingu. Brocady maji peknou podporu SNMP, ktaze posbiranim spravnejch dat a porovnanim je s pruserovym casem by se melo dat zjistit kdo na co pristupuje. Dalsi prima tool kterej by ti moh poct je na host strane sar -A + ksar kterej kresli pekny grafy a kde je fajn si vsimat hodnot awwait a awserv (cekani na pozadavek a doba zpracovani). Taky bych si prosel konfiguraci jednotlivych raidu na poli a logickych disku. TReba na midrange od IBM je to delano tak ze mas jeden raid a nd nim tvoris konkretni luny ktere pak mapujes na dalsi hosty. Pokud ti jeden raid vyuziva vice hostu tak pak je na problem zadelano. Dalsi hint - zkontrolovat na poli preferovane cesty - muze bejt pretizenej kontroler. BTW jake tam mate pole ? Pokud nevykoumate kde by ten problem moh bejt zacal bych s patchovanim.... Objevuje se problem pouze na jednom hostu nebo na vice hostech ? > Timeouty na discich spis nez datovy prenosy zpusobujou chyby HW nebo bugy ve > > firmware. Pripadne pokud ta SAN je spojena z nekolika navzajem propojenych > "krabic", je mozny, ze vam tam loopujou data kvuli blbymu > zapojeni/nakonfigurovani. Predpokladam, ze nepouzivate takovy zbesilosti > jako > iSCSI - to by pripadne timeouty mohlo zpusobit pri pretizeny siti.. > > Takze zacal bych opatchovanim vsech firmwaru (SAN, HBA karty na obou > koncich, > kernel tech linux boxu, kernel modulu). Pokud mas active-active > multipathing, > tak kouknout na ty cesty, jestli nektera z nich nema nejaky chyby... > > Na monitoring trafficu potrebujes nastroj, kterej bude nativni k dane SANce > - > neuvedls, jakej produkt pouzivate; potrebujes to monitorovat na strane SAN a > > ne na strane tech Linuxu... > > Good luck, takovejhle typ "troll" problemu me dokaze pekne s*at, kdyz clovek > > netusi, odkud to prichazi... > > > Zdravim. > > Neni mezi nami nekdo, kdo by dokazal monitorovat traffic na SAN siti ? > > Mame pripojena diskova pole k Linux serverum a obcas se na SANce objevi > cosi > > > > co zpusobi timeouty na pripojenych diskach. Potrebovali bychom zjistit co > to > > > > zpusobuje a nasledne jak se tomu vyhnout. > > Diky za napady > > > > Libor Vejpustek > > Ceska zemedelska univerzita Praha > > http://web.czu.cz/~vejpuste/ E-mail : vejpuste@uvt.czu.cz > CePal co ja vim