Hlavná stránka > Všeobecné > Hot vretena

Hot Vretená

Ospravedlňujem sa za neprítomnosť v oboch prítomnosti a pracovných miest. Už je to horská dráha minulý rok sa zranenia a ploché vykonaní práce, plány, takže som mal málo času, alebo motiváciu blog alebo ukázať svoju tvár, okolo obcí. Ospravedlňujem sa, a ja som odhodlaný zlomiť tento zvyk a vrátiť sa do vecí, znova! Ale dosť táranie, dostať sa na spisoch ...

To nie je niečo, čo som vidieť veľmi často, ale keď sa mi to, je to zaujímavé vidieť štatistiky hovoria samy za seba. Ja som so zákazníkom, ktorý mal nasadenie skriptov ich NetApp majetku pred niekoľkými rokmi, a to nebol navrhnutý alebo dodávané s príliš veľkú starostlivosť a pozornosť (niečo, čo chcem diskutovať o ďalší deň). Majú majetok VMware s SQL, Exchange a ďalšie veci. To všetko vedie cez celkovo viac ako 100 15K FC vretien. Nie je to obrovský majetok v porovnaní s inými servermi, takže som zaujala na dôvod, prečo majú také problémy s výkonom.

Ak spustíte teraz cez "sysstat-u", môžete vidieť, že filter sa sám robí veľmi málo, docela šťastne dostať v tom, čo by malo robiť. Ale disk zasahuje 100% pomerne často. Okamžite to ukazuje disku problém. Potrebujú viac vretien, samozrejme?

Po prvé existuje nerovnováha vretien. Majú druhý agregát na partnerské ovládač, ktorý má iba testovacie zväzkov. Získať povolenie na odstránenie tejto teplé a som prerozdeliť to k druhému radiči a rozšíriť existujúce agregát. Toto zdvojnásobí počet vretena, ale viem, že to nebude nič robiť pre existujúce výkonnosti (v tom, že dáta nebudú automaticky distribuovať sám!).

Ak by som prejsť "disku Zobraziť štatistiky: *: disk_busy" Vidím niečo celkom zrejmý. K dispozícii je jeden disk v celom systéme, ktorý zasahuje 100%, zvyšok nie. Existuje hromada ďalších diskov (asi 10), ktoré sú spustené 50-60%, a potom sa zostávajúca disky tikajú ďalej okolo 20-30%. Tak čo sa tu stalo? NetApp technológia by mala zabrániť akejkoľvek forme horúceho vretena v systéme.

Moja teória je táto. Filter sa bol nazbieral a skladali po vybalení z krabice, ale celkový nebola dospelá (3 disku agregát, 1 data, 2 parita). Niektoré skladovacie bola vytvorená opravná položka a dáta preniesť. Bežali z vesmíru, a tak vzrástol súčet (trochu), potom skopírovali partia viac dát na diskoch. Po tom všetkom, oni potom pridal zvyšok diskov. Teraz, pretože dáta nebudú automaticky presunúť za chodu, všetky údaje, ktoré sa nemenia (ak sa stane s VM systémových diskov, staré Exchange e-maily, a starých dátových skladov, dáta), potom sú ešte sedel na pôvodnú vretien alebo dokonca vretena, ako keď boli prvé inštaláciu.

Takže som teraz teší na víkend. Budeme upgrade je Data ONTAP 7.3.2 a ja potom môže spustiť nejaký prerozdelenie preveruje v rámci celého systému bez vplyvu na snímke miesta použitia (bonus, ďakujem NetApp!). Dúfam, že to bude odstrániť horúcou vretena problém. Mám ich predtým v histórii, a ja vytiahnite niektorí po štatistikách budúci týždeň. Budem aktualizovať tento príspevok zodpovedajúcim spôsobom.

Poučenie z príbehu? Nastavte svoj úložný systém úplne a dôkladne, ako začnete hádzať dáta v ňom. Nechápejte nadšení pomocou novej skladovacie hračku a hodí dáta na ňom okamžite. Videl som vyššie uvedený scenár pri niekoľkých príležitostiach teraz a pred 7,3 ONTAP, to bola bolesť opraviť.

Rýchly snímka z produkcie štatistík. Majte na pamäti, že v rámci klastra to zobrazí všetky disky, tak všetky diskové štatistiky sú úplne relevantné. Na rušnej disky tu jednoducho nemajú pridať až na skutočný počet diskov v systéme, a môžete jasne vidieť jeden disk zaneprázdnený.

> Sysstat-u 1
CPU Celkový čistý kB / s Disk kB / s páska kB / s Cache Cache CP CP disk
ops / s sa čítať písať čítať písať vekové hit čas Tye util
11% 3220 6942 3270 4232 0 0 0 12 95% 0% - 60%
11% 2898 7385 4030 4892 0 0 0 11 94% 0% - 69%
9% 3547 1820 3496 3920 24 0 0 11 93% 0% - 89%
7% 2329 1160 3048 3892 0 0 0 11 93% 0% - 81%
10% 3173 2055 4851 4644 8 0 0 11 93% 0% - 67%
9% 2491 1860 4547 4568 24 0 0 11 91% 0% - 98%
9% 2523 2960 4404 5372 0 0 0 11 90% 0% - 89%
14% 5136 8173 4465 3352 0 0 0 11 95% 0% - 81%

> Zobraziť štatistiky disk: *: disk_busy
Snip ......














Snip ......

VN: F [1.9.11_1134]
Ohodnoťte tento príspevok:
Hodnotenie: 8,0 / 10 (1 hlas cast)
based on 1 rating Hot vretená, 8,0 z 10 na základe 1 hodnotenie

Všeobecné , , , , ,

  1. Ronny
    11.03.2010 o 08:03 | # 1

    Ďalším dôležitým bodom je, že by ste nemali pridať iba jeden disk pri zmene veľkosti agregátu, či je to takmer plné, väčšina z nových údajov, dostane písomné k väčšej disk. Tak, výkon je naozaj zlý!
    Moje odporúčanie: vytvorte niekoľko veľkých agregátov miesto mnohých najmenších. Pridať disky na agregát, kedy sa používania viac ako 80%. A áno, použite Performance Advisor a prahy sledovať svoj výkon!

  2. 11.03.2010 o 10:25 | # 2

    Vďaka Chris - niektoré naozaj dobré tipy tam! Som rád, že píšete znovu :)

  3. 11.03.2010 o 10:39 | # 3

    Hurá za spätnú väzbu, cíti sa dobre, aby skutočne šancu niečo napísať zase!

    A áno, pridávať jednotlivé disky je hrozná vec. Viem, že niekto kupuje 1 disk, mesiac, pretože to je ich rozpočet, ako funguje. Nenávidím to, a snaží sa ich prinútiť k ukladať ich a pridajte ich hromadne prinajmenšom. Nepomôže s ich manažér je povzbudiť k tomu môže volať to úložisko na vyžiadanie! : ( Šokujúce!

  4. Rick Rhodes
    11.03.2010 v 17:01 | # 4

    Spomenuli ste, že "prevádzkovať niektoré realokáciu skenovanie v rámci celého systému bez vplyvu na snímke priestoru" ako novej funkcii s 7.3.2. Možno nápad na ďalší blogu by to vysvetliť viac, a prečo je to dôležité. Chápem (predtým), že prerozdelenie výpis všetku prácu do snímok, ale nie som si vedomý zmeny v 7.3.2 si zmienku, že opravy / zmeny toto.

  5. 11.03.2010 v 21:43 | # 5

    Dúfam, že budem sa beží cez to cez víkend, takže budem môcť dať pár skutočných príkladov, ako to funguje.

  6. 24. marca 2010 o 17:04 | # 6

    Samozrejme by ste mohli vždy slot nové ojedinelým jednotky do regálu každý mesiac, ale nechať ich nečinne prizerať, ako náhradných dielov, až sa dostanete za celý nový RAID skupiny stojí za to ... proste povedať im, že ;-)

  7. Anton
    10.06.2010 v 14:00 | # 7

    @ Rick Rhodes
    Nové prerozdelenie v 7.3.x je fyzická prerozdelenie (realokáciu-p, pozri man stránka). A aj keď si rozšíriť agregáciu s celou policu alebo viac, môže si napriek tomu chcete robiť fyzické prerozdeliť všetkých zväzkov na agregátu, aj keď nemáte horúce disky. Týmto spôsobom môžete pruh dáta naprieč ešte viac vretien, tak to prinesie vyšší (čítať) výkon existujúcich dát tiež.

  8. 13.června 2010 v 16:15 | # 8

    Vlastne manuálu hovorí, že "prerozdeliť-p" by nemali byť používané na šírenie dát cez disky. Odporúča robiť proti prerozdeliť každý zväzok v rámci rozšíreného agregátu.

    Nie ste si istí, aký skutočný dopad tohto je, že som nemal systém vyskúšať to, na ktorom uvidí masívne zlepšenie.

  9. Erlendur
    08.04.2011 o 11:24 | # 9

    Dobrý deň,

    To je krásny príspevok

    Len malá otázka

    disk: 88922F61: C2026AF9: E5D68A17: B49415B1: 00000000:00000000:00000000:00000000

    Ako môžem zistiť, ktorý agregát tento disk patrí?

    Snažil som sa disk show a prehliadky disk skladovanie, aggro stav-r

    Ale nemohol nájsť žiadne

    S pozdravom,

  10. 11.04.2011 v 12:04 | # 10

    Bohužiaľ si nie som 100% istý. Je to na mojom "To-Do zoznamu" a mám ešte prísť na to, ako preložiť dlhý adresný priestor "štatistiky" príkaz vám dáva do niečoho použiteľného z hľadiska zhabanej adresu alebo umiestnenie. Ospravedlňujeme sa to nepomôže vás moc : (

  11. Joe Ropar
  12. 20.apríla 2011 o 09:25 | # 12

    To je vynikajúci! Ďakujem vám!

  13. Vladimír
    01.08.2011 o 18:35 | # 13

    Som zvedavá, aké sú príznaky nevyhnutnosti pre prevádzku "prerozdeliť", okrem toho, že disk s rušnou 99%?

    Vďaka

  14. Vladimír
    01.08.2011 18:36 v | # 14

    Ronny :
    A áno, použite Performance Advisor a prahy sledovať svoj výkon!

    Čo presne hľadáte v Perf.monitor? Latencie, ops / sec?

  15. 11.08.2011 08:29 v | # 15

    Ahoj Vladimír,

    Beh "prerozdeliť" je teraz považované za pomerne dobrú prax na rôznych LUN. Čokoľvek, čo získajú úžitok z veľkého sekvenčné čítanie je vhodným kandidátom pre pravidelné plánované prerozdelenie, ale aj veľa rôznych bežné typy LUN bude ťažiť tak ako tak.

    Hoci disk NetApp subsystém robí veľmi dobrú prácu, uvádzanie údajov vo veľké kusy a pruhy cez disky, to môže urobiť len toľko, buď preto, že systém je veľmi zaneprázdnený, alebo preto, že disky sú veľmi plné. Spustenie prerozdeliť potom je post-proces, tak to môže trvať, že je čas, aby dát je stanovený úplne rovnomerne.

    Možno som opatrný prevádzkovať prerozdeliť ak majú disky už 99% obsadené, bude prerozdeliť klásť väčšiu záťaž na nich po dobu, kedy je pridelená dáta. Ja by som odporučil robiť to počas údržby okna, alebo out-of-hodín.

  1. Žiadne spätné odkazy



Táto stránka nie je v partnerskom vzťahu či sponzorovanej v každom prípade by NetApp alebo akoukoľvek inou spoločnosťou uvedenou vo vnútri.

Zlé správanie zablokoval prístup 1372 pokusov za posledných 7 dní.

© 2009-2012 Chris Kranz Všetky práva vyhradené
Táto stránka nie je v partnerskom vzťahu či sponzorovanej v každom prípade by NetApp alebo akoukoľvek inou spoločnosťou uvedenou vo vnútri.