Több mostanában történt tanulságos eset világított rá, hogy még mindig milyen sokan használnak desktop konfigurációt szerverként és mennyire kiszámíthatatlanul sérülékenyek ezek a gépek. Sziven ütötte például a hazai SEO társadalmat, hogy a közkedvelt és nagyforgalmú SEO Fórum hosszú napokig nem volt elérhető hasonló okokra visszavezethetően.
Ki mit kockáztat egy PC szerver üzemelétetésével?
A PC szerverek döntő többsége web-, vagy fájlszerverként üzemel, beadva valamelyik szerverhotelbe, jellemzően pl. a Viktor Hugóba. Általában sima PC toronyházban egyprocesszoros asztali alaplap több darab olcsó desktop SATA diszkkel – valahol nettó 150-250e forintos konfiguráció szolgál szerverként. A biztonságról általában Linuxos szoftver RAID gondoskodik hamis biztonságérzetet adva. Ezek a „szerverek” minden további nélkül kiszolgálhatnak 2-3 évet, de persze vannak olyanok is, amik már vagy 5-6 éve mennek kisebb nagyobb zökkenők nélkül.
Nincs semmi gond mindaddig, amíg a saját hobby weblap, vagy a saját pici családi cég honlapja, levelezése van a szerveren és nem különösebb gond, ha a „picibt.hu” nem elérhető néhány napig. Más a helyzet, ha az ifjú titán webtárhely szolgáltatóként jelenik meg a weben egy professzionálisnak tűnő szolgáltatással. Borzasztóan egyszerü azt a látszatot kelteni, mintha sok szerveres komoly szerverfarmról lenne szó: Egy virtualizált PC-n nem gond beállítani 8-10 virtuális gépet, melyek külön IP címeken csücsülve tényleg impresszív szerverfarm látszatát keltik. Profi IT-s legyen a talpán, aki le tudja nyomozni, hogy igazi kiszolgáló vasakról, vagy csak virtuális szerverekről van szó.
Webhoszting szolgáltatóként a magas rendelkezésre állás (HA, High Availablity) garantálása egy PC szerveren egyszerüen blöff, hazugság. Lássuk az okokat:
A PC-k egyetlen alkatrésze sem 0-24/365 üzemre lett tervezve. Elsősorban a tápegység, másodsorban a ventillátorok, harmadsorban a passzív és aktív elektronikai alkatrészek sínylik meg az állandóan bekapcsolt állapotot. A tápegység tönkremenetele jó eséllyel további alkatrészeket tud megölni: az alaplap, illetve írási ciklustól függően a winchester, de legalábbis a merevlemezen lévő adatok sérülnek általában. A jobb (drágább) ventillátorok csapágyassá válhatnak, a rosszabb minőségű, olcsóbb ventillátorok egyszerüen beállnak néhány éves szolgálat után. Mondanom sem kell, megfelelő hűtés nélkül a PC bizonytalanná válik, elkezd le-lerohadni, majd végleg beadja a kulcsot. Távmenedzsment (távfelügyeleti kártya) nélkül a tulajnak esélye sincs kitalálni, mi lehet a gond, vihet néhány alkatrészt magával a szerverterembe megjavítani a kifeküdt vasat.
A valódi szerverek ezzel szemben tényleg állandó üzemre lettek tervezve és méretezve. Még a fix beépítésű, szimpla tápegységes szerverházak is sokkal megbízhatóbbak – én még nem találkoztam szerver táp hibával – nem beszélve a redundáns tápú modellekkel, ahol két tápegység párhuzamosan van jelen és egy vezérlő elektronika felügyeli az állapotukat, akár üzem közben is cserélhető a meghibásodott darab.
A szerverek szellőzése sokkal jobban átgondolt és tudatosan megtervezett, általában több fő ventillátor gondoskodik a hatékony levegő keringetésről. Az igazán válogatós megrendelő akár ventillátor-redundanciáról is gondoskodhat, két-két ventillátor üzemel minden pozícióban, bármelyik akár üzem közben is cserélhető. (Átlag szerverekben azért nincs szükség erre a top biztonságra.)
Az alaplap mellett minden más elektronika is 0-24-es üzemre tervezett, nem várható hogy akármi is tönkeremegy néhány éven belül. Nem véletlenül jár a jobb szerverekhez 3 év teljeskörű garancia, a brand gyártók nem vállalnak felesleges rizikót a három évvel.
Merevlemezek és RAID megoldások
A merevlemezek teljesen hasonlóan elkülönülnek várható élettartam szempontjából, hasonlítsuk össze például a Seagate Barracuda LT desktop és az ES.2 szerver merevlemezek várható meghibásodások között eltelt órák számát:
- ST31000520AS – Mean Time Between Failures (hours): 750,000
- ST31000340NS – Mean Time Between Failures (hours): 1,200,000
Világos, hogy az ES.2 (NS sorozat) lényegében dupla megbízhatóságú és sokkal inkább elviselni az éveken keresztüli 0-24 órás szolgálatot. Tremészetesen a SAS merevlemezek is Enterprise léptékű és megbízhatóságú darabok, a 3,5″-os Cheetah és a 2,5″-os Savvio a Western Digital RE3 (RaidEdition3) sorozatához hasonlóan mind-mind szervermegoldásokhoz készült.
- A diszkeken használt RAID megoldás a PC-k esetében legtöbbször Linux vezérelt szoftveres RAID. Legnagyobb hátránya, hogy az egyik diszken van a rendszer OS partíció, ha ez a lemez eseik ki, akkor szinte biztosan menthetetlenül sérül az adatbázis. Ha szerencsés a tulaj és a másik diszk esik ki, akkor visszaállítható a tükör. Ha nem szerncsés – és ez történt a SEO Fórum esetében is – elvesznek az adatok. A Fórum rendszergazdája pl. 150e forintos költség mellett tudta visszanyerni az adatokat egy adatmentő cég segítségével. Be van ez tervezve nálad?!
- A következő lépcső az Embedded SW RAID, vagyis egyes alaplapok kínálnak alaplapi szoftveres RAID-et (a szerver alaplapok kivétel nélkül tudnak ilyet, általában SATA RAID-et.) Ez már megbízhatóbb megoldás, mert mindegy hogy melyik merevlemez esik ki, jó eséllyel helyrehozható a tömb egy új diszk beállításával. De ez is sérülékeny megoldás: ha történetesen pont írási ciklusban áll meg a rendszer mondjuk hardverhiba vagy áramszünet esetén, jó eséllyel elúszik a RAID tömb információ is és lőttek az adatoknak.
- A harmadik valóban pro megoldás a hardveres RAID, külön RAID vezérlőkártyával, lehetőleg BBU azaz Backup Battery Unittal: ez esetben a külön akku lehetővé teszi, hogy megmaradjon a RAID tömb információ akár totális áramszünet esetén is, akkor is ha épp írási ciklus allatt történt meg. Ez az egyedüli megoldás amellyel valóban nagy eséllyel nem kell gyakori adatvisszaállításban gondolkodni.
Tehát ismételten: ha desktop diszkeket használsz, vállalod hogy nagyobb eséllyel hibásodik meg az egyik előbb-utóbb. Ha nem szerver RAID-et használsz, inkább járj gyakrabban a templomba!
Bármilyen RAID-et használsz is, egyetlen RAID sem helyettesíti a rendszeres adatmentést! Átgondolt backup és kipróbált(!!!) viszzaállítási terv nélkül csak hazárdírozás az adattárolásod!
Távmenedzsment megoldás
Minden brand szervergyártó kínál Remote Management kártyát:
- Intel: RMM3 (Remote Management Module 3)
- Dell: DRAC (Dell Remote Access Control)
- Sun: ILOM (Integrated Lights Out Manager)
- IBM/Lenovo: IMM (Integrated Management Module)
- HP: ILO (Integrated Lights-Out)
Ezzel a KVM kapcsolattal időben észlelhetők a hardver hibák és fatális rendszerösszeomlástól óvhatod meg a kiszolgálód. Nem beszélve arról, hogy hardverhiba vagy lerohadás esetén sem kell a sötétben tapogatóznod, megpróbálhatod kívülről újraindítatni a vasat, a logokból illetve a diagnosztikai üzenetekből kisakkozni, mi történhetett. Ez PC-k esetében csak álom.
Összeségében ezért érzem azt, hogy PC-t használni szerverként tényleg hazárdírozás.
Az Intel® Xeon® 3400-as sorozaton alapuló szerverek, melyek az Intel belépő szintű kiszolgálói, kiváló alternatívát nyújtanak PC alkalmazása helyett.
Szép írás, jól összefoglaltad. Aki a VH-ba, vagy a mellette lévő épületbe rakja a 10e Ft/hó -s hosting cégekhez szobai légkondi alá salgo polcon összezsúfolva a gépet, az meg is érdemli. Általában a szolgáltatók hirdetéseiből sok minden látható, még ha nem is árulja el a konkrét helyet. Nem kell nagy tapasztalat hozzá, ha már 2Mbit/s-es sávot mondd külföldi max-nak, akkor ott az olcsó szerver hosting játszik.
A megbízhatóságban vannak azért gyakori ellenpéldák is. Korábbi pályafutásom alatt találkoztam olyan HP szerverekkel, amiknél valamiért az időzítő teljesen megadta magát, és valamiért lassabban telt az idő a szerveren, és ettől minden megfeküdt. Support sem tudott mit kezdeni vele, és több ilyen gép is volt, feltehetően széria hiba volt. Megjegyzem nem volt high-end szerver, de azért elvileg erre volt tervezve. Persze ilyen esetben bármi nemű távoli konzol parancs évekig tartott, és csak az segített, ha fizikailag „belerúgott” valaki.
Amikor a Compaq-ot megvette a HP, akkor tájt volt egy másik eset amikor pl. egyik szerver úgy érkezett, hogy a scsi raid kártya félig ki volt csúszva, persze ez szépen ki is írta a képernyőre, hogy miért nem akarja az igazságot. A másik, valószínű viszonteladói félreértés miatt, a második HDD amit kértünk bele, az valamilyen más típus volt, és persze 100%-ban méretileg nem egyezett meg a gyárival, így a HW raid-et el is felejthettük további pénz hiányában.
Nem tudom mi a helyzet VH szerver termek körül, de azt tudom, hogy KVM-et Adatparkban adnak, és ugyanúgy lehet akár a 0-24-es support-tól hard resetet kérni, valamint KVM installt és visszajelzést.
„A diszkeken használt RAID megoldás a PC-k esetében legtöbbször Linux vezérelt szoftveres RAID. Legnagyobb hátránya, hogy az egyik diszken van a rendszer OS partíció, ha ez a lemez eseik ki, akkor szinte biztosan menthetetlenül sérül az adatbázis. Ha szerencsés a tulaj és a másik diszk esik ki, akkor visszaállítható a tükör.”
Ezt komolyan gondolta a cikk szerzője?? Ha valaki csak az adat partíciót tükrözi, az meg is érdemli. No de a teljes sw raid nem csak az adat, hanem a rendszerpartíciót is tudja tükrözni, így a fenti sorok igazából nem tükrözik a valóságot. Persze jó drága HW raid kártyák eladásához jó marketing. És ugye a raid 1-en kívül is van élet, meg olyan is van, hogy spare disk amivel ki lehet tömni egy pc „szervert” de ugye nem ez az ideális, viszont low-cost. A többivel természetesen egyetértek, ne alapozzunk komoly szervert pc-re.
A cikk csak annyit állított, hogy a szoftveres RAID a legkevésbé megbízható, az Embedded SW RAID talán egy fokkal jobb megoldás, illetve a HW RAID backup battery-vel biztosan megbízhatóbb és nagyobb teljesítményű megoldás. NEM TUDNÁL lebeszélni róla, hogy pl. ezen a szerveren ne legyen HW RAID kártya, mert az csak marketing fogás…