Brutális Intel Nehalem-EP teljesítmény

Új Xeon inside logoVégre elrajtoltak az Intel új négymagos Xeon chipjei, amelyek a Nehalem mikroarchitektúrára épülnek. A Nehalem újdonságai régóta ismertek már, az asztali változat, a Core i7 már tavaly ősszel piacra került és a Xeon is elérhető már egy ideje egy-két munkaállomásban, köztük az Apple Mac Próban vagy épp a Lenovo gépeiben. A szerverekbe szánt Nehalem EP család tegnap mutatkozott be hivatalosan.

Elképesztő teljesítmény

Oldalunkon már számos alkalommal szót ejtettünk a Nehalem mikroarchitektúra legfontosabb újdonságairól és többször is kiemeltük, hogy az új processzorok leginkább szerverkörnyezetben tudják megmutatni oroszlánkörmeiket. Hogy valójában mekkorák is ezek a körmök, azt eddig nem tudhattuk, az Intel és gyártópartnerei jobban őrizték a pontos teljesítményadatokat mint a Fort Knox-i aranyat. Tegnap azonban mindenről lehullt a lepel, megérkeztek a számok is, amelyek alapján a Nehalem-alapú Xeonok teljesítménye egyszerűen lenyűgöző — az Intel az elmúlt 15 év legnagyobb áttöréseként jellemzi a chipet, és jó okkal.

A Xeon 5500-as sorozat tagjai a kétfoglalatos szerverek között több mint 30 fennálló benchmark-rekordot döntöttek meg, esetenként a korábbi generációs Xeon 5400-as sorozat teljesítményének kétszeresét hozva. A párhuzamos feladatvégrehajtó képességet vizsgáló SPECint_rate_base2006 és SPECfp_rate_base2006 eredményei az új Xeonnak rendre 240 és 194, ehhez fogható magas pontszámokat korábban még egyetlen, kétutas gépbe szánt processzor sem tudott elérni ezen a tesztben. A Xeon 5500-as sorozat teljesítményét jól mutatja, hogy a kétfoglalatos gépek

A HP ProLiant DL370 G6 az online tranzakciókezelést vizsgáló TPC-C benchmarkban 631766 tmpC eredményt ért el Oracle 11g adatbázist futtatva, ez a korábbi generációs, négyfoglalatos ProLiant DL580 G5-éhez hasonló eredmény, és alig 10 százalékkal marad el egy 64 darab 1,5 GHz-es Itanium 2-t (Madison 6M) tartalmazó Integrity Superdome 2005-ben elért 707 ezres pontszámtól. Az IBM System x 6350 M2 az SAP Sales & Distribution benchmarkban állított fel új rekordot, a gép a teszt során 5100 felhasználót tudott kiszolgálni. Virtualizációs teljesítményben és energiahatékonyságban is kiemelkedően teljesítenek az új Xeonok, a VMark teszben a korábbi generációs processzorok teljesítményének másfélszeresét hozzák.

Minek köszönheti brutális teljesítményét a Nehalem? Elsősorban annak, hogy ezt a chipet a kezdetektől fogva szerverekbe szánták. Az előző generációs Core mikroarchitektúra valójában mobil chipnek született, azonban energiahatékonysága mellett a teljesítménye is annyira meggyőző volt, hogy asztali gépekben és szerverekben is megállta a helyét. A Nehalem sokban épít a Core-ra, azonban számos olyan fejlesztést tartalmaz, amely elsősorban szerverkörnyezetben hasznosulhat.

De mitől?

Az első és talán legfontosabb, hogy a Nehalem végre szakít az Intel által évtizedek óta használt buszrendszerrel és integrált memóriavezérlőre, valamint alacsony késleltetésű, magas sávszélességet biztosító pont-pont összeköttetésekre épül: az I/O sávszélesség növekedése elsősorban a többprocesszoros konfigurációk alatt jelent hatalmas előrelépést, lényegében lineáris skálázódás biztosításával. A Quick Patch Interconnect linkek egyenként akár 25,6 gigabájtos áteresztőképességre is képesek (6,4 gigatranszfer másodpercenként egy 32 bit széles vonalon), miközben a processzor az integrált vezérlő révén saját memóriáját 19,2 gigabájtos sávszélességgel éri el DDR3-800 memóriával.

Turbo boost

A Nehalem hatékony működését a 45 nanométeres gyártástechnológián kívül egy dedikált energiagazdálkodási vezérlőnek köszönheti. A chipen egy 1 milliót tranzisztorból álló integrált mikrokontroller kapott helyet, amelynek feladata csak a fogyasztás optimalizálása a terhelés és a hőmérséklet függvényében. A Nehalem minden komponense (magok, memóriavezérlők) külön-külön órajellel rendelkezik, és egymástól teljesen függetlenül küldhető akár a legmélyebb alvás (C6) állapotába.

Az intelligens vezérlésnek köszönhetően a chip egyes részei képesek „turbófokozatba” kapcsolni, amikor arra szükség van. Ha egy négymagos Nehalem két magja tétlenül pihen, a felszabaduló termikus és fogyasztási keretet a logika arra használja fel, hogy a terhelt magok órajelét átmenetileg megnövelje, ezáltal a teljesítmény javul, miközben a chip fogyasztása változatlan marad. Ha a lapka fogyasztása nem éri el az előre meghatározott TDP-t, a logika akár az összes mag órajelét képes megemelni a nagyobb teljesítmény érdekében.

A Quick Path Interconnecttel az Intel kiküszöbölte a korábbi Xeonok skálázódást sújtó legsúlyosabb problémáját, a kritikusan szűkös front side buszt, amelyet a memória- és koherenciaforgalom egyaránt terhelt. Egy 1600 MHz-es front side busszal dolgozó előző generációs Xeon sávszélessége legfeljebb 12,8 gigabájt volt másodpercenként, a Nehalem-alapú változatok esetében ez szélsőséges esetben akár 70 GB/s is lehet.

A megnövekedett sávszélesség tette lehetővé, hogy a négy processzormagba újra visszakerülhessen a Hyper-threading technológia, amely két utasításszál párhuzamos futtatását teszi lehetővé, ezáltal egy Nehalem EP az operációs rendszer és az alkalmazások felé nyolc logikai processzorként látszik. A Nehalem elődeinél sokkal több erőforrással, nagyobb gyorsítótárral és sávszélességgel bír, melyek mind-mind támogatják a többszálúságot.

Változott a processzor cache-hierarchiája is, a Nehalemet kezdetektől fogva háromszintű szervezésre tervezték és optimalizálták. Ez főként abban mutatkozik meg, hogy a korábban osztott és nagyméretű L2 cache a Nehalem esetében magonként dedikált, és lényegesen kisebb méretű, 256 kilobájtos az alacsonyabb késleltetés elérése érdekében. Az L3 cache a magok adatmegosztását és a processzorok közötti koherenciaforgalom kezelését hivatott támogatni. A Nehalem EP csúcsváltozatai 8 megabájtnyi inkluzív, vagyis az L1 és L2 adatait is tartalmazó L3 tárral rendelkeznek.

A processzorban mélyebbre hatolva is találni fontos újdonságokat. Mint ahogy arról már szó esett, a Nehalem a Core mikroarchitektúra továbbfejlesztése, a nagyobb teljesítmény elérése érdekében azonban a magok szintjén is számos kisebb módosítást tartalmaz. Hogy maximális teljesítményt préseljenek ki, az Intel tervezői erőteljesebb soronkívüli motorral vértezték fel a chipet. Az ütemező minden órajelciklusban 96 helyett immár 128 mikroutasításból válogathatja ki a következő végrehajtandó parancsot, ezáltal növelhető a végrehajtóegységek kihasználtságának, lényegében a Nehalem hatékonyabban dolgozik.

Fejlődtek az elágazásbecslők is, az Intel tervezőmérnökei új, másodszintű becslőket vetettek be, elsősorban a nagy kódtömegű alkalmazások (pl. adatbázisok) igényeinek szem előtt tartásával. A teljesítményt tovább javítja az egymástól független cache-hozzáférések gyorsabb végrehajtása, valamint a szinkronizációs primitívek gyorsítása, mely leginkább a többszálú végrehajtást támogatja. A másodszintű TLB (translation look aside buffer, memóriacím fordítási tár) bevezetésével gyorsulnak a virtuális-fizikai memóriacímek megfeleltetései, ami főként nagy memóriaigényű, memóriaműveletekben intenzív kódok alatt jelenthet leginkább előnyt — ezáltal virtualizációs, konszolidációs platformnak is jobban beválik a Nehalem.

Több mint 70 szervergyártó támogatásával

A világ összes nagy szervergyártója bemutatta Nehalem-alapú konfigurációit, az Intel közleménye szerint világszerte több mint 70 kisebb és nagyobb rendszerszállító kínálatában tűntek fel az új chipek, köztük természetesen az olyan gigászokkal mint a 11 új ProLiantet bemutató HP, a Dell, az IBM, a Sun Microsystems (amely a Solaris 10-be számos, Nehalemhez kötődő újdonságot fejlesztett bele), a kisebb, de Magyarországon is ismert szerverszállítók közül pedig a Fujitsu (Siemens) és a Lenovo is felsorakozott az új Xeon mögé, megfizethető Nehalem-EP alapú konfigurálható Intel szervert pedig a szerver.hu ajánl.

Új Xeonok

  • Modell Órajel L3 cache Turbo boost TDP
  • X5570 2,93 GHz 8 Mbyte Van 95 Watt
  • X5560 2,8 GHz 8 Mbyte Van 95 Watt
  • X5550 2,66 GHz 8 Mbyte Van 95 Watt – X5550 szerver teszt itt olvasható
  • E5540 2,53 GHz 8 Mbyte Van 80 Watt
  • E5530 2,4 GHz 8 Mbyte Van 80 Watt
  • L5520 2,26 GHz 8 Mbyte Van 60 Watt
  • E5520 2,26 GHz 8 Mbyte Van 80 Watt
  • E5506 2,13 GHz 4 Mbyte Nincs 80 Watt
  • E5504 2 GHz 4 Mbyte Nincs 80 Watt
  • E5502 1,86 GHz 4 Mbyte Nincs 80 Watt

A Nehalemmel az Intel nem csak egyszerűen visszavette a teljesítménykoronát az AMD-től, amelynek tavaly ősszel bemutatott Shanghai magos Opteronjai megelőzték az akkori Xeonokat. Az AMD válasza a Nehalemre a hatmagos Istanbul, amelyet a vállalat már demózott és az év végére ígér. Az Istanbul jelentős előnye a Nehalemhez képest, hogy foglalatkompatibilis a Shanghai-jal, vagyis nem igényel teljesen új infrastruktúrát, a meglevő szerverek is frissíthetők vele.

Forrás: hwsw.hu

Vélemény, hozzászólás?

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük