Hlavní stránka Hardware Procesory, paměti Nehalem - nové revoluční platformy (1/2)
Nehalem - nové revoluční platformy (1/2)
autor: Petr Koc , publikováno 3.9.2008
Nehalem - nové revoluční platformy (1/2)

Letošní podzim se ponese ve světě IT v duchu revoluční změny v oblasti platformy společnosti Intel. Ta poprvé ve své historii nahradí u nového produktu dnes již řádně zastaralou koncepci čipové sady a sběrnice FSB něčím, co slibuje v mnoha případech přinést razantní změnu k vyššímu výkonu aplikací...



Jak už jsem nastínil výše, řešení v podobě FSB má svoje výhody, ale také velkou nevýhodu v tom, že brzdí rychlý přenos dat do CPU. Alternativní řešení se proto nabízí:


Nehalem - nové revoluční platformy (1/2)

Řadič se prostě z čipové sady přesune k procesoru. Mezi procesorem a čipovou sadou nadále zůstává sběrnice ekvivalentní FSB, jen nyní s tím rozdílem, že namísto dat mezi CPU a řadičem pamětí přepravuje data mezi periferii (včetně grafické karty) a řadičem pamětí.

Řešení s řadičem pamětí u CPU má jasné výhody:

  • Procesor není nijak omezen při přístupu k datům. Zpoždění je minimalizováno a propustnost je limitována jen rychlostí RAM.
  • Procesor a řadič pamětí mohou být potenciálně navzájem přizpůsobené a s každou generací procesorů je možné zlepšovat i paměťový řadič.

Má to samozřejmě ale i určité nevýhody:

  • Grafická karta je od pamětí více vzdálena a je potenciálně brzděna sběrnicí spojující řadič a čipovou sadu. V případě AMD se například používá HyperTransport s propustností 4 GB/s jedním směrem, tedy výrazně méně, než kolik činí přenosová rychlost dnešních pamětí.
  • Řešení vyžaduje se změnou paměťové technologie zcela novou infrastrukturu i pro CPU, neboť jiný počet pinů (nebo jejich uspořádání) a jiné technologie (např. on-die termination u DDR2) znamenají natolik rozsáhlé změny v designu, že se není možné obejít bez radikálních změn v řadiči pamětí, a tím pádem i v použitém socketu.

Řešení s řadičem umístěným u CPU je tak primárně vhodné pro vysoce výkonné počítače s grafickou kartou s vlastní pamětí, ale už méně pro počítače s integrovanou grafickou kartou. Nejznámější implementaci tohoto konceptu realizovala společnost AMD v roce 2003 při uvedení procesorů Athlon 64. AMD ale nebylo první, kdo s tímto konceptem přišel, bylo pouze první, kdo s ním přišel ve velkém množstevním rozsahu.
 

Proč Nehalem?

Z povídání výše tak trochu vyplývá, že AMD má se svou koncepcí určitou výhodu v oblasti výkonných počítačů. Tedy zejména v té sféře, která se nejvíc benchmarkuje a která vytváří na potenciální zákazníky pozitivní dojem. Na druhou stranu Intel má nyní natolik rychlé procesory, že si může určité zpomalení na platformě dovolit. Proč tedy plánuje s uvedením Nehalemu v oblasti platforem revoluci? Důvodem je, že AMD si stále bylo schopné zachovat převahu v segmentu, který je velmi prestižní a který je zároveň velmi výnosný (zejména z pohledu výrobní náklady / prodejní cena). Tímto segmentem jsou servery, zejména ty s více sockety. Situace tam momentálně vypadá následovně:

Nehalem - nové revoluční platformy (1/2)

Intel zde soupeří s technologií duální sběrnice FSB. O co jde? Sběrnice FSB není typu P2P (Peer-to-Peer). Naopak je sdílená. To znamená, že pokud se na jednu sběrnici FSB umístí více klientů (typicky více CPU), pak tyto mezi sebou tuto sběrnici sdílí a musí se o ni dělit – v praxi jí chvíli používá ten a další chvíli onen procesor. To s sebou samozřejmě přináší rapidní pokles výkonu a také to není úplně optimální z hlediska možných frekvencí FSB, neboť více klientů znamená horší elektrické vlastnosti.

Horší elektrické vlastnosti jsou obecně důvodem horšího přetaktování nenativních čtyřjádrových procesorů Core 2 Quad. Ty totiž sestávají ze dvou dvoujádrových, přičemž každá dvoujádrová část má svého vlastního FSB klienta. Čtyřjádrový Core 2 Quad je tak z pohledu FSB to samé jako dva dvoujádrové procesory.

Do příchodu procesorů Opteron od AMD používal Intel i pro čtyřcestné servery (např. ty s procesorem Gallatin) jedinou sběrnici FSB, která tehdy navíc měla oproti desktopům velmi nízkou frekvenci (u Gallatinu se používala FSB s propustností 3.2 GB/s, zatímco ekvivalentní procesory pro desktop používaly FSB s propustností 6.4 GB/s). Intel jednoduše nic netlačilo k modernizaci zastaralého řešení a vše řešil obrovskými cache, za které si samozřejmě nechal dobře zaplatit.

Konkurence ho však postupně donutila ke změně. Nyní se na Intelovských platformách běžně vyskytují FSB dvě. U dvouprocesorových platforem tak každý z procesorů má vlastní sběrnici a může využívat její plný výkon. Pokud jsou přítomny procesory čtyři, vždy dva se dělí o jednu sběrnici. Řadič pamětí je stále přítomen v čipsetu, přičemž čipset sám má dva klienty FSB a řadič tak „sedí“ mezi nimi.

AMD naproti tomu používá jiný systém:


Nehalem - nové revoluční platformy (1/2)
V přístupu nazvaném NUMA (neuniformní paměťová architektura) má každý z procesorů svůj vlastní řadič pamětí a k němu připojenou vlastní paměť. Jednotlivé řadiče jsou navzájem propojeny pomocí meziprocesorové proprietální sběrnice coherent HyperTransport a paměti jsou adresovány tak, že některé rozsahy adres obsluhuje řadič prvního procesoru, zatímco další rozsahy řadič druhého. Paměť je tak efektivně rozdělena na segmenty.

Obě řešení mají určité výhody a nevýhody:

Intel dual FSB

AMD NUMA

+ Data jsou umístěna v centralizované oblasti, blízko všem procesorům. Sdílení dat je jednoduché a efektivní.

+ Řešení je plně kompatibilní s již existujícími operačními systémy a nevyžaduje pro dosažení plného výkonu žádné optimalizace software.

+ S přibývajícím množstvím procesorů roste celková propustnost pamětí. Řešení velmi dobře škáluje s rostoucím počtem CPU.

+ Jednotlivé řadiče pamětí mohou být poměrně jednoduché a využívat konvenční (levné) unbuffered nebo registered moduly (případně v kombinaci s ECC).

- S přibývajícími procesory se nijak nezvyšuje kumulovaná propustnost pamětí; dochází ke sdílení omezených zdrojů, výkon tedy velmi špatně škáluje s rostoucím počtem procesorů.

- Sdílení FSB znamená při více procesorech sdílení prostředků, a tedy špatné škálování výkonu.

- Centralizovaný řadič pamětí musí adresovat gigantická nožství paměti, což buďto vyžaduje implementaci vícekanálových řadičů nebo použití speciálních pamětí jako např. drahých Fully Buffered.

- Pro jednotlivé procesory jsou různé paměťové lokace různě daleko. To znamená, že výkon je pro lokální paměťové lokace výrazně vyšší než výkon pro paměťové lokace jiného CPU. Pro efektivní využití celého výkonu jsou vyžadovány operační systémy, které při alokaci software zohledňující tato specifika NUMA architektury.

- Design procesorů je zesložitěn nutností implementovat velmi rychlé meziprocesorové sběrnice a řadič pamětí.

 

Obecně platí, že pro dvouprocesorové počítače jsou obě řešení ekvivalentní – každé má nějaké výhody a nějaké nevýhody. Rozhoduje tak spíše kvalita samotného procesoru. Momentálně má lepší procesory Intel, a proto ve dvouprocesorových řešeních většinou poskytuje lepší výkon. Situace se ale mění u řešení čtyřprocesorových nebo ještě větších. Tam už výhody separátních řadičů pamětí dávají AMD citelný náskok a naopak nutnost sdílet FSB a z toho plynoucí nemožnost vysokých frekvencí FSB naopak Intelu hodně na výkonu ubírají. Toto je ono úzké hrdlo současného designu Intelu a zároveň místo, kde má platforma Nehalemu přinést největší změny.



 
Komentáře naleznete na konci poslední kapitoly.
207 čtenářů navrhlo autorovi prémii: 97.9Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.