amd-phenom-9500-procesor-platformy-amd-spider
Hardware Článek AMD Phenom 9500 - procesor platformy AMD Spider

AMD Phenom 9500 - procesor platformy AMD Spider | Kapitola 2

Z. Obermaier

Z. Obermaier

28. 11. 2007 01:00 134

Seznam kapitol

1. Úvod - AMD Spider konečně kompletní 2. Změny v architektuře 3. Phenom 9500 v redakci 4. Testovací systém a přetaktování 5. Reálné testy, spotřeba 6. Shrnutí výkonu proti K8 a konkurenci

Dvě předchozí komponenty platformy AMD Spider jsme recenzovali minulý týden, šlo o grafické karty HD38x0 a čipovou sadu RD-790FX. Do kompletního "Pavouka" nám ale ještě jeden kousek skládačky chyběl. Chybějící komponenta - procesor -  je určitě nejzásadnější a neočekávanější částí. Exklusivně, první v české republice si můžete dnes přečíst recenzi plné prodejní verze tohoto procesoru.

Reklama

V této kapitole se podíváme na hlavní technologické novinky, které s sebou procesory generace K10 přinášejí. Sice jsem se již v jednom článku letmo novinkami zabýval, neuškodí si je ale připomenout a hlavně doplnit o nově dostupné informace.

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

Nové vlastnosti, které výrobce považuje za důležité vidíte na prvním obrázku. Ten pochází z firemní prezentace nových čipů, a říká nám toto: Procesory Phenom (nebo také rodina "Stars") mají proti předešlé generaci, ale také i konkurenci plnou podporu Hyper-transportu 3.0, Cool´n´Quiet 2.0, integrovaný DDR2-1066MHz paměťový řadič, sdílenou paměť cache L3, ale hlavně se jedná o první nativní čtyř-jádrový procesor. My se dál v této kapitole tedy na všechny tyto zásadní vlastnosti podíváme blíže.

Hlavní výhody

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

 

Na úvod musím připomenout, že architektura K10 není zcela nová - jako tomu je u konkurence Intelu (Netburst versus Core). Jedná se v podstatě jen o vylepšení starší generace K8, proto by jí možná předpokládaný název K8L slušel lépe. Jedná se v prvé řadě ale o čtyř-jádrový čip, proto se "musí" odlišovat i názvem generace. K9 prý nebylo použito, kvůli americkému seriálu o psu-policistovi stejného jména. Velká většina základních stavebních kamenů architektury a způsobů práce je ale téměř stejná jako u minulé generace, došlo jen k výrazným zdokonalením a vylepšením - proto také nelze čekat obrovské výkonové rozdíly platforem K8 a K10!

Důležitou vlastností je určitě použitý výrobní proces, který je samozřejmě 65nm, dle všech zpráv by se mělo skutečně jednat o nejkomplexnější čip současnosti. Jádro je tvořeno jedenácti vrstvami, což je proti osmi, ze kterých se skládají procesory Intelu výrazný nárůst. Také počet tranzistorů nových čipů je o 25 procent vyšší než mají čtyř-jádra konkurence.

Vyšší počet tranzistorů je samozřejmě způsoben hlavně pamětí cache, která na ploše čipu zabírá podstatnou plochu. Každé jádro procesoru je vybaveno 128Kb L1 cache, potom 512Kb cache druhé úrovně a konečně cache L3 o velikosti 2MB společné pro všechna jádra. Konkurenční procesory Kensfield mají pro každé jádro jen 64Kb cache L1 a společnou cache L2 o velikosti 4MB, paměť L3 zcela postrádají. Výrobce nám veškeré vylepšené technologické vlastnosti shrnul do jednoduchého výčtu, procesory K10 se od K8 odlišují:

  • Širší datovou propustností
  • Zdokonaleným paměťovým řadičem
  • 32-bytovým "fetch bufferem"
  • Zlepšenou funkcí "branch prediction"
  • Vykonáváním instrukcí mimo pořadí
  • Zrychlením vykonávání MOP kódu
  • Zrychlením operací v plovoucí čárce
  • Zlepšenou virtualizací
  • Efektivní novou úspornou technologií

Nejzajímavější a nejdůležitější nové vlastnosti a vylepšení si v krátkosti ještě přiblížíme dál v textu této kapitoly. Více než detailní rozbor všech "papírových" aspektů nové architektury budou ale důležitější praktické testy, proto je popis novinek opravdu jen velmi krátký.

Kompatibilita napříč sockety

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

Zpětná kompatibilita je jednou z hlavních hledisek a předností nových procesorů AMD. Výrobce na tom založil velkou část své politiky a hodně tuto skutečnost zdůrazňuje. Procesory K8 a K10 budou fungovat v obou paticích AM2 i AM2+. Do patice AM3 je ale nedáte, což je hlavně z důvodu DDR3 pamětí. Procesory další generace (45nm K10) ale budou mít integrovaný DDR2 i DDR3 řadič, proto je bezpečně budeme moci použít i v AM2, AM2+ paticích.

POZNÁMKA: Podle prvních zkušeností, bez potíží fungují nové Phenomy na základních deskách osazených čipsety nVidia nForce 5xx zcela bez problémů. Testované desky byly od Asusu, a konkrétně šlo o řadu M2N-SLI.

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

Na obrázku vidíte řez skutečným procesorem s jádrem "Barcelona" nebo "Agena". Čtveřice procesorových jader je jasně patrná, uprostřed čipu se skrývá paměťový řadič, který je už dnes plně kompatibilní s moduly standardu DDR2 i DDR3 - s využitím DDR3 se ale zatím nepočítá, tato část je v nynějších K10 vypnutá. Celou levou část "die" čipu zabírá paměť cache L3.

Skutečné čtyř-jádro

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

 

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

Ano, oproti mnoho let starému modelu spojování částí systému pomocí sběrnice FSB je koncepce AMD a Hyper-transportu mnohem pokrokovější. Hlavní nevýhodou spojení procesorových jader pomocí FSB je její omezená propustnost vůči veškerým důležitým komponentám které jsou k ní připojené.

Uvědomme si, že veškeré I/O zařízení, disky, grafické karty a další jsou spojeny k jediné sběrnici, která je sama o sobě dosti pomalá. Ta je jasně limitujícím "úzkým hrdlem" všech systémů a hlavně těch se čtyř-jádrovými procesory, které k tomu aby byly plně využité nutně potřebují skutečně enormní toky dat. Proto také Intel stále s novými procesory takt FSB zvyšuje, čímž znatelně napomáhá výkonu jeho čipů.

Hyper-transport 3.0

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

 

Výrazným vylepšením, ze kterého celá architektura značně těží je nový standard HT 3.0, který je proti dosud používanému mnohem modernější a efektivnější. Maximální frekvence stávajících řešení měla hranici 1400MHz v jednom směru, oficiální specifikace byla 1000MHz, v obou směrech 2000MHz pro stávající platformu. S HT 3.0 se maximální takt sběrnice zvýšil v obou směrech až na 5200MHz, s čímž vzrostla propustnost z 11.2 GB/s na 20.8 GB/s v jednom směru!

Zdokonalení se samozřejmě netýká jen zvýšení taktu, nová je i predikce a optimalizace datových potřeb a dynamická změna šířky pásma v obou směrech. To znamená, že pokud bude náhle potřeba v jednom směru "dopravit" více informací než v druhém a sběrnice se stane "nedostačující" bude systém schopen v potřebném směru šířku sběrnice zvýšit a tím umožnit efektivní přenos dat.

Největší benefit z této nové verze sběrnice by měly mít hlavně grafické karty v MultiGPU zapojení. Tam se možnost přenosu větších objemů dat rychleji, projeví vyšším nárůstem výkonu.

Rychlejší a vylepšený paměťový řadič

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

Velkým přínosem pro výkon dnešních procesorů AMD je integrovaný paměťový řadič. Stávající Athlony 64 mají jediný 128-bitový řadič, který má ale jednu podstatnou nevýhodu, nedokáže zároveň číst a zapisovat. Přepnutí stavu ze čtení na zápis je hlavní "brzdou" dnešních paměťových řadičů všech domácích platforem a oním "přepnutím" ztrácíme podstatnou část možného výkonu a latence stoupají.

Nové procesory Phenom jsou ovšem v tomto směru velmi pokrokové, mají totiž paměťový řadič rozdělen na dva nezávislé, 64-bitové. To jim pomoci "malého fíglu" s vnitřním čtecím bufferem umožňuje zcela nezávisle číst i zapisovat zároveň, což by mohlo být extrémně poznat na práci s pamětí. Kromě této novinky, vývojáři implementovali velice podobnu technologii organizace práce s pamětí, podobnou "Smart Memory Access" u Intelu.

Vylepšená je i podpora paměťových modulů, jako takových. V "dual channel" je možné využít i moduly s různými kapacitami, maximální možná kapacita připojitelné paměti je až 256TB!

Zdokonalený integrovaný řadič by měl rapidně zvyšovat výkon při použití nízkých latencí modulů - tuto možnost si ostatně vyzkoušíme v kapitole testů. Kde čip podrobíme testu paměťové propustnosti při různých časováních.

128-bitové rozšíření SSE instrukcí

AMD Phenom 9500 - procesor platformy AMD Spider
i Zdroj: PCTuning.cz

Oproti starší generaci K8, která měla jen dva 64-bitové SSE dekodéry mají nové procesory dvakrát výkonnější. U Athlonů 64 se 128-bitové instrukce musely zpracovávat dvěma rozdělenými moduly s poloviční šířkou což není moc efektivní. První procesory s plným 128-bitovým dekodérem jsou Core 2, ovšem procesory AMD s tímto vylepšením musely počkat až do této doby.

Zefektivnění vykonávání instrukcí

Integrace 32-bytů dlouhého "fetch bufferu" výrazně zvyšuje počet možných provedených instrukcí v jeden okamžik. Tím pádem procesor naráz dokáže zpracovat více operací a hlavně se daří využít procesor stále naplno, nemusí se "čekat" na vykonání předešlých instrukcí, a pak spouštět následující.

V mnoha programech se některé instrukce a operace stále opakují, tím že nové procesory Phenom dokáží takové situace dopředu lépe předvídat, mohou v těchto aplikacích značně urychlit požadované operace.

Dalšími vylepšeními jsou "vykonávání instrukcí mimo pořadí" čímž se mohou provádět další instrukce a operace, i když nejdou v posloupnosti za sebou. Tím efektivněji využíváme procesorový výkon a ten zbytečně nečeká na vykonání určité řady instrukcí. Vylepšení a zrychlení FPU jednotky by také mělo výrazně pomoci v práci s médii a v podobně zaměřených aplikacích.

Vyšší datová propustnost

Dvounásobná šířka pásma L2 a L1 cache procesoru, včetně FP scheduleru umožňují skutečně velice efektivní tok dat skrze oba dekodéry. Tato skutečnost by mohla opravdu razantně zvýšit výkon procesoru při práci v velkými toky dat, jako je enkódování videa a podobně. Druhý obrázek jasně ukazuje "úzké hrdlo" na systémech s poloviční šířkou přenosu dat do pamětí cache, v praxi je ale tato výhoda znát pouze u specifických multi-procesorových aplikací. Spolu se zlepšením transportu dat do pamětí cache, přichází i mnohem výkonnější spojení s paměťovými moduly a severním můstkem čipové sady.

 Sdílená Cache L3

Každé jádro procesoru je vybaveno 2x 64Kb paměti cache L1, která slouží jako nejrychlejší datové úložiště procesoru, pokud se paměť zaplní nejstarší data se přesunou do paměti L2, dále stejným postupem i do L3. Jistým omezením se může jevit na dnešní dobu malá paměť L2, která je proti procesorům konkurence čtyřikrát menší, tu ale právě zastoupí sdílená L3 cache. Pokud je nutné nějakou instrukci uchovat delší čas a nebo je společná pro všechna jádra je uložena právě v paměti L3. Z ní jsou data dostupná stejně rychle pro všechna jádra.

 Virtualizace

Jak ukazuje další slide, v prostředí virtuálních počítačů by se měl výkon opět značně zvýšit a to díky několika novinkám. Jak je v popisu na obrázku, první je mnohem efektivnější Hyper-transport sběrnice proti "přetížené" FSB u konkurence. Další podstatný element hovořící pro lepší odezvu je integrovaný paměťový řadič a hlavně hardwarové řízení TLB (Translation Lookaside Buffer).

 

Dosavadní systémy využívali pro virtualizaci "Shadow paging", s novými CPU ale přichází "Nested paging" což je zjednodušeně přímá komunikace s hardwarem počítače, bez překladu "Hypervisorem". K tomu přispěje právě zmíněný TLB buffer, který si bude "pamatovat" spojení mezi virtuálním, skutečným systémem a pamětí. Tím bude přenos velmi zefektivňovat oproti konkurenci, u které sice totéž funguje také ale na softwarové bázi, což je znatelně pomalejší.

 Efektivnější spotřeba - Cool´n´Quiet 2.0

Jako poslední vlastnost, kterou dnes v rychlosti zmíním je nový "úsporný" systém nových procesorů. Ti dokáží v případě nevyužití kteréhokoliv jádra, ale třeba i řadiče pamětí, toto jádro zcela zastavit a snížit tím jeho proudový odběr až na jedno procento maximální hodnoty v zátěži. Co to znamená v praxi? Pokud budete dělat nějakou činnost, která jen mírně zatíží jediné jádro, ostatní tři se zcela vypnou a tím se radikálně sníží spotřeba i vyzářené teplo.

V případě potřeby na vyšší výkon procesoru se poté třeba zapne jen jedno další a dvě budou opět vypnutá. Tato vlastnost by se měla týkat veškerých logických částí procesoru, takže je možné "vypínat" i řadič pamětí a další obvody. V rámci tohoto řešení bude svůj takt snižovat i severní můstek, paměti i Hyper-transport sběrnice!

Veškeré tyto nové vlastnosti ale podporují pouze čipsety z továrny AMD/ATi - v konkrétním případě tedy pouze čipsety série 7 (RD-790FX, RD-790X, RD-770).

Shrnutí

Výrobce veškeré podstatné novinky, kterými se rád pochlubí shrnul do posledního obrázku prezentace nových procesorů. Na závěr si je tedy zopakujeme. Hlavní jsou: Přímé propojení s čipsetem a paměťovými moduly, lepší možnosti přenosů dat proti FSB, první skutečné čtyř-jádro, vylepšená architektura, vylepšené úsporné technologie, L3 cache, Hypertransport 3.0.

Papírově jsou nové procesory opravdu velice zajímavé a deklarované nové vlastnosti velmi pokrokové. Ovšem marketingové propagační materiály bývají většinou "upraveny" aby dělaly dobrý dojem. My se jimi nenecháme ovlivnit a přistoupíme k opravdovému procesoru generace K10 - Phenomu 9500.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama