Hlavní stránka Hardware Procesory, paměti AMD Bulldozer – Nová architektura CPU od AMD
AMD Bulldozer – Nová architektura CPU od AMD
autor: Z. Obermaier , publikováno 6.9.2010
AMD Bulldozer – Nová architektura CPU od AMD

Většina světových médií přinesla zevrubný pohled na novou architekturu procesorů AMD už minulý týden. My máme sice krapet zpoždění, nabídneme vám ale také více informací. Kromě obecně známých skutečností si podrobně popíšeme architekturu jádra, a pohovoříme více o výkonu budoucí generace procesorů AMD.


AMD Bulldozer – Nová architektura CPU od AMD

Architektura Bulldozer je vyvinuta kompletně od začátku, ze stávajících generací si půjčuje jen některé znaky. Nejmarkantnější jsou integrovaný paměťový řadič, sběrnice Hyper-Transport pro komunikaci se zbytkem systému nebo dalšími CPU. Malá část severního můstku (CPU-NB) v současných Phenomech II se rozrostla na maximální velikost s integrovaným celým severním můstkem včetně PCI-E rozhraní. Nové procesory se objeví nejprve pro servery, v první polovině roku 2011. Nástup na trh se očekává příští léto, pokud se tak stane dříve, půjde o malý zázrak. Čipy do desktopu se objeví až později, tedy spíše na podzim příštího roku. Pokud si tedy budete chtít čipy na bázi Bulldozer pořídit i domů, nejdříve než příští vánoce to asi nebude.

AMD Bulldozer – Nová architektura CPU od AMD

Bulldozer je první architekturou jež sdílí prostředky nejen na bázi čipu, ale i samotných výpočetních jader. Současné architektury sdílí prostředky a součásti až na bázi celého procesoru, jádra například sdílí L3 cache, úsporné funkce, paměťový řadič, propojovací sběrnici. AMD šlo ale ještě dále, u této architektury i samotná výpočetní jádra (jako nejmenší stavební kámen CPU) sdílí prostředky mezi sebou. U Bulldozer každá dvojice výpočetních jader sdílí L2 cache, výpočetní FPU jednotky, dekodér a Fetch (front-end) společně v jednom bloku. Paměť L3 cache, paměťový řadič, rozhraní HT a severní můstek sdílí mezi sebou až celé dvouprocesorové bloky, nikoliv samostatná jádra. Tohle řešení nemá v x86 architektuře obdoby a jde o hodně odvážný krok kupředu. Ptáte se, co to vlastně přinese?

Hlavní je úspora místa, čímž se sníží velikost čipu. Méně tranzistorů také spotřebuje méně energie, tedy i spotřeba bude efektivnější. Zefektivnění celé struktury jádra si vysvětleme na příkladu FPU jednotky, jež je v tomto případě sdílená pro obě jádra. U dnešních procesorů má každé jádro svou samostatnou jednotku, které je díky dnešním aplikacím vytížena většinou málo, řekněme na 50 procent (zpravidla mnohem méně). Více než polovinu času tedy zahálí, sdílením mezi dvě jádra její vytížení stoupne na dvojnásobek. Výkon bude +/- stejný, efektivita dvojnásobná a spotřeba poloviční, což je slušný pokrok. Jak si řekneme v dalších kapitolách, není ale vše takhle jednoduché a některé části si sdílením proti současných čipům i pohoršily. Vždy se v zájmu zefektivnění výroby musí učinit i výkonové kompromisy, jako například zde snížení počtu výpočetních jednotek vůči čipům rodiny K8 (10h).

AMD Bulldozer – Nová architektura CPU od AMD

Architektura samotná je optimalizována pro vysoké frekvence, čehož bylo dosaženo hlavně zkrácením instrukční pipeline. Současné procesory mají 23 stupňů, budoucí procesory by měly být vybaveny pouze 17-ti stupňovou pipeline. Kratší pipeline dokáže udržet akceptovatelné latence a efektivní komunikaci mezi zdroji i při vysokých taktech.

AMD Bulldozer – Nová architektura CPU od AMD

Další novinkou je kompletně nová sada instrukcí, jež budou nové procesory vybaveny. Kromě klasických sad, AMD implementovalo konečně SSE4 a také jistou podobu dávno zrušeného SSE5, v rámci sjednocení s konkurencí jde tedy o AVX instrukční set. Podívejme se na sady detailněji:

SSE4.1 a SSE4.2 – Tuto sadu instrukcí přinesl Intel s druhou revizí procesorů rodiny Core 2. Uplatnění najdou zejména ve zpracování multimediálního obsahu, zpracování videa a fotografií. V aplikacích s podporou SSE4 dochází k viditelnému nárůstu výkonu a rychlosti zpracování bez dopadu na výslednou kvalitu výstupu.

AVXAMD původně vyvíjelo svůj vlastní set SSE5, jež byl ale před dvěma lety zrušen a zůstaly z něj jen fragmenty, které jsou nyní implementovány společně s Intelovskou interpretací AVX instrukcí. Procesory AMD tedy budou umět o několik funkcí více než Sandy Bridge od Intelu, jež se držel striktně AVX specifikace (jež si sám vymyslel). Základ vektorových instrukčních sad (SSE) je jednoduchý, v jediném dlouhém registru je umístěna řada malých dat, jež se všechny najednou vykonají jedinou instrukcí. Délka tohoto registru se u AVX prodloužila ze 128 bitů na 256 bitů. Intel nás zde krapet ošidil, jeho AVX registr sestává ze dvou 128 bitových, tedy nejde o jeden delší. Stejně tomu je i u architektury Bulldozer. Společně s novou délkou registru, přináší AVX také dvanáct nových instrukcí, v případě procesorů AMD jich bude o dvě více (XOP a FMA4). Zmíněná funkce FMAC z prezentace je instrukce patřící do podmnožiny XOP. Tuto sadu zatím v reálu nikde nevyužijeme, nejsou aplikace které ji využijí. Uplatnění najde opět v náročném zpracování videa a těžkých výpočetních úlohách konaných v reálném čase.

AES – Další sadou je AES, jež také přestavil Intel s procesory s jádrem Westmere. Použití je zřejmé už z názvy sady,měla by urychlovat operace s dekódováním a kódováním, práci s hesly a podobně. Současné použitelnost je zatím ale slabší, šestici obsažených instrukcí zatím umí využít jen hrstka programů. Mezi těmi známějšími jsou to Crypto++, DiskCryptor, The Bat!, TrueCrypt a další.

LWP – Posledním sadou je několik příkazů zjednodušujících monitoring běhu aplikací bez větší zátěže systému. Jde o funkce pro programátory, ladiče software a vývojáře jež skrze ně získají snadnější přístup ke statistikám vytížení aplikací. Díky zpětné vazbě jsou výsledky přesnější a nezatěžují dodatečně výkon systému.

Jak je z výčtu nových instrukčních sad patrné, s procesorem architektury Bulldozer dožene kompletně AMD svého rivala Intel, jehož čipy většinu těchto sad podporují už nyní a nebo budou v architektuře Sandy Bridge. O dalších novinkách architektury, jako jsou nové řízení spotřeby, Turbo mód a další si povíme detailněji v dalších kapitolách.



 
Komentáře naleznete na konci poslední kapitoly.
153 čtenářů navrhlo autorovi prémii: 68.5Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.