Hlavní stránka Hardware Procesory, paměti AMD E-350 kompletní rozbor architektury APU Brazos
AMD E-350 kompletní rozbor architektury APU Brazos
autor: Z. Obermaier , publikováno 11.2.2011
AMD E-350 kompletní rozbor architektury APU Brazos

UPDATE! Nyní se dostává na trh první generace APU od AMD. V jediném čipu se skrývá dvoujádrové CPU a DX11 grafické jádro řady Radeon HD 6000. Společně s extrémně nízkou spotřebou a relativně vysokým výkonem jde o vyzyvatele konkurenčních procesorů Atom a čipů ION. Které řešení lépe vyhovuje potřebám trhu?


AMD E-350 kompletní rozbor architektury APU Brazos

Pokud jste se v těch ohlášeních produktů už docela neztratili, stejně jako my, tak vám asi před časem neuniklo, že prvním APU na trhu mělo být právě Llano. To mělo být založeno na 45nm CPU jádrech dnešních Phenomů II (architektura Stars). K nim pak měla být připojena grafika Radeon HD 5000. AMD ale nakonec toto řešení zrušili a přinesou ho až v první polovině tohoto roku s 32nm CPU jádry a Radeonem HD 6000. Jelikož se na trh první dostává řešení s kódovými názvy Zacate a Ontario, podívejme se samozřejmě na ně. Začněme procesorovou částí - dvěma x86 jádry architektury Bobcat.

AMD E-350 kompletní rozbor architektury APU Brazos AMD E-350 kompletní rozbor architektury APU Brazos

Podívejme se společně na levý obrázek, procesorová jádra jsou na něm zvýrazněna nalevo - modrá barva. Jak vidíme, zabírají z plochy čipu (75 mm²) asi čtvrtinu. Zbytek čipu pak tvoří DX11 grafické jádro (červená část) a mnoho dalších komponent, včetně severního můstku (NB), UVD, paměťového řadiče, PCIe rozhraní a dalších.

Další obrázek pak zobrazuje detailně polovinu procesorové části - jedno jádro CPU a paměť L2 cache. I když se původně myslelo a AMD před lety naznačovalo,  že architektura Bobcat bude derivátem Bulldozeru, není tomu tak. Pokud bychom měli stavbu a strukturu procesoru srovnat s nějakou současnou architekturou, mnoho nepochodíme. Část si vývojáři půjčili z Athlonů II, část dokonce z konkurenčních Pentií / Core. Jde skutečně o takový mix všeho možného, srovnávat ale musíme hlavně vůči Atomu, který je sice v mnoha směrech jednodušší a rozdílný, společné znaky se ale najít dají.

AMD E-350 kompletní rozbor architektury APU Brazos

Na tomto obrázku je vše podstatné řečeno souhrnem. I když je možné v mnoha směrech srovnávat Bobcat s Atomem, je zde jeden zásadní rozdíl. Atom je striktní in-order procesor. To znamená, že všechny instrukce se budou vykonávat postupně, jak se zařadily do fronty. To sice šetří plochu čipu a snižuje energetickou náročnost (není potřeba tolik tranzistorů), nevýhodou je ale relativně malý výkon. Většina běžných aplikací na desktopu (pod Windows) totiž počítá s pokročilejší out-of-order architekturou a umí využít její výhody. Všechny dnešní moderní procesory pracují právě v režimu out-of-order, což jim umožňuje zpracovat instrukce na "přeskáčku" a tím výpočty zefektivnit a hlavně urychlit. I když AMD mělo na paměti hlavně nízkou spotřebu, věděli, že tato změna bude procesoru k dobru i za cenu několika Wattů navíc. Díky této možnosti bude procesorové jádro Bobcat zcela jistě výkonnější v single-thread aplikacích než Atom, může ale mít vyšší spotřebu. Vše je o kompromisech.

AMD E-350 kompletní rozbor architektury APU Brazos AMD E-350 kompletní rozbor architektury APU Brazos

Front-end procesoru je vybaven 32kB instrukční cache a ITLB buffer má 512 vstupů. Důležitou částí je Branch predictor jež umí "předvídat" dvě větvení za jeden takt. Jelikož jádro Bobcat je klasický dual-issue procesor (má dva kanály na zpracování instrukcí), stejně jako Atom, má díky out-of-order architektuře velkou výhodu. Pokud se totiž v Atomu tok instrukcí zpomalí nebo zastaví, stane se tak v obou kanálech. U Jádra Bobcat se to nestane, v případě, že jeden kanál bude zaneprázdněn, druhý pojede stále a zpracování instrukcí bude dále probíhat. Zajímavou funkcí je také možnost zcela vypnout části Front-endu, pokud se nevyužívají a tím šetřit energii.

AMD E-350 kompletní rozbor architektury APU Brazos

Druhou částí v řadě je pak dekodér, jež je tvořen dvěma kanály (dvě instrukce za takt). Zde se AMD zřetelně inspirovalo u Atomu a přistoupilo na jejich podivný a nestandardní způsob zpracování instrukcí. Většina dnešních procesorů totiž x86 instrukce přeloží na micro-ops a ty pak zpracovává. Zde je tomu krapet jinak, Intel zkusil místo překladu každé x86 instrukce na řadu micro-ops, naopak spojit několik x86 instrukcí do jedné micro-ops, kdy AMD u všech svých čipů používalo tradiční metodu. O tom jaký je rozdíl mezi micro-op u Intelu a AMD, jsme hovořili v článku o architektuře Bulldozer, nyní se tím zabývat dále nebudeme. Co z toho plyne? Velká většina (89 procent) základních x86 instrukcí se v dekodéru jádra Bobcat přeloží do jediné micro-op, několik desítek složitějších instrukcí pak do dvou micro-ops a více. Tento způsob byl u Atomu nutností, vzhledem k jeho architektuře, proč ho ale použilo AMD u jádra Bobcat, jež není in-order, je otázka. Obecně jde ale o nejefektivnější řešení při co největší úspoře energie a kompromisním dopadem na výkon.

AMD E-350 kompletní rozbor architektury APU Brazos AMD E-350 kompletní rozbor architektury APU Brazos

Dále pak micro-ops putují do výpočetní části procesoru. Ta je rozdělena na dvě části - aritmetickou a FPU. Zde spočívá největší deviza jádra Bobcat, AMD totiž výpočetní jednotky ponechalo paralelní a v maximálním osazení. Zde je na tom Atom mnohem hůře (i když má stejný počet ALU a FP), jelikož v rámci snížení spotřeby na minimum integroval Intel všechny funkce do několika jednotek jdoucí striktně za sebou.

AMD E-350 kompletní rozbor architektury APU Brazos AMD E-350 kompletní rozbor architektury APU Brazos

AMD E-350 kompletní rozbor architektury APU Brazos AMD E-350 kompletní rozbor architektury APU Brazos

Jedno jádro nese 512 kB cache L2 a 64 kB L1 cache rozdělené na dvě části - instrukční a datovou s 32 kB. Paměť je chráněná ECC algoritmem v případě nečinnosti umí snížit svou frekvenci až na polovinu frekvence jádra. To přináší značnou úsporu spotřeby, jelikož L2 paměť má relativně vysokou spotřebu. Latence L1 paměti cache jsou 3 cykly a u L2 cache 17 cyklů. To je dosti podobné jako u Atomu, jež má také 3 cykly pro L1 a 16 cyklů pro L2 cache.

AMD E-350 kompletní rozbor architektury APU Brazos AMD E-350 kompletní rozbor architektury APU Brazos

Na závěr této kapitoly tedy shrnutí vlastností: Procesorové jádro architektury Bobcat je komplexní 64-bitový procesor podporující instrukční sady SSE1 až SSE4A. Zvládá virtualizaci a podporuje pokročilé řízení spotřeby. Veškeré části procesoru, jež je možné vypnout nebo podtaktovat, se při nevyužívání vypínají nebo snižují takt. Řízení spotřeby šlo až do úplných detailů, kdy se mohou vypínat i obvody Front-endu a cache. Podle teoretického zkoumání architektury má šanci být v procesorovém výkonu CPU Zacate výkonnější než Atom, i když ten nejrychlejší pracuje na hodně vysokých 2,13 GHz při spotřebě 2,5 W. Jak dopadne měření uvidíme později, už teď ale předesílám, že novinka od AMD je v operačním systému opravdu mnohem svižnější než Atom a teorie o lepší optimalizaci pro operační systém Windows a běžné aplikace se tedy potvrdila.



 
Komentáře naleznete na konci poslední kapitoly.
107 čtenářů navrhlo autorovi prémii: 36.7Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.