Radeony HD4800 - mainstreamové dělo přichází! | Kapitola 3
Seznam kapitol
Naše prvotní "preview" výkonu Radeonu HD4850 vás mělo navnadit na doplněnou druhou část článku. Dnes je oficiální datum uvedení nových karet, a proto vám slíbené pokračování právě nabízíme. V testu se nově podíváme na technologické novinky, a na závěr také na výkon dvojice Radeonů v zapojení CrossFire.
V této kapitole se pokusím jednoduše popsat některé novinky, které nám ATi s novými Radeony HD4800 přináší, a kde vylepšení znamenají proti předešlé generaci znatelná navýšení výkonu. Stále je patrné, že původní jádro R600 a dnešní RV770 mají mnoho společného, a stavba základních kamenů jádra zůstala téměř stejná (architektura R600 zde). Došlo k několika dílčím změnám (například: paměťový řadič), většina bloků jádra (řídící procesor, stavba stream procesorů) zůstala beze změn.
TeraScale Graphics Engine
Jak už jsem jednou uvedl, pod tímto dlouhým názvem, se skrývá kompletní grafické jádro RV770. Už nejde jen o GPU (Graphics Processing Unit) ale o výkonnou jednotku s dalšími funkcemi a možnostmi využití. Vzhledem k výpočetnímu výkonu 1TeraFLOPS, se tedy jádro (mnoho procesorový superpočítač) nazývá TeraScale Engine.
Rozložení jádra vidíte na obrázku (klikněte pro zvětšení). Zcela nahoře je řídící (command) procesor s teselační jednotkou, uprostřed je největší část - shader core, v dolní části jsou jednotky ROPs a na pravé straně je zobrazen paměťový řadič (crossbar). O každé části si krátce povíme.
Shader core
Největší část čipu zabírá shader core, to se skládá ze SIMD jednotek. Čip RV770 má uspořádány SIMD jednotky v deseti řadách, a každá nese 80 jednoduchých stream procesorů. To dává dohromady 800 SP, to je proti starší generaci zcela nové rozložení (RV670 má pouze čtyři řady SIMD procesorů s 80-ti stream procesory = 320 SP). To představuje 2,5x nárůst výpočetního výkonu.
Ke každé řadě SIMD náleží texturovací jednotka složená, stejně jako u R600, ze čtyř menších součástí spolu s pamětí L1 cache. Před časem se spekulovalo, že poměr ALU:TEX bude vzhledem k požadavkům dnešních her snížen na 3:1, nestalo se tak. ATi zachovala poměr 4:1, ale díky optimalizacím je výkon vyšší než u předešlé generace.
Stream procesory
V jedné SIMD řadě se nachází 80 stream procesorů, které jsou seřazeny ve skupinách po pěti (tak tomu je už od R600). Každá jednotka z této pětice je schopná vykonávat v shadingu základní MADD (MUL+MAD) operace, jedna jednotka zvládá i složitější funkce (sin, cos atd.). V samotných SP tedy žádné výkonové optimalizace nejsou, nárůst výkonu je dosažen zvýšením jejich počtu.
Texturovací jednotky
Samotné texturovací jednotky se také nijak nezměnily, a navýšení výkonu je opět způsobené hlavně jejich větším počtem. Změnila se ale jejich práce s pamětí cache - L1 je teď pro každou jednotku dedikována a není již společná pro všechny. Také komunikace mezi L2 a L1 se razantně urychlila, což výrazně navýšilo výkon proti minulé generaci.
Render Back-Ends (ROPs)
ROPs jsou jednotky, které kromě jiného, provádějí operace vyhlazování scény. Propady výkonu při zapnutých vylepšeních obrazu, byly vždy největší bolestí posledních karet ATi. Proto byla odstranění tohoto problému věnována velká pozornost a výsledek se dostavil. Propady bez vyhlazování proti 4xAA jsou velmi malé, totéž platí pro nastavení 4xAA a 8xAA.
Vylepšený řadič pamětí
ATi od R600 až k RV670 používala vnitřní "ring-bus" řadič pamětí. U novinky RV770 tomu tak již ale není, všechny části jádra jsou spojeny s novým "memory hubem", který řídí veškeré operace s pamětí. Tím se i při použití levného 256-bitového rozhraní k externím modulům (skrze crossbar) dosáhlo větší efektivity, a propustnost pamětí narostla skoro dvojnásobně (při použití GDDR5).
Geometry shadery a teselátor
Výkon geometry shaderu byl zvýšen, a dosahuje výkonu nejvýkonnější karty konkurence (světle červený je HD4870, světle zelená GTX 280). Také teselační jednotka (zvyšuje počet polygonů u objektů, kde jich je nízký počet) byla vylepšena.
GDDR5
Paměti GDDR5 nabízejí nižší napájecí napětí, nižší teploty, vysokou propustnost, vysoké frekvence, technologii pro detekci problémů a chyb. Srovnání GDDR5 proti GDDR3 s vysokou spotřebou, teplotami a slabou propustností je srovnatelné s DDR1 versus DDR3. Ve všech směrech se jedná o velmi moderní a pokrokové moduly, jedinou nevýhodou je horší dostupnost a vysoká cena.