radeony-hd4800-mainstreamove-delo-prichazi
Hardware Článek Radeony HD4800 - mainstreamové dělo přichází!

Radeony HD4800 - mainstreamové dělo přichází! | Kapitola 3

Z. Obermaier

Z. Obermaier

25. 6. 2008 01:00 171

Seznam kapitol

1. Úvod - Staro(nová) strategie ATi 2. Radeony řady HD4800 - co přinášejí nového 3. Architektura RV770 4. Radeon HD4850 512MB v obrazech 5. Testovací sestava 6. Spotřeba, přetaktování a teploty 7. 3Dmarky 8. World In Conflict DX9 9. Company Of Heroes: Opposing Fronts DX9 10. Supreme Commander: Forged Alliance 11. Crysis DX9
12. Bioshock DX9 13. Unreal Tournament 3 14. Call Of Duty 4 15. Half Life 2: Episode Two 16. Lost Planet DX9 17. Elder Scrolls IV : Oblivion 18. DirectX 10 hry 19. Shrnutí výkonu 20. Radeony HD4850 v CrossFire 21. Závěr

Naše prvotní "preview" výkonu Radeonu HD4850 vás mělo navnadit na doplněnou druhou část článku. Dnes je oficiální datum uvedení nových karet, a proto vám slíbené pokračování právě nabízíme. V testu se nově podíváme na technologické novinky, a na závěr také na výkon dvojice Radeonů v zapojení CrossFire.

Reklama

V této kapitole se pokusím jednoduše popsat některé novinky, které nám ATi s novými Radeony HD4800 přináší, a kde vylepšení znamenají proti předešlé generaci znatelná navýšení výkonu. Stále je patrné, že původní jádro R600 a dnešní RV770 mají mnoho společného, a stavba základních kamenů jádra zůstala téměř stejná (architektura R600 zde). Došlo k několika dílčím změnám (například: paměťový řadič), většina bloků jádra (řídící procesor, stavba stream procesorů) zůstala beze změn.

TeraScale Graphics Engine

Radeony HD4800 - mainstreamové dělo přichází!
i Zdroj: PCTuning.cz

Jak už jsem jednou uvedl, pod tímto dlouhým názvem, se skrývá kompletní grafické jádro RV770. Už nejde jen o GPU (Graphics Processing Unit) ale o výkonnou jednotku s dalšími funkcemi a možnostmi využití. Vzhledem k výpočetnímu výkonu 1TeraFLOPS, se tedy jádro (mnoho procesorový superpočítač) nazývá TeraScale Engine.

Rozložení jádra vidíte na obrázku (klikněte pro zvětšení). Zcela nahoře je řídící (command) procesor s teselační jednotkou, uprostřed je největší část - shader core, v dolní části jsou jednotky ROPs a na pravé straně je zobrazen paměťový řadič (crossbar). O každé části si krátce povíme.

Shader core

Největší část čipu zabírá shader core, to se skládá ze SIMD jednotek. Čip RV770 má uspořádány SIMD jednotky v deseti řadách, a každá nese 80 jednoduchých stream procesorů. To dává dohromady 800 SP, to je proti starší generaci zcela nové rozložení (RV670 má pouze čtyři řady SIMD procesorů s 80-ti stream procesory = 320 SP). To představuje 2,5x nárůst výpočetního výkonu.

Ke každé řadě SIMD náleží texturovací jednotka složená, stejně jako u R600, ze čtyř menších součástí spolu s pamětí L1 cache. Před časem se spekulovalo, že poměr ALU:TEX bude vzhledem k požadavkům dnešních her snížen na 3:1, nestalo se tak. ATi zachovala poměr 4:1, ale díky optimalizacím je výkon vyšší než u předešlé generace.

Stream procesory

V jedné SIMD řadě se nachází 80 stream procesorů, které jsou seřazeny ve skupinách po pěti (tak tomu je už od R600). Každá jednotka z této pětice je schopná vykonávat v shadingu základní MADD (MUL+MAD) operace, jedna jednotka zvládá i složitější funkce (sin, cos atd.). V samotných SP tedy žádné výkonové optimalizace nejsou, nárůst výkonu je dosažen zvýšením jejich počtu.

Texturovací jednotky

Samotné texturovací jednotky se také nijak nezměnily, a navýšení výkonu je opět způsobené hlavně jejich větším počtem. Změnila se ale jejich práce s pamětí cache - L1 je teď pro každou jednotku dedikována a není již společná pro všechny. Také komunikace mezi L2 a L1 se razantně urychlila, což výrazně navýšilo výkon proti minulé generaci.

Render Back-Ends (ROPs)

ROPs jsou jednotky, které kromě jiného, provádějí operace vyhlazování scény. Propady výkonu při zapnutých vylepšeních obrazu, byly vždy největší bolestí posledních karet ATi. Proto byla odstranění tohoto problému věnována velká pozornost a výsledek se dostavil. Propady bez vyhlazování proti 4xAA jsou velmi malé, totéž platí pro nastavení 4xAA a 8xAA.

Vylepšený řadič pamětí

ATi od R600 až k RV670 používala vnitřní "ring-bus" řadič pamětí. U novinky RV770 tomu tak již ale není, všechny části jádra jsou spojeny s novým "memory hubem", který řídí veškeré operace s pamětí. Tím se i při použití levného 256-bitového rozhraní k externím modulům (skrze crossbar) dosáhlo větší efektivity, a propustnost pamětí narostla skoro dvojnásobně (při použití GDDR5).

Geometry shadery a teselátor

Výkon geometry shaderu byl zvýšen, a dosahuje výkonu nejvýkonnější karty konkurence (světle červený je HD4870, světle zelená GTX 280). Také teselační jednotka (zvyšuje počet polygonů u objektů, kde jich je nízký počet) byla vylepšena.

GDDR5

Paměti GDDR5 nabízejí nižší napájecí napětí, nižší teploty, vysokou propustnost, vysoké frekvence, technologii pro detekci problémů a chyb. Srovnání GDDR5 proti GDDR3 s vysokou spotřebou, teplotami a slabou propustností je srovnatelné s DDR1 versus DDR3. Ve všech směrech se jedná o velmi moderní a pokrokové moduly, jedinou nevýhodou je horší dostupnost a vysoká cena.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama