radeon-x1800-architektura-cipu-r520
Hardware Článek Radeon X1800 - architektura čipu R520

Radeon X1800 - architektura čipu R520 | Kapitola 6

Petr Štefek a Jiří Souček

Petr Štefek a Jiří Souček

7. 10. 2005 01:00 51

Seznam kapitol

1. Radeon X1800 alias R520 2. Vertex shaders 3. Pixel Shadery 4. Řadič pamětí - ring-bus
5. Anizotropní filtrace 6. Full-Scene AntiAliasing 7. HDR - High Dynamic Range, AVIVO, CrossFire a závěr

Společnost ATi konenčně uvedla dlouho očekávanou sérii Radeonů X1000 a my se na ni dnes podíváme trošku blíže a vysvětlíme si některé její výhody a nevýhody oproti konkurenční architektuře nVidie a jejímu čipu G70. Na recenzi výkonu nového Radeonu si ještě budete muset nějaký ten den počkat, protože naměření tak velkého kvanta dat trvá delší dobu než u běžné recenze. Ale již dnes mohu prozradit, že se je opravdu na co těšit.

Reklama

FSAA v užším slova smyslu se na hardwaru ATi vyvinul ve třech krocích. Prvním byl supersampling s uspořádanou mřížkou na R100 (OGSS, používaly ho např. i GF256 a GF2). Druhým krokem byl supersampling s flexibilní mřížkou na kartách generace R2x0, který díky výhodnější mřížce (ATi ji v ovladačích měnila, nakonec zůstala u semi-rotated grid) dosahoval 50% zlepšení v účinnosti odstraňování hran při stejném množství použitých vzorků a nakonec to je multisampling programovatelný v rámci mřížky 12x12 s možností použití gamma korekce 2.2 jednotlivých vzorků pro kompenzaci tmavšího obrazu monitorů. Tento režim podporují čipy R3x0, R4x0 a R5x0. Pojďme se na něj podívat podrobněji.

MSAA R520

R520, nabízí stejně jako R300 a R420 programovatelný MSAA včetně všech jeho výhod. ROPs (raster outputs) se v tomto ohledu příliš nezměnily a jsou schopny vykreslit dva AA vzorky za průchod. Maximální počet průchodů je také stejný, tzn. tři. Výsledkem jsou tři základní režimy: 2x, 4x a 6x (G70 je taktéž schopna vykreslit dva vzorky za průchod, ale díky fixní mřížce pro čtyři vzorky jsou podporovány jen dva průchody, neboť třetí by nedával smysl)

Změny tentokrát postihly hlavně paměťový subsystém, díky kterému je možné realizovat vyšší režimy s výrazně nižším výkonnostním propadem. Při režimu 6x by měl být propad procentuelně srovnatelný nebo nižší, než na předchozí generaci při režimu 4x. Tento rozdíl pramení hlavně ze značně vylepšeného systému cache pamětí, interního ring-bus, který snižuje latence (ty podstatně ovlivňují rychlost MSAA) a dále samotný paměťový řadič, který přistupuje ke každému GDDR3 modulu samostatně. To přináší výhodu pro rychlé přenosy malých objemů dat, typických pro MSAA. Snížení procentuálního propadu při použití AA ukazuje ATi ve svých grafech z FarCry a Battlefield 2:

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz

Výkon bez FSAA je označen jako 100%%
i Zdroj: PCTuning.cz
Výkon bez FSAA je označen jako 100%%

Další porci výkonu přidal paměťový řadič, který je díky použitému výrobnímu procesu schopen fungovat na velmi vysokých frekvencích, díky čemuž si ATi mohla dovolit použití rychlých modulů taktovaných (na X1800XT) na 750MHz (odpovídá 1500MHz efektivně). Podle oficiálního vyjádření je ale řadič naddimenzován a připraven pro použití ještě rychlejších pamětí.

V tomto ohledu má ATi značný náskok vůči konkurenční G70, jejíž řadič si nemůže vysoké takty dovolit, což má za následek limitaci výkonného čipu paměťovou sběrnicí (která je procentuálně vyšší, než u GF6800Ultra). Situace by se mohla zlepšit s plánovanou 90nm verzí G70 (G72?). Její vydání se očekává v lednu příštího roku, na kdy ATi podle posledních zpráv plánuje i vydání čipu R580. Situace je čím dál zajímavější, nVidia se nechce nechat připravit o pozici, které nabyla vydáním G70 a ATi chce za každou cenu vydáním R580 dorovnat skluz, který způsobil soft-ground problém R520.

Gamma correction - výhoda, ale...?

Tato patentovaná technologie byla přítomna již na předchozích DX9 Radeonech, ale ATi ji i nadále používá a chválí. Protože se s touto technologií setkáváme stále, by bylo vhodné si ji připomenout. Prohlédněte si následující obrázek:

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz

Na první pohled se zdá, že jeden horní čtvereček je bílý, druhý šedý a spodní dva jsou černé. Ve skutečnosti tomu tak není. Mezi spodními dvěma je stejný rozdíl (25 odstínů), jako mezi oběma horními (taktéž 25 odstínů z 256 barevných odstínů grayscale). Že se nám zdá rozdíl u spodních dvou barev menší (až neznatelný) je způsobeno dvěma faktory. Tím prvním jsou schopnosti a nastavení zobrazovacího adaptéru (monitor). Monitory jsou obvykle seřízeny tak, aby obraz vypadal kontrastně a výrazně (nebyl šedivý), což má za následek menší vizuální rozdíl mezi tmavými odstíny (zdají se nám totožné), než mezi světlými (rozdíl je viditelný i mezi dvěma sousedícími odstíny grayscale palety). Druhým faktorem jsou opět omezené schopnosti lidského oka, které je citlivější na světlé odstíny (což je ve scénách s kompletním jasovým rozsahem ještě umocněno tím, čemu běžně říkáme oslnění).

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz

kliknutím zvětšítee

Na obrázku od ATi je patrné, že mezi odstíny dopočítanými antialiasingem se díky výše zmíněným faktorům nezdají být stejné barevné (resp. jasové) rozdíly. Pravé 3 odstíny se jeví jako stejné (či podobné), tzn. že dva vzorky byly použity zbytečně (a je tedy mrháno výkonem). ATi přišla s nápadem provést gamma korekci (úprava míry kontrastu) pixelů, které jsou vyhlazovány, aby byl rozdíl mezi každými dvěma sousedícími odstíny vizuálně stejný (či podobný). V praxi to znamená až o 50% (vizuálně) lepší vyhlazení.

Zní to až moc dobře na to, aby se neobjevil alespoň jeden menší zádrhel. A skutečně. Tato technologie byla prvně použita v roce 2002 kdy naprostá většina zobrazovacích adaptérů byly klasické analogové monitory. Podle nich vybrala ATi hodnotu, na kterou je gamma křivka vyhlazovaných pixelů upravena, konkrétně 2,2. Jenže od té doby se velice rozšířily i LCD panely, které mají typicky nižší kontrast a vyšší jas. Díky této kombinaci parametrů může dojít k tomu, že při použití LCD s velmi vysokým jasem nebude popsaný psychovizuální model fungovat a výhody gamma-corrected AA se rozplynou. Pokud si nejste jisti, zda by vám lépe vyhovoval gama-corrected AA ATi nebo standardní AA nVidie, můžete se podívat na tuto stránku: vlevo si klikněte na hodnotu "1.00" a prohlédněte dvojitý sloupec označený jako "monitor calibration target". Pak si klikněte na hodnotu "2.20" a znovu si dvojitý sloupec prohlédněte. Nyní záleží na tom, při které hodnotě se vám zdálo, že mají obě poloviny sloupce podobnější odstín. Pokud to bylo při čísle 1.00, máte zřejmě LCD panel s vyšším jasem a pro vás kvalitativně vhodnější současný FSAA nVidie. Pokud si byly poloviny sloupce odstínem bližší při hodnotě 2.20, máte pravděpodobně CRT monitor nebo LCD s nižším jasem a je pro vás kvalitativně vhodnější FSAA ATi.

Bylo by však dobré, aby si toto uvědomili i v ATi a přidali možnost nastavení nižší gamma correction pro AA, zhruba kolem hodnoty 1.4-1.6 (majitelé LCD panelů by to jistě ocenili).

Adaptive Anti-Aliasing

Dále jen AdAA.Po vydání čipu G70 představila společnost nVidia technologii nazvanou TrAA (transparent anti-aliasing), neboli vyhlazování alpha-textur. To jsou textury, jejich část je průhledná a část nese nějaký obraz (jsou používány především pro mříže, pletivo, listy, trávu apod.). Rozhraní průhledné plochy a samotné kresby je naprosto ostré, tzn. pixel je buď průhledný, nebo opakní (neprůhledný). To přináší vysokou pravděpodobnost aliasu právě na těchto rozhraních.

Existuje mnoho postupů, které dokážou aliasing na apha-texturách odstranit, ale nejefektivnější a nejsnáze použitelný (kvůli HW implementaci u většiny grafických karet) jsou různé variace na supersampling provedené pouze na těchto texturách.

Že bude specifickou formu TrAA podporovat i R520, jste se mohli dočíst ve článku z minulého týdne, kde také najdete návod na zprovoznění AdAA na starších DX9 Radeonech.

Podle současných výsledků se zdá, že je kvalitativní podání ATi a nVidie prakticky totožné, pouze s tou výjimkou, že kresby na alpha texturách jsou v podání G70 mírně tmavší, než na R520. Zatím se neobjevilo příliš mnoho testů, které by porovnávaly čistě výkonnostní propad při TrAA/AdAA v procentech, ale podle těch několika výsledků, které již k dispozici jsou, je to taktéž "plichta".

Temporal Anti-Aliasing, SuperAA

Efekt temporálního AA (TAA) jsem už několikrát vysvětloval, myslím, že postačí připomenutí. Na rozložení AA vzorků závisí, jak účinně bude FSAA vyhlazovat hrany o různých úhlech. Proč tedy nepoužít různé rozložení vzorků pro liché a sudé snímky obrazu? Pokud bude snímková frekvence (framerate) dostatečná, dojde k vizuálnímu splynutí sudých a lichých snímků a obraz bude vypadat, jak by byl použit FSAA o dvojnásobné kvalitě:

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz

Popsaný postup ATi nešikovně nazvala temporal anti-aliasing (dříve bylo toto spojení synonymem pro cine-efekt motion blur) a nabízí ji pro všechny DX9 Radeony. TAA je po HW stránce umožněn programovatelností pozic vzorků, které se tudíž mohou snímek po snímku měnit a zároveň nabízet rozložení plného EER, tedy maximální možnou kvalitu při použitém množství vzorků.

ATi oficiálně podporuje změnu rozložení vzorků mezi sudými a lichými snímky, pokud hra běží nad 60FPS (aby byl framerate dostatečný pro vizuální splynutí po sobě jdoucích snímků). Pokud někomu hranice 60FPS nevyhovuje, může ji manuálně změnit softwarem ATi Tray Tools, kde je taktéž možné nastavit změnu střídání ne ve dvou, ale i ve třech následujících snímcích (to už je ale spíše experimentální záležitost).

Podobnou úroveň vyhlazení nabízí i CrossFire režim SuperAA, se kterým je výsledek kvalitnější (plný počet vzorků je přítomen v každém snímku). SuperAA zmiňuju proto, že jde o jediný případ, kdy nelze kombinovat TAA s nějakým jiným režimem. TAA + SuperAA není možné, ostatní kombinace možné jsou (FSAA + TrAA + TAA, FSAA + SuperAA + TrAA apod.)

Výsledná kvalita

Pokud posoudíme kvalitu samotného FSAA (bez TAA, TrAA, AdAA, SuperAA, SLI-AA a AF), nebude nás čekat nic nového. Ta je v případě R520 stejná jako na R420 a v případě G70 odpovídá NV40:

grafický čip

výsledek

NV40/G70
2x
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
R420/R520
2x
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
NV40/G700
4x
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz

R420/R520
4x
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
NV40/G70
8x
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
R420/R5200
6x
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz

Při režimech 2x a 4x je situace podobná, oba konkurenti nabízejí stejný počet odstínů, rozložení vzorků v obou případech odpovídá maximálnímu EER, tedy maximální možné kvalitě. Liší se však světlost odstínů, ATi je má díky GC světlejší. Při použití režimu 8x a 6x se situace mění, nVidia nabízí 8 odstínů, ATi 6, ale podívejme se, jak se situace změní, pokud se podíváme na vertikální úhel:

NV40/G70
2x
R420/R520
2x
NV40/G70
4x
R420/R520
4x
NV40/G70
8x
R420/R520
6x
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz
Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz

Pro režimy 2x a 4x se nic nemění, ale situace se obrací při 6x a 8x. nVidia realizuje režim 8x přes kombinaci 2x ordered-grid supersampling a 4x rotated-grid multisampling, což vede k tomu, že se vizuální vyhlazení horizontálních úhlů prakticky neliší od režimu 4x, stručně řečeno, EER je pro režim 8x poloviční (8x4=32). ATi používá programovatelný multisampling, což jí umožnilo zobrazit stejné množství odstínů, jako v předešlé situaci. EER je tedy opět maximální (6x6=36)..

Režim ATi 6x nabízí rovnoměrnější výsledky ve všech úhlech; režim nVidia 8x nabízí vyšší kvalitu na horizontálních liniích (8x), ale poloviční na těch vertikálních (4x).

FSAA a HDR

R520 je prvním čipem, který podporuje MSAA v kombinaci s HDR. Toho předchozí čipy (R420 a G70) schopny nebyly - jde tedy o změnu designu ROPs jednotek. Dosud bylo možné při HDR používat buďto supersampling, což ale mělo za následek extrémní propad výkonu (záleží na situaci, ale cca kolem 90%), nebo specifický shader AA, jehož kvalita je ale oproti běžně používaným režimům nižší a navíc ubírá výkon pixel shaderům.

Zde si neodpustím připomenout červencový rozhovor serveru bit-tech s Davidem Kirkem z nVidie, podle jehož slov by implementace HDR + FSAA byla velmi obtížná a potřebovala by 2GB grafické paměti. Dále řekl, že hardware s podporou FSAA při HDR není záležitost blízké budoucnosti. Tato fakta nebudu dále komentovat, každý si může udělat vlastní závěr.

FarCry - HDR+FSAA, ilustrační obrázek- zdroj: Beyond 3D -
i Zdroj: PCTuning.cz
FarCry - HDR+FSAA, ilustrační obrázek- zdroj: Beyond 3D -

Co se týká podpory HDR+FSAA na R520, bude v blízké době k dispozici patch pro FarCry, který použití umožní, přičemž nově vydané hry budou tuto možnost podporovat standardně.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama