Hlavní stránka Hardware Grafické karty Asus Radeon HD 5870 Matrix — ultimátní predátor
Asus Radeon HD 5870 Matrix — ultimátní predátor
autor: Mirek Kočí , publikováno 11.5.2010
Asus Radeon HD 5870 Matrix — ultimátní predátor

Novinka ze známé série Asus ROG s označením Matrix přináší opravdu vyladěný Radeon HD 5870 s nereferenčním designem, hybridním chladičem, pokročilými možnostmi ladění, vytříbenými komponenty a navíc využívá nestandardního napájení pomocí dvojice 8pinových konektorů. Podařilo se inženýrům Asusu navrhnout ultimátní kartu?


Za technický rozbor moc děkuji Michalu Krejčíkovi.

Srdcem grafické karty ASUS HD 5870 Matrix je čip s kódovým jménem Cypress z rodiny Evergreen. Hned na úvod je nutné poznamenat, že AMD u DX11 generace čipů nepoužívá číselné označení, dost často používaný termín RV870 není oficiálním názvem.

Jádro Cypress se dá přibližně popsat jako zdvojnásobení počtu téměř všech jednotek oproti jádru RV770/790 předešlé generace a doplnění plné podpory DX11. Čip je vyráběn u TSMC nejmodernějším 40nm technologickým procesem. Díky lepšímu výrobnímu procesu (40nm oproti 55nm) je plocha čipu jen o čtvrtinu větší, ačkoliv počet tranzistorů je (i díky DX11) více než dvojnásobný – RV790 má 0,96 mld. tranzistorů, Cypress 2,15 mld.

Na následujícím obrázku je blokové schéma čipu Cypress:

Asus Radeon HD 5870 Matrix — ultimátní predátor

Krátkou exkurzi čipem začneme tak, jak se zpracovávají data při vykreslování snímků. Nás zajímá především rozdíl od předchozí generace a co je zde navíc kvůli DX11.

Asus Radeon HD 5870 Matrix — ultimátní predátor

Oproti RV770/790 je zde upravený teselátor, AMD uvádí, že se jedná již o 6. generaci. U teselátoru se krátce zdržíme, je to novinka v DX11. Skládá se ze tří částí: hull a domain shaderů a fixní (pouze parametry konfigurovatelné) jednotky vlastního teselátoru. Ten má za úkol základní plochy - pláty, ze kterých je složen 3D model, rozdělit na veliký počet trojúhelníků. Tyto trojúhelníky vyhladí 3D model tak, aby nebyl „hranatý“. Aby byl výsledný model takový, jak si ho představují vývojáři hry, musí být trojúhelníky generovány podle určitých pravidel.

Výsledné zaoblení modelu (vyklenutí, vydutí) určují kontrolní body, které připravuje vertex shader buď matematickým výpočtem, nebo třeba pomocí výškové mapy (displacement map). Kontrolní body a další parametry plátů před vlastní teselací se dají ovlivnit pomocí výpočtů hull shaderu. Vrcholy trojúhelníků generované teselátorem se transformují pomocí domain shaderu. Jeho funkčnost je v podstatě shodná s geometry shaderem, v DX11 jsou tyto shadery odděleny z důvodů větší flexibility při programování.

Trojrozměrný geometrický model je pro další zpracování nutné převést do roviny zobrazení. K tomu slouží rasterizer. Cypress má oproti RV770/790 dva rasterizery, což způsobilo těsně před představením jistý rozruch, protože se na první pohled zdálo, že je konečně prolomena do té doby platná hranice – generování jednoho trojúhelníku za takt. Brzy se ale zjistilo, že Cypress má sice dva rasterizery, ale je schopen dodat k dalším výpočtům maximálně jeden trojúhelník za takt – stejně jako předešlá generace.

K čemu tedy jsou dva rasterizery? Je to k zvýšení efektivity při dalším zpracování scény pomocí pixel shaderů. Trojúhelníky je totiž možné před rasterizací ukládat do zásobníku (bufferu), z kterého si je oba rasterizery berou, a tak je možné, aby rasterizery třeba pracovaly oba společně na jednom větším trojúhelníku nebo na dvou různých menších. Během rasterizace se provádí transformace trojúhelníků do dvourozměrné plochy obrazovky složené z bodů – pixelů (mají souřadnice X a Y), kterým přiřazuje interpolované informace – o barvě a hloubce (souřadnice Z). Zároveň se získávají i souřadnice pro nanášení textur. Pixely a jejich informace se zpracovávají při vlastním vykreslení scény pomocí pixel shaderů.

Všechny zmíněné shadery jsou vlastně programy, jejichž výpočet provádějí stream procesory. Programů, příp. vláken, běží mnoho najednou, mezi jednotlivé skupiny stream procesorů je rozděluje dispatch procesor. Cypress má v plné konfiguraci (HD5870) 1600 stream procesorů organizovaných do dvaceti SIMD bloků. Vždy 5 stream procesorů tvoří thread procesor, jak je znázorněno na následujícím obrázku.

Asus Radeon HD 5870 Matrix — ultimátní predátor

Čtyři z těchto pěti stream procesorů zvládnou jednu operaci MAD (násobení a sčítání) s FP32 (32bitové číslo s plovoucí desetinou čárkou, též SP) za jeden takt, pátá jednotka, která je trochu „tlustší“, navíc umí i speciální funkce (např. SIN, COS, EXP, ...). V každém thread procesoru je ještě jednotka větvení (branch unit) a registry, které obsahují data pro stream procesory. Těch je celkem 1024 po 128 bitech a jsou organizovány v matici 4 x 256. Oproti předchozí generaci jsou stream procesory drobně vylepšeny, jedná se především o instrukce pro DX11 a o možnost zpracování operací násobení a závislého sčítání v jednom taktu.

Dalším drobným vylepšením je instrukce SAD (sčítání absolutních diferencí), která je dobře použitelná při zpracování videa (AMD slibuje až dvojnásobné urychlení při enkódování videa) je však přístupná jen přes OpenCL. Z popisu na obrázku je patrné, že stream procesory jsou schopny základních operací s dvojnásobnou přesností (64 bitů FP, jinak též DP). V tomto případě se „tenké“ stream procesory spojí do párů, kdy jeden pár počítá nižší a druhý vyšší bity. „Tlustá“ jednotka nemá s čím se spojit, proto je celkový teoretický výkon ve FLOPs pro DP jednou pětinou teoretického výkonu v SP.

Ke každému SIMD bloku je přiřazen texturovací blok. Ten se skládá ze 4 texturovacích (adresovacích) procesorů, 4 filtračních jednotek a 16 samplerů. Cypress tedy obsahuje celkem 80 texturovacích procesorů, což je dvakrát tolik než RV790. Texturovací jednotky jsou upraveny, aby vyhověly požadavkům DX11 (větší textury, formáty BC6 a 7) a navíc obsahují nový algoritmus pro anizotropní filtrování, které je téměř nezávislé na úhlu natočení v případě, kdy nejsou použity optimalizace.

Cypress má též dvojnásobný počet ROP (vykreslovací výstup) jednotek (AMD je nazývá RBE – render back end) než RV770/790. Jsou organizovány do 8 bloků po 4 jednotkách. Základní funkcionalita je stejná, rychlost v pixelech na takt je dvojnásobná jen díky zdvojnásobení počtu bloků. Oproti starší generaci jsou zde drobná vylepšení (obrázek), z nich nejvíce zajímavá je tato novinka: plně HW podpora supersamplingu (SSAA) při vyhlazování. Tato metoda vyhlazování je mnohem náročnější na výkon, než multisampling (MSAA), protože SSAA vyhlazuje všechny body obrazu – nejenom hrany. SSAA tedy odstraní i zubatost stínů a textur.

Asus Radeon HD 5870 Matrix — ultimátní predátor

Vždy dva bloky jednotek ROP jsou pevně svázány s jedním 64bitovým řadičem paměti. Cypress má tak stejně širokou paměťovou sběrnici jako RV770/790 – 256 bitů. Oproti starší generaci byl vylepšen systém cache a dalších pamětí na čipu - jak po stránce velikosti, tak po stránce rychlosti. Byly též použity rychlejší GDDR5 paměti, takže šířka paměťové sběrnice by rozhodně neměla být limitujícím faktorem výkonu ve hrách.

Z blokového schématu čipu Cypress je možné vyčíst i to, že čip obsahuje celkem 6 výstupů pro zobrazení. Vícemonitorové zobrazení má pěkný obchodní název Eyefinity. Dále čip obsahuje i videoprocesor ve verzi UVD2.2, tedy shodný s čipy RV710/730/740 s plnou HW podporou pro dekódování formátů H264, VC-1 a MPEG2.

ASUS HD 5870 Matrix v systému

 

Asus Radeon HD 5870 Matrix — ultimátní predátor

Asus Radeon HD 5870 Matrix — ultimátní predátor

Pro zobrazení veškerých informací testované karty jsem použil nástroj GPU-Z. Frekvence grafického akcelerátoru jsou navýšené z výroby, a tedy vyšší než je obvyklé u referenčního Radeonu. Druhý obrázek ukazuje frekvence karty v klidu. Otáčky ventilátorů běží na 30 procent, následuje specifikace karet.

Specifikace karty

Asus Radeon HD 5870 Matrix — ultimátní predátor

Navýšení frekvencí od výrobce není vůbec špatné. Jádro běží v profilu „Gaming“ na rovných 900 MHz. Při základním nastavení je jeho takt krapet nižší - 894 MHz. Základní verzi dnes pořídíte za něco málo přes 9000 Kč. Námi testovaná karta je mnohem dražší, doporučená cena výrobcem je 11 500 Kč včetně DPH. Předpokládám, že výrobce časem trochu „poleví“ a řešení bude stát okolo 11 000 Kč.



 
Komentáře naleznete na konci poslední kapitoly.
113 čtenářů navrhlo autorovi prémii: 54.1Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.