Radeon X1900XTX 512MB - nový král na poli grafických karet?
autor: Štefek Petr , publikováno 24.1.2006
Radeon X1900XTX 512MB - nový král na poli grafických karet?

Dnes si představíme zbrusu novou grafickou kartu společnosti ATi Radeon X1900XTX 512MB, která má ambice na post té nejvýkonnější herní grafické karty pro PC. Dosud na na pomyslném trůnu grafických karet pobývala GeForce 7800GTX 512MB, která svým obrovským surovým výkonem zašlapala libovolnou konkurenční kartu do země.


Vertex shadery

Jádro R580 má v sobě stejně jako R520 integrováno 8 vertex shaderů, které se starají o vytváření geometrie scény. Pro zcela novou architekturu musí být podpora Shader Modelu 3.0 samozřejmostí, a proto i R580 musí splňovat tento standard, což znamená podporu geometry instacingu a vertex texturingu. Geometry instancing v principu využívá možnosti nepočítat stejné geometrické modely stále dokola pro stejné modely a používá stále jeden a tentýž výpočet.

Radeon X1900XTX 512MB - nový král na poli grafických karet?
Detail vertex shaderu R580

Každý z 8 vertex shaderů zvládne v jednom cyklu dvě instrukce, což znamená, že jedna jednotka může zpracovat 1skalární a 1 vektorovou instrukci v jednom taktu. Dále jsou vertex shadery schopny zpracovávat jako obvykle až 1024 instrukcí, což není díky dynamic flow control (standard SM 3.0) číslo konečné.

Pixel Shadery

Samotné jádro R580 se liší od svého předchůdce R520 jen v detailech, ale základ zůstává stejný. Čip v sobě integruje neuvěřitelných 384 miliónů tranzistorů, což je o 64 miliónů více než v předchozím čipu R520. O nárůst plochy se postarala část pixel shaderů, kde došlo k navýšení počtu tzv."quad pixel shader core", kde každé z nich integruje 4 relativně samostatné pixel shadery. V minulé generaci R520 jsme mohli napočítat 16 pixel shaderů a v dnešním čipu R580 jich máme rovnou 48, což zaručuje opravdu obrovské navýšení výkonu v této oblasti. Teoreticky je výkon pixel shaderů trojnásobný a plocha čipu vzrostla jen o cca 20 procent.

Radeon X1900XTX 512MB - nový král na poli grafických karet?
Schéma pixel shaderové části R520

Vývojem prošel rovněž Dispacht Processor, který nyní obsluhuje trojnásobné množství pixel shaderů. Jeho funkce je poměrně složitá a stará se efektivitu zpracování pixel shaderového kódu. Ultra-Threading Dispatch Processor se stará o přerozdělování vláken (threadů) v pixel shaderovém kódu, což znamená přidělování čekajících threadů mezi všech 12 "quad-cores" velmi efektivním způsobem, protože ač se to nezdá, tak velká část výpočetního času je v případě tradičních architektur ztracená právě zahálením výpočetních jednotek. Dispatch procesor rozděluje data na thready o velikosti 4x4 pixely, aby je bylo dále možné zpracovat v 12 tzv. "quadech" po 4 pixelových jednotkách.

Poznámka: Jádro RV530 používané v Radeonech X1600 je ve své podstatě 1/4 jádra R580, představuje tak jakýsi low-end další generace, kde tato řada podle dalších plánů ATi bude směřovat.

Radeon X1900XTX 512MB - nový král na poli grafických karet?
Schéma pixel shaderové části R580

Každý ze 12 "quad-core" je schopen v jednom cyklu zpracovat shader pro blok o velikosti 2x2 pixely, jelikož každé z těchto 12 víceméně samostatných jader má v sobě 4 jednotky pro práci s pixely. Dispatch procesor je schopen zaznamenat nečinnost jednotlivých jednotek pro zpracovaní pixelů a hned jim přiřadit novou úlohu. Díky tomu je možné, aby každé z 12 pixel shaderových jader zpracovávalo data nezávisle na dalších. Procesor je rovněž schopen pozastavit zpracování threadu, pokud nemá všechny potřebná data a poslat ho ke zpracovaní teprve po kompletizaci dat. R580 tak může v jednom cyklu zpracovat až 512 threadů.

Radeon X1900XTX 512MB - nový král na poli grafických karet?
Samostatný pixel shader čipů R520 a R580

Struktura samotného pixel shaderu zůstává nezměněna a každý ze 4 přítomných v jednom samostatném "quad-core" (celkem jich je 12) má 5 samostatných aritmeticko logických jednotek a může tak zpracovat od 1 do 5 shaderových instrukcí v jediném taktu. Branch Execution Unit se stará redukování času potřebného k výpočtům při použití flow control alias dynamic branchingu, protože sama o sobě zvládne v jednom taktu vypočítat smyčku nebo subrutinu pixel shaderového kódu.



 
Komentáře naleznete na konci poslední kapitoly.
862 čtenářů navrhlo autorovi prémii: 414.2Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.