radeon-x800gt-vs-geforce-6600gt-tvrdy-souboj-ve-stredni-tride
Hardware Článek Radeon X800GT vs. GeForce 6600GT - tvrdý souboj ve střední třídě

Radeon X800GT vs. GeForce 6600GT - tvrdý souboj ve střední třídě | Kapitola 2

Štefek Petr

Štefek Petr

12. 9. 2005 01:00 74

Seznam kapitol

1. Radeon X800GT - starý známý v novém kabátě 2. Architektura použitých čipů 3. Specifikace a srovnání obou soupeřů 4. Vizuální kvalita - vyhlazování a filtrovaní 5. Průběhy FPS obou soupeřů 6. Sestava a syntetické testy
7. Battlefield 2 8. Doom 3 9. FarCry 10. Unreal Tournament 2004 11. Half-Life 2 12. Splinter Cell : Chaos Theory a závěr

GeForce 6600GT je už nějaký ten měsíc naprostým a dosud neporazitelným králem mainstreamových karet. Dnes byla však GeForce 6600GT vyzvána na první pohled nenápadným nově příchozím, který si říká Radeon X800GT. Jak si poradí nový vyzyvatel s veteránem mainstremového trhu grafických karet se zatím můžeme jen dohadovat, ale předem upozorňuji, že dnes si projdou obě karty opravdu těžkou zkouškou.

Reklama

Vertex Pipelines R423, R430 a R480

Radeon X800GT vs. GeForce 6600GT - tvrdý souboj ve střední třídě
i Zdroj: PCTuning.cz

Každý ze 6 Vertex Shaderů obsahuje skalární ALU a vektorovou ALU, které jsou napojeny na Flow Control jednotku, která má na starosti řízení těchto dvou ALU a umožňuje větvení, smyčky a vytváření sub-výpočtů. Vertex Shadery R4x0 pracují plně s 32-bit Floating Point přesností.

Vertex Shadery zpracovávají údaje o geometrii scény a pracují typicky se čtyřmi 32-bitovými hodnotami pro každý vertex, který zahrnují 3 údaje o poloze v prostoru (x,y,z) a 1 hodnotu o perspektivě (w). Když jsou tyto výpočty hotovy, tak se přistoupí k odstranění neviditelných částí (v tomto případě trojúhelníků z dalších výpočtů) scény, což má na svědomí Backface Culling engine.

Po té následuje Clipping, který odstraní částečně viditelné části scény (trojúhelníky) pomocí ořezávání a testovaní v  pomocném obdélníku, kde počítá s jednotlivými vektory a jejich poloze vůči tomuto teoretickému čtyřúhelníku.

Následuje počítaní perspektivy přes Perspective Divide jednotku, kde se ze získaných hodnot w (Vertex Shadery), které tak dají základ celkovému dojmu prostorovosti scény. Konečně přijde ke slovu Viewport Transport jednotka, která získané data transformuje do právě používaného rozlišení aplikace. Jakmile se vertex data dostanou do Setup Engine, tak jsou jednotlivým polygonům přiřazeny parametry jako jsou souřadnice textur, barev a Z.

Pixel Pipelines R423, R430 a R480

Radeon X800GT vs. GeForce 6600GT - tvrdý souboj ve střední třídě
i Zdroj: PCTuning.cz

Na obrázku vidíme jednu čtveřici pipelines (z 16) a každá z nich má svou vlastní Hyper Z HD jednotku, což narozdíl od Radeonu 9800XT/Pro umožňuje použití Hierarchical Z-Buffer i v rozlišeních nad 1600x1200, což zatím nebylo možné díky omezené kapacitě bufferu. Hierarchical Z-Buffer dokáže zpracovat dvě hodnoty Z a Stencil v jednom cyklu na jediný pixel.

Například Radeon 9600XT se čtyřmi pipelines měl při zapnutí FSAA maximum na 1280x1024 (pak následoval velký propad ve výkonu), což bylo pravděpodobně způsobeno omezeno kapacitou Z-Bufferu kolem 1.3 mega pixelů. Čipy R4xx mají kapacitu  Hierarchical Z-Bufferu kolem 4 miliónů pixelů, což už umožňuje i rozlišeni 2048x1536.

Pokud je kapacita Hierarchical Z-Bufferu překročena, tak se automaticky nevypne, ale data přes tento limit automaticky vyřazena (až 256 pixelů) ze zpracování a vrací se zpět k prvotnímu Z-testu (Hierarchical Early Z Test) , ale většina scény je tak zachycena Hierarchical Z-Bufferem, což je opět rozdíl oproti sérii Radeonů 9x00, kde se buffer deaktivoval.

Radeon X800GT vs. GeForce 6600GT - tvrdý souboj ve střední třídě
i Zdroj: PCTuning.cz

Na obrázku lze vidět detail jediné Pixel Shader jednotky, která se skládá z pěti samostatných ALU. Tyto jednotky mají k dispozici 64 registrů (32 konstantních a 32 dočasných) a určitý počet registrů pro práci s nasvětlováním polygonů. ATi zvolila přesně podle specifikací DirectX 9 přesnost Pixel Shaderových jednotek na 24-bitů, což je občas výhoda oproti nVidii, která dokáže pracovat jen s 16-bitovou nebo 32-bitovou přesností (Half-Life 2).

Samotný limit v počtu instrukcí pro všechna ALU je stanoven na 512, což je přesně na hranici specifikace Pixel Shader 2.0b a Pixel Shader 3.0. Dále následuje F-buffer, který známe už od čipu R350 (R9800Pro), který byl jinak shodný se starším R300 (R9700Pro) a umožňuje teoreticky zpracovávat nekonečný počet instrukcí, který je jinak pro Pixel Shader 2.0 omezenen na 96 instrukcí.

Dále následuje Pixel Output, což není nic jiného než staré známé ROP jednotky pro vykreslení pixelů. Každá ROP R4x0 je schopna zpracovat 1 barevnou hodnotu a 1 Z/Stencil hodnotu. Bohužel u R4x0 nejsou zapojeny jednotky barvy a Z/Stencil zapojeny paralelně, a tak nemohou být obě jednotky případně použity k Z/Stencil operacím jako u NV4x.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama