geforce-8800gtx-a-gts-v-testu
Hardware Článek GeForce 8800GTX a GTS v testu

GeForce 8800GTX a GTS v testu | Kapitola 5

Petr Štefek a Jiří Souček

Petr Štefek a Jiří Souček

8. 11. 2006 01:00 100

Seznam kapitol

1. Úvod 2. GeForce 8800GTX - bližší pohled 3. Unifikovaná architektura - historický vývoj 4. G80 - Shader core 5. Texturing engine (TMUs / TF) a anizotropní filtrace 6. ROPs, HDR a FSAA / CSAA 7. Galerie obrázků z dem a připravovaných her
8. 3DMark 06 9. Need For Speed: Carbon 10. F.E.A.R. 11. Serious Sam 2 12. Quake 4 13. Oblivion 14. Závěr

Tak zde máme konečně recenzi dvou zbrusu nových grafických karet z dílen nVidie. Prvním pánem na holení je nejvýkonnější GeForce 8800GTX a druhým je ekonomičtější GeForce 8800GTS. Pojďme se tedy podívat jak si obě stojí a hlavně na novou architekturu čipu G80.

Reklama

Největší šok, který mnoha odborníkům G80 přinesl, byl počet texturovacích jednotek. Těch nese G80 plných 64. Pokud jste se stále ještě divili, kde G80 bere těch bezmála 700 milionů tranzistorů, už nemusíte :-)

Nejsem sám, kdo vidí tuto hodnotu jako "overkill" - vzhledem k tomu, že šířka paměťové sběrnice i počet ROPs byly rozšířeny oproti minulé generaci o 50% a teoretický výkon shader core zhruba na dvojnásobek, tak mi připadá zvýšení počtu texturovacích jednotek na 64 mírně řečeno přehnané. Už kvůli tomu, že oddělením texturovací jednotky a doplněním texture-adress ALU došlo ke zvýšení efektivity práce s texturou až o nějakých 50% na jednu TMU. Na druhé straně je možné, že nVidia počítá s výraznějším prosazováním HDR, při kterém se texturovací jednotky, kterými G80 (podobně jako G7x), provádí FP filtraci textur, vcelku zatíží.

GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz

Na obrázku vidíte, že na každé čtyři SP připadají dvě texturovací jednotky (TF). Je jich tedy celkem 64 a běží na základní frekvenci čipu (575MHz). Obě jednotky ale nejsou identické: Primární disponuje několikrát zmíněnou vlastní jednotkou pro texture adressing (TA), zatímco sekundární ne. To znamená, že se čip chová trošku podobně, jako starší čipy, které nesly dvě texturovací jednotky na pixel pipeline. Je schopen pracovat s 64 pixely v taktu, ale při praktickém použití jich vykreslí 32. Jelikož texturing engine svým výkonem výrazně převyšuje výkon shader enginu, přináší to (v kombinaci se specifickými vlastnostmi těchto texturovacích jednotek) zajímavé výhody:

  • bilineární filtrace (samostatná) - bez ztráty výkonu (32 pixelů za takt)
  • trilineární filtrace (samostatná) - s minimální ztrátou výkonu
  • anizotropní filtrace 2x s bilineárním základem - bez ztráty výkonu (32 pixelů za takt)
  • filtrace FP16 - bez ztráty výkonu (5x rychlejší než na G70, 32 pixelů za takt)
  • FP16 anizotropní filtrace 2x - 16 pixelů za takt
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz

Toto schéma znázorňuje výhodu, kterou přináší integrace samostatné texture-adress ALU v kombinaci s oddělením texturovací jednotky od pixel shaderu. Shadery i texturing mohou jet nezávisle, zároveň a jeden proces nebrzdí druhý. Tím se ušetří velké množství času (výkonu), který může být dále využit.

Filtrace textur

V souvislosti s oddělením texturovacích jednotek si nVidia mohla dovolit implementovat kvalitnější formu anizotropní filtrace (AF) bez úhlových optimalizací*

* termín úhlově optimalizovaná AF je označení pro formu AF, která při nastavení např. AF 16x realizuje plnohodnotnou filtraci 16x pouze na texturách, které jsou zobrazeny pod určitým úhlem, zatímco textury zobrazené pod jiným úhlem jsou filtrovány v nižší kvalitě (obvykle AF 2x či 4x). K tomu vedou výrobce dva důvody - tím prvním je, že pro úhlově optimalizovanou filtraci dostačuje jednodušší texturovací jednotka (tzn. nižší počet tranzistorů v čipu) a druhým  je výkon - žádný grafický čip, který by neměl texturovací jednotku oddělenou od pixel pipeline, není schopen provozovat HQ-anizotropní filtraci s akceptovatelně nízkým propadem ve výkonu.

Také je důležité připomenout, že slovní spojení "AF bez úhlových optimalizací" není zcela přesné - jemné rozdíly mezi úhly zůstávají vždy, ale v praxi není na texturách rozdíl viditelný. Tyto drobné rozdíly jsou obvykle zanedbávány a filtrace, která je ve všech úhlech zhruba rovnoměrná (zobrazuje se zhruba jako "kolečko" v AF-testerech) bývá označována jako úhlově neoptimalizovaná. Naopak filtrace, která se v testovacích programech zobrazuje jako "hvězdička" bývá označována jako úhlově optimalizovaná.

GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz

úhlově optimalizovaná anizotropní filtrace
("hvěznička")

úhlově "neoptimalizovaná" anizotropní filtrace
("kolečko")

Ještě vysvětlím, o jakých úhlech tu celou dobu mluvíme (to si někteří čtenáři často vykládají špatně). Pokud byste v nějaké hře stáli v místnosti, můžeme např. podlahu považovat za úhel 0°, boční stěny, které jsou k podlaze kolmo, jako úhel 90°. V těchto "běžných"  úhlech podává i úhlově optimalizované AF maximální kvalitu. Kdyby ale některá stěna byla šikmá - např. v úhlu kolem 20° nebo 70°, nebyla by na ní provedena filtrace v plné kvalitě a její textura by byla méně ostrá.

Abyste rozuměli tomu, co AF-tester zobrazuje - zobrazený objekt je vlastně jakoby dlouhý tunel s kruhovým průřezem (vlastně "trubka"), do kterého se díváme - malé černé kolečko uprostřed je jeho konec. Takže okraje obrázku jsou jakoby bližší části a střed obrázku je vzdálenější část. Čím vzdálenější část tunelu, tím je použita textura o nižším rozlišení (= menší mip-mapa). A aby to bylo názorné, je vždy každá menší mip-mapa zobrazena jinou barvou. Textura o plném rozlišení není obarvena - to je vlastně ta černobílá část. Každá další barva (červená, zelená, modrá...) bližší středu obrázku (resp. konci tunelu) má vždy o stupeň nižší rozlišení. Pokud si porovnáme výše uvedené obrázky, vidíme, že úhlově optimalizovaná AF používá textury o nižším rozlišení v některých úhlech už pro poměrně blízké objekty, zatímco úhlově neoptimalizované AF snižuje rozlišení textur až pro velmi vzdálené objekty, téměř nezávisle na úhlu.

Společnost nVidia v historii implementovala různé formy anizotropní fitlrace: První generace GeForce (NV1x - GeForce 256 / 2) podporovala úhlově neoptimalizované AF 2x s trilineárním základem. GeForce 3/4 (NV2x) přinesla tentýž koncept, ale maximální úroveň filtrace byla zvýšena až na 8x. GeForce FX (NV3x) nabízela velice podobný režim, jako NV2x, ale propady výkonu byly výrazně nižší. Bohužel, kvůli lepší konkurenceschopnosti byla kvalita degradována novějšími verzemi ovladačů, výsledkem čehož byly méně ostré textury. GeForce 6/7 (NV4x) poprvé u nVidie přinesla úhlové optimalizace (s vysvětlením, že neoptimalizovanou filtraci na předchozích čipech uživatelé stejně neocenili) a dále optimalizace v ovladačích pro dosažení vyššího výkonu (např. undersampling). V současné době se můžeme domnívat, že GeForce 8, nebude díky svojí architektuře potřebovat pro konkurenceschopný výkon žádné optimalizace snižující kvalitu textur, takže kvalitou obrazu překoná všechny předchozí generace grafických karet.

 

R100 (Radeon 7x00)

 NV1x (GeForce 256/2/4MX)
 Režimy AF16x2x
 Základní filtracebilineárnítrilineární (default)
 Úhlové optimalizaceano (velmi)ne
 Optimalizace ovladačenene
 

R200 (R8500-9250)

 NV2x (GeForce3/4Ti)
 Režimy AF16x8x
 Základní filtracebilineárnítrilineární (default)
 Úhlové optimalizaceano (velmi)ne
 Optimalizace ovladačenene
 

R300 (R9500-9800)

 NV30 (GeForce FX)
 Režimy AF16x8x
 Základní filtracetrilineární / brilineární *trilineární / brilineární
 Úhlové optimalizaceanone
 Optimalizace ovladačeano (brilineární)ano (mip-mapy, brilinerání)
 

R4x0 (Radeon X)

 NV40 (GeForce 6)
 Režimy AF16x16x
 Základní filtracetrilineární / brilineární *trilineární / brilineární **
 Úhlové optimalizaceanoano
 Optimalizace ovladačeano (brilineární)ano (brilineární, bilineární, undersampling)
 

R5x0 (Radeon X1)

 G7x (GeForce 7)
 Režimy AF16x16x
 Základní filtracevolitelnětrilineární / brilineární **
 Úhlové optimalizacevolitelněano
 Optimalizace ovladačevolitelněano (brilineární, bilineární, undersampling)
 

R600

 NV40 (GeForce 6)
 Režimy AF ?16x
 Základní filtrace ?volitelně
 Úhlové optimalizace ?ne (volitelně?) ***
 Optimalizace ovladače ?volitelně

* volitelně i bilineární, jinak určeno ovladačem
** liší se v závislosti na použitém ovladači
*** podle neoficiálních informací podporuje G80 obojí

Teď se podíváme na ukázky a srovnání se současnou generací karet:

 AF 16x (driver default)AF 16x (max. kvalita)
 G71
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz
 R580
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz
 G80
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz
GeForce 8800GTX a GTS v testu
i Zdroj: PCTuning.cz

GeForce 8 používá v režimu "Quality" brilineární základ a v režimu "High Quality" trilineární.

Pokud si porovnáte režim maximální kvality ("HQ-AF") Radeonu a nové GeForce, můžete si všimnout, že úhlové optimalizace v úhlu kolem 45° (diagonály) jsou na G80 ještě mírně nižší než u R580 a je tedy o něco blíž ideální situaci (=kolečko).

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama