srovnavaci-test-grafickych-karet-geforce-6600-pro-sbernici-pcie
Hardware Článek Srovnávací test grafických karet GeForce 6600 pro sběrnici PCIe

Srovnávací test grafických karet GeForce 6600 pro sběrnici PCIe

Štefek Petr

Štefek Petr

26. 5. 2005 00:00 42

Seznam kapitol

1. NV43 - od GeForceFX 5800 k GeForce 6600 2. Metody přetaktování a celkového hodnocení 3. ASUS Extreme N6600Top 4. ASUS Extreme N6600 TD 128MB 5. Gigabyte GV-NX66128DP Turbo 128MB 6. Inno3D GeForce 6600 256MB
7. MSI NX6600GT-TD128E 128MB 8. MSI NX6600-VTD128E Diamond 128MB 9. MSI NX6600-VTD256EH 256MB 10. MSI NX6600-TD128E 128MB 11. Závěr

Tento test přinese 8 karet s čipy NV43 (7x GF6600 a 1x GF6600GT pro srovnání), což není nic jiného, než srdce série GeForce 6600, která nemá mezi mainstreamem grafických karet absolutně žádnou konkurenci. Podíváme se jak na vybavení, tak i možnosti přetaktování a jako bonus se dočtete, jak si karty vedou s oblíbenými chladiči Arctic Cooling Silencerem 6 a Zalmanem VF-700, jež jsou většinou o poznání tišší a vyznačují se velmi solidní účinností, kterou firemní chladiče dodávané ke kartám odkáží do patřičných mezí.

Reklama
Srovnávací test grafických karet GeForce 6600 pro sběrnici PCIe
i Zdroj: PCTuning.cz

Společnost nVidia má v sérii GeForce 6600 konečně něco, co po dlouhé době drtí konkurenci ve všech směrech, řeč je hlavně o ceně a výkonu, který je podoben  starší generaci high-endu v podobě Radeonu 9800XT nebo GeForce 5950Ultra. V novějších hrách má jednoznačně navrch nově příchozí čip z dílen nVidie, což poznáte hlavně ve hrách typu Doom 3 nebo FarCry.

NV43  má 8 pixel pipelines a 3 vertex pipelines, což při vysokém taktu kolem 500MHz bez problému přesvědčí jak rychlostí pixel shaderových operací, tak i výsledným fill-rate, který má rovněž nezanedbatelný vliv. GeForce 6600 má pouze 128-bitový paměťový systém, což jí ale nebrání v použití FSAA v nižších rozlišeních.

Nvidia se tedy poučila z fiaska čipu NV30, který ač měl opravdu velmi flexibilní architekturu (VLIW - Very Long Instruction Word - namísto několika instrukcí se použije jediné velmi dlouhé slovo, což ve výsledku občas degraduje výkon) nedosahoval díky nutnosti použití speciálního kompilátoru pro zpracování zdrojového kódu takových výsledků jako například čipy z rodiny R3xx, které měly svou architekturu stanovenou pevně.

Srovnávací test grafických karet GeForce 6600 pro sběrnici PCIe
i Zdroj: PCTuning.cz

Jinými slovy programátoři měli díky zcela odlišným architekturám fůru práce a u čipu NV30 se na to nabalovaly problémy s ne zrovna bezchybným kompilátorem nVidie. Výhoda ovšem spočívala v tom, že se každé výpočetní jednotce mohla přiřadit libovolná funkce, takže pro aplikaci se mohl čip NV30 tvářit jako architektura 8x1, 4x2 či 2x4 (v extrémních případech 16x0 nebo 1x8)

NV43 je založena na tradiční architektuře, která používá dělené jednotky pro pixel shadery a vertex shadery. Tato architektura se nazývá MIMD (Multiple Instruction Multiple Data) a je dnes používaná jak u čipů nVidia, tak i její konkurence ATi, která ji používá také pro všechny své čipy. Počet tranzistorů je díky implementaci Shader Modelu 3.0 značný (147 mil.), ale karta se tak nemusí bát o svou budoucnost ani v novějších hrách. Otázkou ovšem zůstává jestli postačí její surový výkon alespoň na nižší rozlišení, protože nové grafické enginy budou potřebovat opravdu výkonné karty.

NV43 -Vertex Pipeline

Než se data dostanou na výstup akcelerátoru, tak musí projít třemi hlavními procesy, což znamená vypočet geometrie, kde vertex pipelines vytvoří jednotlivé vertexy. Po té následuje vytvoření trojúhelníků (triangle setup), které se rozdělí do pixelových čtveřic. Dále se už konečně zapojí pixel pipelines s texturovacími jednotkami a konečnou scénu vykreslí ROP jednotky. Každá jedná samostatná Vertex pipeline má jednu skalární a jednu vektorovou aritmeticko-logickou jednotku, které mohou udělat  5 operací v jediném cyklu.

Srovnávací test grafických karet GeForce 6600 pro sběrnici PCIe
i Zdroj: PCTuning.cz


- Zdroj: nVidia -

NV43 má pouze 3 vertex pipelines, což je poloviční počet high-endového čipu NV40 a stejně jako u něj jsou vertex shadery schopny vykonávat operace těch dalších. Díky tomu, že tyto vertex shadery splňují specifikace Vertex Shader 3.0, tak se můžeme setkat i z Geometry Instancingem, který by měl ulevit vertex shaderům při vypočítávání geometrie u stejných geometrických modelů. V praxi to zatím vypadá tak, že Geometry Instancing výkon spíše sníží (2-3%), což jsem si pro zajímavost otestoval ve FarCry. Je pravděpodobné, že s příchodem náročnějších enginů dojde k uplatnění i tato technologie. V budoucnu bude pro akcelerátory limitujícím faktorem spíše výkon pixel shaderů a celkový fill-rate.

NV43 - Pixel Pipelines

Podle schématu je jasně vidět, že NV43 má pouze 8 pixel pipelines a NV40 jich má rovnou 16. Teoreticky je na tom NV43 opravdu špatně díky 75% snížení (při bilineárním filtrování a single-texturingu) pixel fill-rate v jednom cyklu (4 ROP´s vs. 16 ROP´s), ale prakticky díky principu jakému se využívají ROP jednotky je pokles v praxi pouze třetinový (ovšem větší počet ROP jednotek najde využití při FSAA). Kdyby NV43 měla 8 ROP jednotek, tak by se zvýšil pouze teoretický výkon ve pixel fill-rate v jednom cyklu, ale praktický výkon v aplikacích by zůstal stejný (trilineární filtrování není single-pass).

Srovnávací test grafických karet GeForce 6600 pro sběrnici PCIe
i Zdroj: PCTuning.cz


- Zdroj: nVidia -

Pixel Pipelines jsou uspořádány do dvou čtveřic, což dává možnost deaktivovat jednu čtveřice (případně obě, ale jen za použití kladiva). Samozřejmě pokud vypneme jednu polovinu pipelines, tak deaktivujeme i jednu polovinu ROP jednotek, což můžeme vidět u série GeForce 6200, kde to ale opět díky principu na kterém pracují nepředstavuje problém.

Jak už bylo řečeno, tak nVidia sáhla u NV40 po architektuře, kde na jednu pipeline připadá jedna texturovací jednotka TMU, což je efektivnější v případě, kdy hra využívá single-texturingu, což se v dnešní době opravdu nevidí. V případě, že by architektura byla udělaná tak, že na jednu pipeline by připadaly texturovací jednotky dvě, bylo by u multitexturingu vše při starém, ale pokles výkonu bychom zaznamenali u single-texturingu, kde by druhá TMU v cyklu pouze zahálela. Tohle byla obecně známá teorie, která platí zdánlivě i o čipu NV43,  ale nyní se podívejme na jednu věc, která zpochybní celou zaběhnutou pravdu o architektuře 8x1.

 

Frekvence jádra

Single-texturing

Multi-texturing

Počet transformací

GeForce 6600GT

500 MHz

2000 Mpixel/s

4000 Mtexel/s

375 Miliónů

GeForce 5900

400 MHz

1600 Mpixel/s

3200 Mtexel/s

325 Miliónů

GeForce 6800GT

350 MHz

5600 Mpixel/s

5600 Mtexel/s

525 Miliónů

Radeon X800XT

500 MHz

8000 Mpixel/s

8000 Mtexel/s

750

Miliónů

Z tabulky je jasně vidět zástupce architektury s jednou texturovací jednotkou na pipeline, což jsou v tomto případě GeForce 6800GT as Radeon X800XT. Tyto karty mají logicky stejný teoretický výkon při obou režimech texturování. GeForce 5900 je zástupcem designu 4x2 s čipem NV35 a při použití single-texturingu se výkon rovná jedné polovině, což odpovídá pouze 4 aktivním pixel-pipelines se dvěma TMU na každé z nich. Stejná písnička je to ovšem také u GeForce 6600.

Bohužel v praktických testech se NV43 tváří občas jako 8x1 architektura a občas zase jako jasný případ 2 TMU na pipeline (rozdíl mezi double-texturingem a triple-texturingem ve výsledném fill-rate). Obecně je to lhostejné, protože valná většina her multi-texturing používá, a proto se není třeba bát.

NV43 - ROP - Render Output

Jak můžete vidět ze schématu NV43, tak je tento čip zdánlivě polovina NV40. Poloviční je však jen počet pixel pipelines a vertex pipelines, což není vůbec tragické. Bohužel oproti NV40 zůstala jediná čtveřice ROP (Raster Operation Unit) jednotek, což znamená, že v jednom cyklu může být zpracováno 8 pixelů, ale naneseny pouze 4 barvy (ROP).

Srovnávací test grafických karet GeForce 6600 pro sběrnici PCIe
i Zdroj: PCTuning.cz


- Zdroj: nVidia -

To ovšem neznamená zásadní nedostatek, neboť použijeme-li dnes obvyklého trilineárního filtrování, tak nám zpracování jedné textury bude trvat 2 cykly, a tak k ovlivnění výkonu polovičním počtem ROP jednotek nedojde. Situace při zapnutí anizotropního filteringu se pak ještě zlepší, protože v závislosti na stupni AF dojde znásobení cyklů potřebných ke zpracovaní, a tak ROP jednotky už jen zahálí.

Tedy jediná situace, kde můžeme pocítit snížení výkonu s NV43 díky polovičnímu počtu ROP jednotek nastane při sigle-texturingu s bilineárním filtrováním. Malá nevýhoda jedné čtveřice ROP je také při Z-fill a Stencil operacích, kde by v případě dvou čtveřic ROP měla NV43 vyšší výkon. Díky Fragment Crossbar (řadič) jsou všechny ROP jednotky využívány velmi efektivně a data jsou jim dynamicky přiřazovány dle potřeby.

 

Radeon X800

GeForce 6600

GeForce 6600GT

Radeon X700pro
VPUR430NV43

NV43

RV410
Výrobní proces0.11 ľm TSMC0.11 ľm TSMC

0.11 ľm TSMC

 

0.11 ľm TSMC

 

Technologie čipu256-bit256-bit256-bit256-bit
Počet transistorů167 milionů

147

milionů
147 milionů73 milionů
Paměťová sběrnice256-bit DDR
(I - III)

128

-bit DDR
(I - III)
128-bit DDR
(I - III)

128

-bit DDR
(I - III)
Paměť128-256 MB128-256 MB128 MB128-256 MB
Takt čipu

400

MHz

300

MHz
500 MHz425 MHz
Takt pamětí350 MHz
(700 DDR)
275 MHz
(550 DDR)

500

MHz
(1000 DDR)
430 MHz
(860 DDR)
Paměťová propustnost

22.4

GB/s
8.8 GB/s16. GB/s13.8 GB/s
Fill-rate (single-texturing)4800 Mpixel/s

2400 (1200)

Mpixel/s

4000

(2000)Mpixel/s
3400 Mpixel/s
Fill-rate (multi-texturing)

4800

Mtexel/s

2400

Mtexel/s

4000

Mtexel/s

3400

Mtexel/s
Vertex Shader

6

3

3

6

Počet Pixel Pipelines

12

8 (4)

8 (4)

8

Počet TMU/pipeline11 (2)1 (2)1
Vertex Shader verze2.0 3.03.0

2

.0
Pixel Shader verze2.0 3.03.0

2

.0
DirectX9.0b 9.0 c9.0 c9.0b
AntiAliasing2-4x RGMS
6x Sparse
2-4x RGMS
2x OGSS
2-4x RGMS
2x OGSS
2-4x RGMS
2x OGSS
AA specialityTemporal AA,
Centroid Sampling
kombinace SS+MSkombinace SS+MSkombinace SS+MS
Integrované RAMDACy2x 400MHz2x 400MHz2x 400MHz2x 400MHz
Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama