Polopatě: GeForce G8600GTS /GT a co od nich očekávat | Kapitola 2
Seznam kapitol
Dnešní článek je trochu netypickým pohledem na právě uváděnou řadu grafických karet GeForce 8600GTS a 8600GT. Tentokrát se podíváme nejenom na výkon těchto karet (okrajově), ale také na souvislosti vedoucí ke vzniku této řady. V poslední části provedeme výkonově-cenovou analýzu dnes dostupných modelů střední třídy (od základních typů až po "téměř" Hi-end).
Cílem vývoje čipů G84 bylo zachovat (případně mírně vylepšit) funkční vlastnosti G80, zejména kompatibilitu s DX10, avšak zásadně zmenšit plochu čipu a tím podstatně snížit náklady na jeho výrobu. Zatímco ekonomové snižovali plochu čipu (snižováním počtu interních jednotek), inženýři tu a tam čip vylepšovali - nové texturovací jednotky G84 dokáží np. počítat s osmi adresami textur a provést osm filtrovacích operací v každém taktu (u G80 4 + 8).
Kompromisy to jsou....
Výsledná podoba čipu G84 je ve výsledku spíše vítězstvím ekonomů - čip G84 má, ve srovnání s G80 prakticky třetinovou velikost; z 700M tranzistorů jich v novém návrhu zůstalo 290M a paměťová sběrnice se zúžila na 128-mi bitovou.
NVIDIA G84 | |
---|---|
polovodičový proces | 80nm @ TSMC, 289M tranzistorů |
velikost jádra | 169mm² (13mm x 13mm) |
typ čipu | Flipchip |
základní konfigurace pipeline | 16 / 8 / 64 Textures / Pixels / Z |
paměťová sběrnice | 128-bit (interně 2 x 64-bit) |
API kompatibilita | DX10.0 |
externí sběrnice | PCI Express x16 |
výstupní linky | 2 x dual-link TMDS w/HDCP, 2 x 400MHz RAMDACs, HDTV out |
G84 v kostce
GeForce 7600 GT | GeForce 8600 GTS | GeForce 8600 GT | Radeon X1650 XT | |
kódové označení čipu | G73 | G84 | G84 | RV560 |
počet tranzistorů | cca. 178 M. | cca. 289 M | cca. 289 M | cca. 330 M |
výrobní proces | 90 nm | 80 nm | 80 nm | 80 nm |
takt jádra | 560 MHz | 675MHz | 540 MHz | 575 MHz |
takt shaderů | 560 MHz | 1450 MHz | 1190 MHz | 575 MHz |
pixel pipelines | 12 | - | - | 8 |
shadery (konfigurace) | 24 (4D) | 32 SP (1D) | 32 SP (1D) | 24 (4D) |
FLOPs (MADD/ADD) | 107 GFLOPs | 139 GFLOPs | 114 GFLOPs | 166 GFLOPs |
jednotek ROP | 8 | 8 | 8 | 8 |
pixel fillrate | 4480 MPix/s | 5400 MPix/s | 4320 MPix/s | 4600 MPix/s |
jednotek TMU | 12 | 16 | 16 | 8 |
texel fillrate | 6720 MTex/s | 10800 MTex/s | 8640 MTex/s | 4600 MTex/s |
vertex shadery | 8 | unifik. shadery | unifik. shadery | 5 |
unifikované shadery (v hardware) | X | √ | √ | X |
pixelshader | PS 3.0 | SM 4 | SM 4 | PS 3.0 |
vertexshader | VS 3.0 | SM 4 | SM 4 | VS 3.0 |
geometryshader | X | √ | √ | X |
paměti | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 | 256 GDDR3 |
takt paměti | 700 MHz | 1000 MHz | 700 MHz | 675 MHz |
interface | 128 Bit | 128 Bit | 128 Bit | 128 Bit |
propustnost | 22400 MB/s | 32000 MB/s | 22400 MB/s | 21600 MB/s |
Funkční schéma G84
Grafické jádro G84 vychází z původního jádra G80. Stejně jako G80 podporuje tedy rozhraní DirectX Shader Model 4.0 a u základů leží unifikované (1D) stream procesory* (SP). Zatímco špičkové 8800GTX obsahuje 128 SP, ekonomické 8800GTS zase 96SP, v případě čipu G84 klesl tento počet na čtvrtinu, respektive na jednu třetinu jednotek (32 jednotek SP).
*SP jsou univerzální procesory, které mohou být využity v podstatě pro jakékoli účely. Kromě operací s pixely / vertexy a geometrií lze je využít k akceleraci fyziky, multimediálním výpočtům a GP-GPU aplikacím. Vzhledem ke své skalární architektuře jsou velice univerzální a pro podobné účely vhodné.
G84 obsahuje dva clustery (každá po 16 SP) z původních osmi SP clusterů G80. Takt SP clusterů je i v tomto případě vysoko nad frekvencí zbytku jádra (1450 vs 675MHz). Pokud se podíváme na jednotky ROP (Raster Operations Pipeline) pak můžeme konstatovat, že G84 má třetinovou propustnost čipu G80.
Výkon her DirectX 10 - je to "vo hvezdách"...
I když dnes nejsou k dispozici žádné hry napsané pro rozhraní DirectX 10, lze předpokládat, že výkon řady 8600 se nebude zdaleka blížit řadě 8800 GTX / GTS. Na druhou stranu Microsoft slibuje, že u plnohodnotných DX 10 titulů nastane rapidní pokles "výpočetní režie" která je spojená s řízením rozhraní DirectX 3D. To by mohlo znamenat, že ve srovnání se staršími akcelerátory mohou získat nové čipy nějaký ten bod navíc... (pokud budou psané jak pro DX10, tak pro starší DX9c).