Hlavní stránka Hardware Grafické karty R420 a NV40 - další generace VPU
R420 a NV40 - další generace VPU
autor: Souček Jiří , publikováno 14.5.2004
R420 a NV40 - další generace VPU
Poté, co v roce 2002 společnost ATi Technologies vydala Radeon 9700 PRO a stvrdila tak svoji pozici v čele grafického průmyslu, se objevily první zmínky a náznaky dalšího vizuálního procesoru. O několik měsíců později, po vydání kontroverzní nVidia GeForce 5800 Ultra, se začaly rýsovat poněkud přesnější informace. Stejně jako o projektu R400, jak byl tehdy nazýván, přišly i první zmínky o konkurující NV40. Oba procesory se zdály být spíše přirozeným evolučním krokem, než nějakým skokem. To potvrzovaly i předběžné a neoficiální specifikace, které nechávaly většinu uživatelů chladnými. Co taky lze čekat od čipů, které budou mít 8 pipelines - stejně jako tehdy nové R300 a NV30? {mospagebreak title=Dlouhá cesta vývoje}

Dlouhá cesta vývoje

Poté, co v roce 2002 společnost ATi Technologies vydala Radeon 9700 PRO a stvrdila tak svoji pozici v čele grafického průmyslu, se objevily první zmínky a náznaky dalšího vizuálního procesoru. O několik měsíců později, po vydání kontroverzní nVidia GeForce 5800 Ultra, se začaly rýsovat poněkud přesnější informace. Stejně jako o projektu R400, jak byl tehdy nazýván, přišly i první zmínky o konkurující NV40. Oba procesory se zdály být spíše přirozeným evolučním krokem, než nějakým skokem. To potvrzovaly i předběžné a neoficiální specifikace, které nechávaly většinu uživatelů chladnými. Co taky lze čekat od čipů, které budou mít 8 pipelines - stejně jako nové R300 a NV30?

R420 a NV40 - další generace VPU

Když po několika-měsíčním odstupu přišly vychytané verze původních grafických čipů, byly další informace o přicházející generaci mnohem přesnější a zajímavější. Namísto R400 se rozšířilo označení R420 a spolu s ním i pracovní název nového procesoru - "Loki". (Několikrát jsem byl tázán, zda nevím, co Loki znamená: Je to severský polobůh, jehož atributem jsou poněkud kruté žerty a lstivost; znáte třeba Lokiho masku ze stejnojmenného komixu/filmu Maska.) Více zaujaly kusé informace o změnách u nVidie. To, co bylo původně nazváno projekt NV40, bylo zrušeno a pod označení NV40 přešel projekt NV45. To byl pro mnohé téměř šok (zvláště pak pro skalní fanoušky společnosti ATi). "Nová" čtyřicítka totiž měla přinést skok, jaký tu dosud nebyl. 16 plnohodnotných grafických pipeline obsažených ve vysoce taktovaném jádře. Jinými slovy, o osm více, než měl tehdejší hi-end. Tento krok se zprvu zdál poměrně nejasný (proč by nVidia měla riskovat technologické problémy, když by pro srovnání kroku s konkurencí stačila polovina?). Jak se později ukázalo, ATi sice dokázala mnoho utajit před veřejností, nikoli však před konkurencí. První "žert" Lokiho se objevil v podobě 12 pixel - pipeline, což byl onen důvod zrušení původní NV40.

R420 a NV40 - další generace VPU


Zahozením rozběhnutého projektu se společnost nVidia dostala do mírného skluzu a R420 se zdál být mnohem blíže svému dokončení. Přesto si ale nikdo netroufal ani odhadnout, čí VPU dopadne lépe, čí karta bude rychlejší a kvalitnější. Pro řešení nVidie byly vysoké plánované frekvence, 16 pipelines a hlavně technologická výbava získaná skokem o další "půlgeneraci" v podobě původní NV45. Na straně ATi pak stál výkon daný konkurenceschopností i při nižších frekvencích či počtu pipelines (čímž ostatně vstoupila její série Radeon ve známost) a navíc náskok v technologické implementaci rychlých a kvalitních pixel shaderů. 

Výraznější problémy byly svázány s nedotaženým 110nm výrobním procesem, který nakonec musely obě společnosti oželet. nVidia byla nucena snížit taktovací frekvence své vlajkové lodi, ale ATi, jako by se jí tato situace ani netkla, naopak ohlásila vyšší takt, než byl původně zamýšlen. A k tomu, jako třešničku na dortu, oznámila i novou variantu R420 s šestnácti pipelines a frekvencí 600MHz. Poslední hořký žert (alespoň z pohledu konkurence) Lokiho ale nebyl dotažen do konce. Pro 130nm výrobu je 600MHz horní hranice, takže se i ATi nakonec musela uskrovnit a takt snížit.

Naopak nVidia na tento krok velmi rychle odpověděla svou rychlejší Extreme verzí, čímž dokázala, že ani NV40 zdaleka nenarazila na hranici svých možností. GeForce 6800 Ultra Extreme se ale pravděpodobně na pulty vůbec nedostane. Byla vyrobena v omezeném množství, pro prezentační účely. To ovšem neznamená, že bychom se nemohli setkat s OC modely (typickými např. pro společnost Gainward), které na podobných frekvencích standardně poběží.

{mospagebreak title=GeForce 6800 a Radeon X800}Název pro novou sérii GeForce byl znám poněkud dříve, než název nového Radeonu. nVidia tentokrát nepoužila přízvisko FX, neboť nechtěla promítnout do názvu nové karty nepříliš velkou úspěšnost minulé série. U ATi byla situace trochu složitější. Logický název Radeon 10800 se již zdál příliš dlouhý a nepřehledný. Označení 9900 by pak nedostatečně odráželo skok oproti předchozí generaci a neposkytovalo dostatečný prostor pro ostatní "deriváty". Arabskou desítku nahradila římská a Radeon X800 byl na světě.

Design karet

Radeon X800 XT

R420 a NV40 - další generace VPU


Společnost ATi opět vsadila na co možná nejmenší PCB a osvědčený koncept chladiče (který kupodivu dosud nemá žádný marketingový název). Nové jádro je tedy překryto podobným měděným pasivem, jaký využíval Radeon 9800XT. Prakticky jediná změna je jeho menší velikost; nyní ponechává paměťové moduly nepřekryté. Díky implementaci GDDR-3 (které mají výrazně nižší energetické nároky a jejichž hlavním autorem je právě ATi) není chlazení bezpodmínečně nutné. Grafická karta je osazena jedním konektorem (molex) pro přídavné napájení; maximální teoretická spotřeba nepřesahuje 67W.

R420 a NV40 - další generace VPU


Samotné jádro má rozměry 16 x  16,25mm (260 mm2) a pochází z výrobních linek TSMC. Využívá výhod technologie low-k (poprvé v podobě RV360 na Radeon 9600 XT), která spočívá v použití kvalitního izolantu ("Black Diamond"), čímž je snížena vzájemná kapacita vodičů a ve výsledku pak klesají energetické nároky a stoupá stabilně použitelná taktovací frekvence.

nVidia GeForce 6800 Ultra

R420 a NV40 - další generace VPU


Společnost nVidia slíbila tišší referenční chlazení, než s jakým jsme se setkávali na sériích FX 5800 Ultra a FX 59x0 Ultra, což je jedině dobře. Samotný chladič je velmi mohutný a překrývá i paměťové moduly. Pro napájení slouží dva molex konektory umístěné prakticky na konci PCB. Maximální teoretická spotřeba karty mírně překračuje 100W. Dva konektory zprvu sice způsobovaly jistou nedůvěru mezi uživateli, ale mluvčí společnosti před několika dny uvedl, že řada GeForce 6800 poběží bezproblémově i s jen jedním zapojeným konektorem. Druhý konektor je osazen kvůli možnosti zapojit kartu na dvě nezávislé větve napájecího zdroje, aby nedocházelo na jednom okruhu k příliš velkému zatížení, které by mohlo snižovat stabilitu systému. Taktéž se snížily požadavky na napájecí zdroj z původních "serverových" 480W na slušných 350W (v praxi to samozřejmě závisí na konkrétní sestavě).

R420 a NV40 - další generace VPU


Jádro má rozměry nepatrně přesahující 16 x 18mm (288mm2). Pro zajímavost: Na jednom čtverečním milimetru NV40 se těsná přes 1,3 milionu tranzistorů. Obdobný počet tranzistorů ještě v roce 1996 stačil pro čipy karet, jako byly ATi 3D Rage, nebo 3Dfx Voodoo 1! VPU si společnost nVidia nechává vyrábět u IBM (s TSMC neměla dobré zkušenosti a raději vsadila na jistotu).{mospagebreak title=Specifikace a předchozí generace}Oproti minulé generaci došlo k poměrně velkým změnám. Obě karty (čipy) obsahují 16 pixel-pipelines. Vezmeme-li v úvahu, že před necelými osmi lety byla standardem jedna, pak dojdeme ke skutečnosti, že se jejich počet každých 18 měsíců zdvojnásobí. Je reálné uvažovat o cca 128 pro rok 2010? Vertex shader se oficiálně objevil na HW úrovni v dubnu 2001 na GeForce 3. Radeon 8500 a GeForce 4 již disponovaly dvěma VS jednotkami. GeForce FX 5900 třemi a nynější generace šesti. Podobným způsobem roste i teoretická paměťová propustnost, která na Radeonu X800 XT již překonala 35 GB/s.

GeForce FX 5950 Ultra (NV38) GeForce 6800 Ultra (NV40) Radeon 9800 XT
(R360)
Radeon X800 XT Platinum (R420)
Výrobní proces 0.13 ľm TSMC 0.13 ľm IBM 0.15 ľm TSMC 0.13 ľm TSMC lowK
Technologie cipu 256-bit 256-bit 256-bit 256-bit
Počet transistorů 125 milionu 220 milionu 107 milionu 160 milionu
Paměťová sběrnice 256-bit DDR 256-bit DDR (I - III) 256-bit DDR/DDR-II 256-bit DDR (I - III)
Max. paměti 256 MB 512 MB 256 MB 512 MB
Takt čipu 450 MHz 400 MHz 412 MHz 520 MHz
Takt pamětí 475 MHz (850 DDR) 550 MHz
(1100 DDR-II)
365 MHz (730 DDR) 560 MHz
(1120 DDR-II)
Paměťová propustnost 28.3 GB/s 32.8 GB/s 21.8 GB/s 35.8 GB/s
Fill-rate (single-texturing) 1900 Mpixel/s 6400 Mpixel/s 3040 Mpixel/s 8300 Mpixel/s
Fill-rate (multi-texturing) 3800 Mtexel/s 6400 Mtexel/s 3040 Mtexel/s 8300 Mtexel/s
Vertex Shader 3 6 4 6
Maximální počet transformací Troj./s 365M 600M 412M 780M
Počet Pixel Pipelines 4 (8*0) 16 (32*0) 8 16
Počet text. jednotek na pipeline 2 (1) 1 1 1
Max. textur v 1 cyklu 16 16 16 16
Vertex Shader verze 2.0 3.0 2.0 2.0
Pixel Shader verze 2.0 3.0 2.0 2.0
DirectX 9.0 9.0 c 9.0 9.0
FSAA MultiSampling
SuperSampling
MultiSampling
SuperSampling
MultiSampling MultiSampling
Optimalizace propustnosti pameti vylepšené LMA II
Color Compression
 LMA III
Color Compression
Hyper Z III+ Hyper Z HD
Optimalizační enginy IntelliSample HCT IntelliSample 3.0 SmartShader 2.1
SmoothVision 2.1
SmartShader HD
SmoothVision HD
Z komprese 4:1 ? 8:1
Max - 24:1 @ 6x FSAA
8:1
Max - 48:1 @ 6x FSAA
Barevná komprese 4:1 bezztrátová 8:1 8:1
Integrované RAMDACy 2x 400MHz 2x 400MHz 2x 400MHz 2x 400MHz
Bitů na barevný kanál 10 10 10 10
Další technologie UltraShadow UltraShadow 2 F-buffer 3Dc Compression
Temporal AA

Gigantický fillrate blížící se 10 GT/s a transformační síla, kterou už brzy budeme počítat v miliardách polygonů (GT/s) ale nejsou tím hlavním, co určuje výkon (stačí vzpomenout na Parhelii či Volari V8 Duo). Tím nejdůležitějším je technologie, architektura jádra a softwarová podpora. Poslední položku zatím netřeba řešit, během předešlých let nastal u obou společností k obrovský pokrok ve vývoji ovladačů, minimálně z pohledu uživatele. Myslím, že si oba giganti nemají co vyčítat ;-).

Podporované technologie 

Technologická výbava ATi R420

SmartShader HD
  • Hardwarová podpora DirectX 9.0
  • Vertex Shader 2.0
    • 65 280 instrukcí s řízením toku
    • Trigonometrické operace během 1 cyklu
  • Pixel Shader 2.0+
    • Až 1536 instrukcí a 16 textur (single-pass)
    • F-Bufferu Druhé generace
    • 32 dočasných a pevných registrů
    • Multiple Render Target (MRT)
SmoothVision HD
  • 2 - 6x Sparse / Rotated-Grid Multi-Sample Anti-Aliasing
  • Programovatelný MultiSampling s gamma korekcí afektovaných pixelů
  • Temporal Anti-Aliasing
  • Bezztrátová barevná komprese v poměru 6:1
  • 2 - 16x adaptivní anizotropní filtrování (~128-tap)
  • Adaptivní bilineární a trilineární filtrace
  • 3Dc komprese normálových map (4:1)

HyperZ HD

  • 3-úrovňový Hierarchal Z-buffer
  • Bezztrátová komprese Z-bufferu
  • Fast-Z-Clear

VideoShader HD

  • Integrace Pixel Shaderů pro akceleraci videa
  • FullStream pro PostProcessing (MPEG4 formáty podle podpory )
  • VideoSoap pro úpravu struktury obrazu videa (denoise, smoother...)
  • HW akcelerace všech MPEG formátů pro video (encoding, decoding)
  • Motion Compensation, iDCT, DCT
  • Adaptivní De-Interlacing (na úrovni pixelu) a úprava snímkové frekvence

Technologická výbava nVidia NV40

CineFX 3.0

  • DirectX 9.0c
  • Vertex shader 3.0
    • Displacement Bump Mapping
  • Pixel shader 3.0
    • podpora pro větvení kódu
    • Multiple Render Targets (MRT)
  • Nekonečně dlouhý kód pro shadery
  • Vylepšené texturovací jednotky
    • Až 16 textur (single-pass)
    • 16-bit FP přesnost při použití filtrace textur
    • 32-bit FP přesnost (bez filtrací)
  • UltraShadow 2

High-Precision Dynamic Range Technology

  • Podpora desetinných čísel v celé délce pipelines (FP16)
  • FP16 preciznost filtrace textur
  • FP Frame buffer
  • Rotated-Grid SuperSampling
  • Rotated-Grid MultiSampling

IntelliSample 3.0

  • 2 - 16x adaptivní anizotropní filtrace
  • nové kompresní algoritmy
  • Fast-Z-Clear
  • IntelliSample HCT

Multimediální výbava

  • VPE (video-procesor)
  • HW MPEG1/2
  • Akcelerace MPEG4
  • Akcelerace WMV9
  • TV enkodér, up-to 1024x768
  • DVD a HDTV až 1920x1080i
  • Dual 400MHz RAMDAC
  • Multi-monitor (nView)

Pokud byste nenalezli vysvětlení některých technologických pojmů na dalších stránkách, můžete zkusit můj slovníček.

{mospagebreak title=Změny z Kanady}

Pipelines a Pixel Shadery

Paralelizace, paralelizace a znovu paralelizace. Tak lze ve zkratce shrnout trend vývoje architektury všech nových VPU. Ta totiž umožňuje zacházet s určitými částmi procesoru, jako by šlo o samostatné celky. Ty potom lze podle aktuálních potřeb trhu deaktivovat.

R420 a NV40 - další generace VPU

Na první pohled zaujme skupina šestnácti pipeline, které jsou znázorněny ve skupinkách po čtyřech. Každá skupinka dokáže fungovat jako samostatný celek a nebyl by problém prodávat čipy, které by měly aktivovanou jen jednu čtveřici (dobrá pojistka pro případ vysoké zmetkovosti). Podívejme se ale trochu hlouběji:

R420 a NV40 - další generace VPU
Kliknutím se obrázek zvětší

Na obrázku je znázorněna jedna čtveřice (z celkových čtyř) pixel pipeline. Jak už je u ATi zvykem, na jednu pipeline přísluší jedna texturovací jednotka. Toto řešení je velice ekonomické a nemůže dojít k situaci, kdy by nějaká část zůstala nevytížena (můžeme vzpomenout straší grafické karty, jako např. GeForce 256, nebo Radeon 256, které měly na jednu pipeline více texturovacích jednotek. To mělo tu výhodu, že ve scénách, kde byl použit multitexturing /více vrstev textur na sobě/ se každá texturovací jednotka starala o jednu vrstvu a pokud nebylo více vrstev textur, než kolik měla pipeline texturovacích jednotek, nedocházelo v podobných scénách k poklesu FPS. V běžných scénách (single-texturing) pak ale byla využita jen jedna texturovací jednotka (na pipeline) a ostatní zahálely. To je značný luxus (ne-li neekonomické provedení). Doplatil na to např. Matrox se svojí Parhelií, která má sice 4 texturovací jednotky na pipeline (což se setsakramentsky prodraží), ale ty se naplno uplatní pouze při 4-vrstvém multitexturingu. Pokud naopak každá texturovací jednotka bude mít vlastní pipeline, bude moci být využita i při single-texturingu a tím velice vzroste výkon. ATi se tato architektura opravdu osvědčila, takže se jí drží dál (po srovnání: dovolte mi ještě se vrátit k Parhelii. Ta nese 4 pipelines a na každé 4 TMU. To je celkem 16 texturovacích jednotek! Stejně jako na Radeonu X800 XT!!!)

Dalším prvkem architektury je (už poněkud méně ekonomické) použití Pixel Shaderů. Jeden Pixel Shader na jednu pipeline (celkem 16). To je jedním z důvodů, proč podávají grafické karty společnosti ATi tak dobrý výkon v aplikacích, které Pixel Shader používají. Toto řešení je sice nákladné, ale pokud vzpomenu cenově orientované čipy, jako např. Volari V8, které z důvody úspor nemají Pixel Shader na každé pipeline, pak určitě sami uznáte, kde se šetřit nevyplácí.

I když barevná preciznost zůstala na 96 bitech (24 bitů na každý barevný kanál), vzrostl počet podporovaných funkcí a schopností (o tom dále). Ještě bych chtěl uvést na pravou míru jakýsi nesmysl, který po internetu koluje. Mám na mysli ono tvrzení typu: "R420 umí jen 24 bitový rendering, nepodporuje ani 32 bitové barvy a je proto strašně zastaralá." To je omyl :-) Rendering je 96-bitový, těch 24 bitů slouží pro popis jednoho barevného kanálu (24 bitů pro červenou, 24 bitů pro zelenou, 24 pro modrou a 24 pro průhlednost). Pro názornost: Riva TNT: 32 bitů (8 pro každou barevnou složku), Radeon 8500: 48 bitů (12 na složku, DX8.1), Rampage: 52 bitů (13 na kanál), Radeon X800: 96 bitů (24 na kanál DX9.0), GeForce 6800: 128 bitů (32 na kanál DX9.0c).

Vertex Shadery a paměťový řadič

R420 a NV40 - další generace VPU

VPU R420 implementuje oproti předchozí generaci o 50% více Vertex Shaderů. Počet tedy vzrostl na 6. Samotné Vertex Shadery se ale nijak drasticky nezměnily; podobně jako Pixel Shadery zůstaly ve verzi 2.

R420 a NV40 - další generace VPU

Řadič procesoru R420 je 256 bitový rozdělený na čtyři 64 bitové kanály, které mohou nezávisle (a zároveň i najednou) číst a zapisovat z/do paměti.

{mospagebreak title=Novinky z Kalifornie...}

Pipelines a Pixel Shadery 3.0

To, co se na procesoru NV40 oproti předchozí generaci změnilo nejvíce, je architektura pixel pipeline. Zároveň je však nutné podotknout, že některé vymoženosti architektury FX-ky zůstaly.

R420 a NV40 - další generace VPU
Kliknutím se obrázek zvětší


GeForce FX ve své podstatě odpovídala architektuře 4 pipelines se dvěma texturovacími jednotkami na každé. Jak jsem již zmínil u R420, není tento způsob v poměru cena/výkon příliš výhodný. Síla GeForce FX se měla objevit v situaci, kdy není třeba pracovat s barevnými hodnotami. V tomto případě se FX chová jako by obsahovala 8 pipelines s jednou texturovací jednotkou na každé. Toho lze využít např. při renderování stínů, což by se náramně hodilo na hry typu Doom III (a další budoucí hry založené nejen na tomto enginu). Jenže Doom nepřišel, takže se FX nemohla s jeho pomocí prosadit. Architektura NV30 byla pro nVidii zkrátka takovým šlápnutím vedle. Na většinu tehdejších aplikací se prostě nehodila.

Nová architektura se zdá být výrazně výkonnější, propracovanější, ale zároveň také dražší (řekl bych i dražší, než u R420). 16 paralelních pixel pipeline je opět sdruženo ve čtveřice, které mohou být snadno deaktivovány. Tady, řekl bych, podobnost končí. Pojďme se podívat dál.

R420 a NV40 - další generace VPU

Každá pipeline totiž obsahuje 2 (slovy dva) Pixel Shadery! Oba Shadery ale nejsou totožné! Sekundární Shader není schopen pracovat s texturou a slouží pouze k aritmetickým výpočtům (primární pak zvládá obojí). Tento prvek se velice dobře projeví, pokud je zapotřebí více aritmetických operací, než práce s texturou. Oba shadery navíc dokážou fungovat nezávisle, ale i kooperativně a s 32 bitovou precizností.

Vertex Shadery 3.0

R420 a NV40 - další generace VPU

NV40 obsahuje, stejně jako kolegyně, celkem 6 Vertex Shaderů. Ty však již plně odpovídají specifikacím 3.0. Nejzajímavěji se jeví možnost použití neomezeně dlouhého kódu (což odpovídá právě specifikacím 3.0). Každý Vertex Shader dokáže fungovat nezávisle na ostatních (každý může pracovat s vlastním vrcholem, aplikovat vlastní VS program). Co na obrázku bije do očí, je přístup Vertex Shaderu k texturám. Toho je u NV40 zapotřebí pro realizaci Displacement Mappingu (monochromatická textura je použita pro znázornění výšky modelovaného povrchu nad původním povrchem; stejný princip, jako kdybyste z klasické geografické mapy dělali plastickou mapu){mospagebreak title=Nové technologie...?} 

Protože se tentokrát zdaleka nesešlo vydání nové verze Microsoft Direct X s vydáním VPU nové generace, byly obě společnosti více-méně přinuceny přijít každá s několika vlastními technologiemi. Přestože se zdá, že si oba giganti hrají "každý na svém písečku" (jejich prezentované technologie jsou odlišné), skutečnost je jiná. Co nabízí jeden, nabízí i druhý. Skutečně originální (je-li to správné slovo) jsou 32 bitový rendering a UltraShadow 2 NV40 a technologie 3Dc R420. Jelikož 32 bitový rendering slouží "jen" k přesnějším výpočtům (nižší ztrátovost), zaměřím se na zbylé dvě.

ATi 3Dc komprese

Když se objevily první obrázky nových maskotů Ruby a Nalu, udivil mnohé fakt, že Nalu je tvořena téměř trojnásobkem polygonů, než Ruby - a Ruby přitom nijak hůř nevypadá (po technologické stránce, zbytek nechám na vás ;-). Tajemstvím bylo použití tzv. normálových map. Ty vzniknou tak, že vývojář použije model objektu složený z co nejvyššího počtu polygonů a porovná ho s modelem objektu, který bude použit ve hře. Rozdíly jsou pak uloženy v tzv. normálové mapě. V praxi je pak tato mapa použita na objekt, který je složen z relativně nízkého počtu polygonů, ale vypadá stejně dobře, jako původní originál.

R420 a NV40 - další generace VPU


To ovšem není zas až taková novinka. Používání normálových map bychom totiž mohli považovat za jakýsi vylepšený Bump Mapping. Problém ale nastává v tu chvíli, kdy zjistíme, že normálová mapa má neúnosnou velikost, zabírá mnoho paměti, snižuje paměťovou propustnost na úkor klasických textur a nakonec neušetříme zhola nic.

R420 a NV40 - další generace VPU


Nejjednodušší způsob: Zkomprimovat! Nabízí se dva nejschůdnější způsoby. S3TC a DXTC. Na S3TC můžeme zapomenout rovnou (možná ještě pamatujete na screenshoty oblohy Quake III Arena s aktivovanou S3TC). Kvalitnější DXTC ale taktéž není dostačující, neboť degradace normálové mapy (zde v podobě blokovitosti) je nepřípustná. ATi tedy byla nucena vyvinout novou kompresní technologii, která by byla schopna obraz nepoškodit. Byla nazvána "3Dc" a komprimuje v poměru 4:1 (podle ATi; ve skutečnosti je kompresní poměr mnohem nižší, ATi totiž odvozuje poměr od 32-bitové RGBA). To znamená, že buďto můžeme použít původní normálovou mapu a zátěž na systém bude 4x nižší, nebo použijeme 4x kvalitnější (4x vyšší rozlišení), zátěž bude totožná, ale kvalita nesrovnatelně vyšší. Jako zde:

R420 a NV40 - další generace VPU

Kliknutím se obrázek zvětší


A ještě hezčí ukázka.

R420 a NV40 - další generace VPU
Kliknutím se obrázek zvětší


nVidia UltraShadow II

Společnost nVidia se všemožně připravuje na engine Doom III. A není se čemu divit. Pokud hra nebude úplný propadák (zvlášť po stránce HW nároků a po stránce grafické), bude tento engine licencován a použit v sérii dalších her.

R420 a NV40 - další generace VPU
Kliknutím se obrázek zvětší


Jedna z těchto příprav spočívá v technologii UltraShadow, která sice byla přítomna již na sérii FX, ale nyní byla vylepšena a dotažena k vyšší efektivitě. Cílem technologie je zredukovat objem nutných výpočtů. Zkrátka, počítat stíny jen tam, kde jsou skutečně vidět. V kombinaci se schopností renderovat dvojnásobné množství stínů, než texturovaných pixelů ("32x0") lze o NV40 prozatím uvažovat jako o vhodnějším kandidátovi pro Doom III, ale nechtěl bych dělat závěry, dokud se neukáže ATi s 3Dc v praxi.

R420 a NV40 - další generace VPU

Scéna na obrázku pochází ze zmiňovaného Dooma. Níže je pak screenshot s vyznačenými obrysy, které vyplývají ze standardních výpočtů potřebných pro správné nasvětlení a stínování bez použití technologie UltraShadow II. Pokud se podíváte na obrázky, uvidíte kolik zbytečných výpočtů může díky implementaci této technologie odpadnout.

bez UltraShadow II / s Ultra Shadow II
R420 a NV40 - další generace VPU
R420 a NV40 - další generace VPU

Obě společnosti také prezentují mnoho "nových" technologií. Jsem přesvědčen, že je už dlouho znáte. Nebudeme tedy nikomu nadržovat a projdeme je všechny:

Soft Shadows - ATi, nVidia

R420 a NV40 - další generace VPU
a la nVidia


R420 a NV40 - další generace VPU
a la ATi


novinka: červen 2000, 3Dfx Voodoo 5

Technologie slouží k vytvoření reálnějších stínů. V realitě způsobují plošné světelné zdroje neostrost okrajů stínů a průchod vzduchem má za následek určitý rozptyl světla, který sníží kontrastnost stínu.

Depth of Field - ATi

R420 a NV40 - další generace VPU


novinka: červen 2000, 3Dfx Voodoo 5

Lidské oko nedokáže zaostřit na celou hloubku prostoru, takže okolí vidí neostře. Pro simulaci tohoto efektu slouží právě Depth of Field.

High Dynamic Range Rendering - ATi, nVidia

R420 a NV40 - další generace VPU


novinka: červenec 2002, ATi Radeon 9700 PRO

Rendering s použitím desetinných čísel a plného barevného a jasového spektra.

Displacement Mapping - nVidia

R420 a NV40 - další generace VPU


novinka: květen 2002, Matrox Parhelia 512

Modelování složitějších povrchů podle černo-bílé textury.

Virtual Displacement Mapping - ATi

R420 a NV40 - další generace VPU



novinka (s rezervou): červen 1999, Matrox G400

Upravená verze normálových map akcelerovaná kompresí 3Dc. Normálové mapy vycházejí z Bump Mappingu.

SubSurface Scattering - ATi, nVidia

R420 a NV40 - další generace VPU
a la nVidia

R420 a NV40 - další generace VPU
a la ATi

Novinka !!!

3D prostředí a objekty nevypadaly příliš dobře, protože až dosud nebylo možné simulovat tzv. vnitřní vyzařování. V praxi se to projevuje jako jakási částečná průsvitnost do určité hloubky. Např. materiály jako kůže, světlý mramor atp., jsou do jisté hloubky průsvitné a světlo, které jimi prochází, se zpod povrchu opět odráží a vrací zpět. Až dosud byly odrazy světla počítány pouze podle samotného povrchu matriálu. SubSurface Scattering ale umožňuje vytvořit i ono vnitřní vyzařování, které má velký vliv na realističnost vzhledu.

Volumetric Light Shaft Rendering - ATi

R420 a NV40 - další generace VPU

Novinka !!!

Znáte ty dramatické záběry z filmů, kde vlhkým vzduchem lesa prorážejí úzké kužely slunečního světla?. Nebo prachem ve vzduchu na staré půdě probleskující paprsky slunce? Tak právě toto byl až dosud velký problém. ATi se povedlo zmíněné efekty zrealizovat ve virtuálním světě a pokud se uchytí, bude o tu správnou atmosféru ve hrách určitě postaráno!

{mospagebreak title=Multimedia, video a HW akcelerace, závěr}


V druhé třetině devadesátých let, když se začal výrazněji rozšiřovat první použitelný videokodek MPEG1 (který umožnil přenést video i na PC, čímž způsobil slušnou multimediální revoluci) byly dvě společnosti, které se situace pokusily využít a plně se na podporu videa vrhly. Tehdy to byl Matrox a ATi. Matrox šel cestou implementace HW kodeků na PCB videokarty (samostatné čipy, např. MJPEG, MPEG2...), kdežto ATi se snažila implementovat základní funkce přímo do grafického jádra. Z dnešního pohledu se zdá, že právě ATi šla lepší cestou. Tím také získala v tomto odvětví velmi slušný náskok.

nVidia VPE

Nyní však společnost nVidia odmítla monopol ATi dále tolerovat a rozhodla se mu udělat přítrž. Ohlásila, že její nový VPE (Video Processing Engine) bude podporovat prakticky všechny formáty videa (MPEG1, MPEG2, MPEG4 (DivX...), WMV), které se dnes používají a to pro kompresi i dekompresi. K tomu slíbila i silnou softwarovou podporu a to do takové míry, že pro přehrávání všech těchto formátů NEbude zapotřebí žádný speciální přehrávač! O všechno se postarají ovladače. Inteligentně rozeznají, kdy je video přehráváno a okamžitě převedou téměř všechnu zátěž na VPE (podle požadavku konkrétního formátu: od Motion Compensation, přes inverzi diskrétní kosinové transformace /konverze dat z frekvenční podoby do nekomprimované podoby, zjednodušeně řečeno: JPEG -> BMP) a dále deinterlacing či postprocessing.

Pojďmě se na nový video-procesor podívat podrobněji. Není řešen podobně, jako u ATi, kde je pro většinu funkcí využíváno potenciálu programovatelných Pixel Shaderů, ale jde o samostatnou jednotku ve VPU.

R420 a NV40 - další generace VPU


Video-procesor pracuje celočíselně, podporuje dynamické větvení kódu a obsahuje 16ti-cestnou vektorovou jednotku typu SIMD.

nVidia VPE

  • Vysoce kvalitní zpracování videa
    • Adaptivní De-Interlacing
    • vysoce kvalitní filtrace a úprava rozlišení
    • De-Blocking (postprocessing)
    • integrovaný TV-enkodér (t.j. procesor pro TV-out)
  • Kompletní řešení pro HDTV
    • samostatná manipulace s datovými proudy (streams)
    • výstup v rozlišení HDTV (720p, 1080i, 480p, CGMS)
  • Kompletní podpora pro kompresi i přehrávání videa
    • HW synchronizace zvuku s videem
    • MPEG 1/2/4 komprese/dekomprese
    • akcelerace Microsoft WMV9

Protože společnost nVidia plánuje využití VPU NV40 (resp. některých verzí) i v mobilních počítačích, pamatovala i na energetickou stránku. Při standardním přehrávání videa je totiž dlouhodobě a souvisle zatěžován CPU, což se velice rychle projeví na stavu akumulátoru. Aby k tomu nedocházelo, je schopen VPE nejen převést procesy na sebe (čímž sníží zátěž a energetickou spotřebu CPU), ale dokáže při přehrávání zároveň deaktivovat i zbytek grafického jádra, čímž ještě více spotřebu sníží.

Podívejme, jak to v praxi probíhá:

R420 a NV40 - další generace VPU
Kliknutím se obrázek zvětší



Všimněte si, že nejnáročnější procesy, jako inverze diskr. kosinové transformace, kompenzace pohybu a deinterlacing jsou prováděny hardwarově. Jen bych podotkl, abyste raději brali celé schéma s rezervou, protože na MPEG2 se standardně nepoužívá deblocking (vysoký datový tok to nevyžaduje), takže příliš nechápu, proč je po dekompresi video-streamu aplikován.

R420 a NV40 - další generace VPU
Kliknutím se obrázek zvětší


Zajímavější je situace probíhající při kompresi do MPEG2. Její rychlost je běžně nejvíce limitována náročností denoise filtrů (= odstranění šumu; pokud je zapotřebí) a na druhém místě je pak detekce pohybu (Motion Search, zde značeno jako Motion Estimation - odhad pohybu). Nechtěl bych dělat žádné závěry, ale protože na těchto dvou procesech nejvíce závisí kvalita výsledného videa, doufejme, že pojmy rychlý a kvalitní se nebudou vzájemně vylučovat.

Tolik k multimédiím. ATi prozatím žádnou novinku neohlásila, takže nezbývá než čekat, zdali tak ještě neučiní. Nyní zřejmě nemá potřebu stávající situaci nijak měnit, i když lepší softwarová podpora pro FullStream a VideoShader by se rozhodně neztratila (podpora v programu DivX Player a Real Player znamená zatím víc, než nabízí nVidia, ale pokud se skutečně podaří zvládnout podporu VPE do takové míry, že bude nezávislé na přehrávači, bude mít ATi opravdu co dohánět.

Závěr

Žádná ze společností nelenila a nešetřila na vývoji nových grafických čipů. Tato generace VPU je jedním z největších skoků, jaký jsme tu dosud měli. Proč? Všimněte si, že až dosud, byla technologická dema (software, který dokáže dostat z karty maximum) centrována na jeden vykreslovaný objekt, maximálně s velice jednoduchým okolním prostředím. To znamenalo, že karta je sice schopna nádherných efektů či realistického zobrazení, ale její výkon zdaleka nepostačuje na převedení těchto atributů do praxe (tzn. "utáhne" jeden objekt, ale celé prostředí už nezvládne). Naopak technologická dema NV40 a R420 předvádějí celá prostředí v úžasné kvalitě a se všemi cinema-efekty. Zbytek už je na vývojářích her.

Kromě 3D je stále více pamatováno i na multimediální podporu, i když tady už bývá softwarová podpora slabší. Dočkáme se HW akcelerace komprese a dekomprese MPEG4 a WMV? Možná pomůže nová generace formátů, jako HD DVD, takže obě společnosti budou moci soupeřit o lepší podporu. Víc nelze odhadnout.

Pokud jste nenarazili na zmínku o novém AntiAliasingu 6800 a X800, nezoufejte. Připravuji samostatný článek, který se bude touto problematikou podrobně zaobírat.

Za materiály děkuji webům:

http://www.ati.com
http://www.nvidia.com
http://www.anandtech.com
http://techreport.com
http://www.tomshardware.com
http://www.xbitlabs.com

 
Komentáře k článku
RSS
Pouze registrovaní uživatelé mohou přidat komentář!
14.5.2004 11:04:07   0.0.0.xxx 00
Sice je to štojštl, ale taky jsem chtěl být jednou první...
14.5.2004 11:51:50   0.0.0.xxx 00
mně se tento článek líbí...
14.5.2004 12:15:37   0.0.0.xxx 00
Nejak mi nejedou obrazky v poslednich dvou stranach..
14.5.2004 12:26:52   0.0.0.xxx 00
musim pochvalit autora tohto clanku za dobry a zrozumitelny text, hlavne pri vysvetlovani niektorych pojmov s ktorymi sa ini vysporiadaju celkom rychlo formou copy -> paste a aj to vacsinou len odbornymi terminmi v anglictine, ktorym malokto rozumie ale kazdy sa nimi ohana ako najvacsi odbornik a staci jednoducha otazka "ako to vlastne funguje" alebo "na co je to dobre" a je po parade Pochvalu si tiez zasluzi za velmi objektivne hodnotenie co tiez je velmi zriedkave, kedze vacsinou si redaktor predsa len neodpusti a nepripoji akoby hlasku bokom a nieco u neoblubenej znacky zkritizuje alebo naopak u oblubenej vyzdvihne - proste cosi ako uder pod pas vo fair-play hre. Potom v diskusii vznika celkom zbytocny flame. Tesim sa a som zvedavy na dalsie informacie, ktore zverejnite.
14.5.2004 12:30:20   0.0.0.xxx 00
Jsem to jeste nedocetl (zatim je to dobre), ale nema byt velikost jadra R420 16x16,25mm?
Samotné jádro má rozměry 16 x 6,25mm (260 mm2)
14.5.2004 12:31:26   0.0.0.xxx 00
Zdravím všechny! Můžu se zeptat co znamenají údaje 4(8*0) a 16 (32*0) v řádku počet pixel pipe lines u tabulky pod kapitolou "Specifikace a předchozí generace". Nevím, ale u mě je 8*0=0, nebo žijeme v Astermeierově matematickém podání?
14.5.2004 12:42:51   0.0.0.xxx 00
Někde ve článku jsem to myslím rozebíral. Jde o to, že standardně je při vzniku pixelu spočtena barva a hodnota Z. To jsou dvě veličiny. Pokud ale není zapotřebí počítat s barvou (např. tvorba stínů - tam jde o změnu jasu), tak jsou pipelines schopné pracovat dvojnásobně efektivně (proto těch 32). Dokážou tedy "ostínovat" dvojnásobek plochy, než kolik by dokázaly otexturovat barevnou texturou. A ta nula znamená právě 0 texturovacích jenotek (protože při stínování nevzniká nová textura)... Mám se pokusit o srozumitelnější vysvětlení?
14.5.2004 12:46:22   0.0.0.xxx 00
Díky za rychlou a komplexní odpověď. Zároveň se omlouvám, ale nevěděl jsem přesně o co jde a z článku to nebylo úplně jasné...ještě jednou dík.
14.5.2004 13:00:48   0.0.0.xxx 00
Opravdu paradne odvedena prace. Je videt, ze autor ma v teto problematice naprosto jasno. A tusim, ze nejen v teto oblasti Diky moc pane Soucek za bezva poctenicko
14.5.2004 13:07:03   0.0.0.xxx 00
Dekomprimaci, jak jí bude 6800 skrze ovladače provádět, jsem myslím principielně pochopil.
Ale uniká mi jakákoliv představa, jakým způsobem bude možno potenciál karty využít při komprimaci videa (resp. převodu např.: MPEG2 do MPEG4, nebo UNCOMPRESSED AVI do MPEG4).
Chystá nVidia nějaký bundlovaný, či volně stažitelný soft, aby bylo možno tento (podle mne velký) potenciál karty využít?
Nebo to bude řešeno pomocí speciálních kodeků, které budou "externě" použitelné třeba ve VirtualDubu?

Předem díky za jakoukoliv odpověď
14.5.2004 13:07:46   0.0.0.xxx 00
Diky autorovi za srozumitelny a pritom ctivy clanek.
Tesim se na pokracovani o antialiasignu
14.5.2004 13:14:23   0.0.0.xxx 00
nVidia spolupracuje tuším s Adobe, z hlavy teď víc nevím. Bude tedy zapotřebí software připravený pro tyto schopnosti. Podpora ve V-Dubu by bodla, ale když jí nikdo neudělal pro ATi (VideoShader), pochybuju, že se v blízké době objeví pro nV.
14.5.2004 13:30:56   0.0.0.xxx 00
dobry clanek, na me teda az moc technicky ....
14.5.2004 14:17:43   0.0.0.xxx 00
Takovejhle clanek se po nudnem dnu docela hodil ...
14.5.2004 19:14:05   0.0.0.xxx 00
Už jsem asi 15. v pořadí a nevidím tu žádný flame. A přitom klasické střetnutí nVidia vs. ATi je tak vděčným tématem.
Doufám, že to nezakřiknu.
14.5.2004 19:42:10   0.0.0.xxx 00
Nvidia to zase prosrala,sve PS/VS 3.0 si může strčit někam,na co nám jsou,když hry je budou podporovat tak až za rok?V té době je bude mít už určitě i Ati, a nebude k tomu potřebovat dva napájecí konektory.Nvidia příchodem R300 stratila svou technologickou převahu...
14.5.2004 19:55:19   0.0.0.xxx 00
To je sice možné, že podobné hry budou tak za rok, ale vzhledem k tomu, že rychlostně je na tom u těch nejdražších stejně (6800 Ultra Extreme vs. X800 XT - mírně vede 6800, bude asi ale dražší) a v těch levnějších (6800 GT vs X800 Pro) nVidia v drtivé většině testu vítězí, je pro mě jasným favoritem (na ty nejdražší karty stejně mít nebudu). K tomu lepší technologie...a není co řešit.
14.5.2004 20:04:05   0.0.0.xxx 00
nVidia potřebuje jen jeden. A ta spotřeba taky není tak rozdílná (ATi vs nVidia). Na TomsHardware dělali test a těch zázračných 65 Watů, co si Ati vycucala z prstu je tak ve Windows, když nic nehraješ. Jinak to šplhá až nad 90W (vs 110W nVidia). Takže pokud nVidia korektně doporučovala 480 W, ATi měla doporučovat minimálně 450 W zdroj.
14.5.2004 20:36:50   0.0.0.xxx 00
Oproti minulé generaci došlo k poměrně velkým změnám. Obě karty (čipy) obsahují 16 pixel-pipelines. Vezmeme-li v úvahu, že před osmi lety byla standardem jedna, pak dojdeme ke skutečnosti, že se jejich počet každoročně zdvojnásobí.- k tomu rozhodne nedojdeme, pokud by tomu tak bylo,tak by se pocet pipelines za 8let zvetsil z 1 pipeline na 128(2 na 7) ))


Je reálné uvažovat o čísle 1024 pro rok 2010? :-O
14.5.2004 20:54:49   0.0.0.xxx 00
No jasné že je to blbosť, kde by sa ich tam toľko vošlo ? Podľa mňa budú počítače mať v budúcnosti inú architektúru ako doteraz, lebo donekonečna to ten kremík ťahať nebude. Aj keď ktovie, o DNA computingu sa už hovorí 5-6 rokov dozadu a furt CENZURA z toho...
Ten článok je čistým prekladom z angličtiny , ale zopakoval som si to rád. Ináč 3dfx mala toľko technológií, že ATi a nVidia sa na nich budú ešte nejakú dobu priživovať. Škoda... lebo teraz sme už mohli byť tam kde ATina bude za dva roky
14.5.2004 21:15:04   0.0.0.xxx 00
Óoooo... akurát som si všimol, že autor by mal byť starý známy no-X :O Najskôr sa my zdalo, že sa tu spomína nejaký Rampage, čo v článkoch nebýva zvykom a ešte si tu chlap odkazuje aj na svoj slovník pojmov... No myslím, že sa kruh začína zužovať. Dúfam, že budem mať menšiu protekciu pri riešení záhad Mr. Selice-ho )) hehehe
14.5.2004 21:38:02   0.0.0.xxx 00
To vysvetleni je uplne spatne. Stinovani neni zadna prace s jasem, ale se stencil bufferem (ktery je prokladan se z-bufferem). A zadne texturovani s tim nema nic spolecneho. Proste se pro stencil pouziva i ROP jednotka, ktera se jinak pouziva pro alpha-blending.
14.5.2004 21:43:46   0.0.0.xxx 00
Ja nevim, prave mam trosku pocit, ze autor v nekterych pasazich moc netusi, o cem pise. Vyvrcholenim je asi veta, ze soft shadows v realu vznikaji rozptylem svetla ve vzduchu. Duvodem je ale prece to, ze vetsina zdroju svetla v realnem svete produkuje nehomogenni svetlo. A taky bych si dovolil trochu pochybovat, ze existuje v soucasne dobe hardware, ktery by byl schopny pocitat soft shadows pro celou scenu v realnem case. Soucasny hardware taktak zvlada hard shadows. A mozna se pletu, ale neni nahodou vetsina ostatnich uvadenych technologii spis navod vyvojarum, jak vyuzit pixel a vertex shadery, nez specialni fce s vlastni logikou v procesoru?
14.5.2004 22:32:54   0.0.0.xxx 00
Na třetí straně je v tabulce uvedeno, že GF 6800 disponuje pouze 128-bitovou sběrnicí. Myslím, že to má být 256.
15.5.2004 09:41:23   0.0.0.xxx 00
si toho někdo i všim- já si říkám,že většina lidí to vůbec pořádně nečte... asi je apríla- jinak by to do té tabulky prostě napsat nemohli...
15.5.2004 09:51:58   0.0.0.xxx 00
Ati nemusela doporucovat korektne 450 W zdroj, kdyz RX800XT ma nizsi prikon nez R9800XT. Dale, cetl jsem 5 recenzi a srovnani obou karet a ve vsech vychazel jako vykonovy vitez zretelne RX800XT, coz byl zaver i vsech recenzi (vzpominam xbitlabs, tomshw, digit-life?, ...) A jestli Ti 20-25 W prijde malo, me, ktery se ze grafikou na PC a ma ho pusteny cely den a prijde ho na 500 kc mesicne za proud, to tedy neprijde. To by musela nabizet o hodne vic nez shadery 3.0, ktere dopadnou podle mne podobne jako shadery 1.4 u ATI, aby pro me stala za 1 watt navic
15.5.2004 10:13:01   0.0.0.xxx 00
Článek je to docela dobrý, dobře se četl, i když jde víceméně jen o překlady a vyňatky cizích článků v angličtině, každopádně překlad a přepis se cení. Některé věci jsou ale zřejmě špatně např. 128 bit u 6800 nebo pak další hloupé říkačky o znásobení pipelines. 16 pipelinů je však síla. Jen jsem už zvolna čekal na karty s DirectX 10, na ty si však ještě budeme muset počkat. Každopádně NVidia je na tom technologicky lépe než ATi, na hrubé síle však ztrácí, takty pamětí i jádra jsou slabé. Dá se však čekat litý boj v případě, že by nové vylepšení NVidie někdo skutečně podporoval softwarově, ale toho se asi jen tak nedočkáme, takže velká část novinek zůstane ještě nevyužita, což nahrává ATI, proto je zřejmé, že ji ATI ve většině testů porazí, možná až na vyjímečné hry a některé optimalizace. Mám rád NVidii a její průkopnické věci, bohužel se neprosadili tak, jak by NVidia chtěla. ATI je tak zase výkonově na špici!
15.5.2004 13:21:56   0.0.0.xxx 00
Ale jo, článek je to docela povedený, základy jsou řečeny, ale na druhou stranu souhlasím s tím, že místy autor neví, o čem mluví. Úplný nesmysl je, že Radeon X800 obsahuje jen 1 Pixel Shader na pipeline. Nejen že obsahuje 2 shadery (které jsou navíc složené z vektorové a skalární ALU), ale navíc i paralelní texturovací jednotku. To je velká výhoda proti nVidii, která musí zpracovávat texturu v prvním shaderu a chybí jí tak 50% výpočetní síly. A něco víc k 3Dc kompresi by také neuškodilo. Jinak dobré...
15.5.2004 14:58:13   0.0.0.xxx 00
Autor tady ma pravdu. Dva shadery na pipeline je pouze marketingovy blabol ATi. Ten prvni "shader" (je nakresleny mensim) je pouze mini-ALU, ktera provadi operace, ktere jsou free u pixel shaderu 1.x (scaling, negace). GF6 ma neco podobneho samozrejme taky, ale neni to na standardnich diagramech vubec nakreslene.
A o paralelni texturovaci jednotce bych se tu moc nezminoval, protoze ten prvni shader pouze slouzi pro generovani adresy pro tex. jednotku a v delsich shaderech to moc nezatezuje. Zvlaste kdyz bereme v potaz temer 2x vice shaderu u GF6 (ovsem ne oba shadery umi vsechny operace). Papirove by mela mit GF6 v shaderech tak o 30% navrch.
15.5.2004 16:57:19   0.0.0.xxx 00
Koukal jsem se ještě jednou na zdroj a ohledně těch shaderů máte pravdu, ATi by sice mělo zvládat o něco více instrukcí než nVidia, ale nikde ani konkrétně nestojí, které instrukce to jsou.

Ohledně té texturovací jednotky jsem se možná špatně vyjádřil. Samozřejmě jsem neměl na mysli samotnou TMU, ale jednotku pro generování adresy, kterou ale musí nVidia integrovat do prvního shaderu. Z toho vyplývá, že zde má Radeon X800 opravdu výhodu oproti GF6. Na druhou stranu je fakt, že u dlouhých shaderů, které se ovšem zatím moc nekonají, se bude rozdíl stírat.
15.5.2004 17:19:06   0.0.0.xxx 00
Stejne sou ty dlouhy shadery ve vecine pripady na nic protoze vecina normalnich efektu je kratka a HW generovani fraktalu neni to co by vecinu lidi zajmalo :-D (ale vypada to pekne)
15.5.2004 18:18:53   0.0.0.xxx 00
Myslim, ze ted tady nema cenu polemizovat o tom, ktera karta bude vykonnejsi a ktera ma perspektivnejsi technologie. Stejne o vyberu karty rozhodnou hlavne sympatie k jednomu z vyrobcu, cena a vybava. Napriklad ja si hodlam koupit 6800GT, i kdyz vim, ze je X800 Pro vykonnejsi, ale stejne bych si asi ATi do pocitace nedal. 6800 (slabsi modely - 6800 a 6800GT) by se mely prodavat asi lepe, protoze budou spadat do cenove kategorie, ze ktere vybiraji hlavne lide, kteri chteji vybornou kartu za nadprumerne penize (12000,-?) a nehodlaji kartu menit treba dalsi dva tri roky. Naopak z vyssi tridy se bude spis prodavat ATi, protoze je proste vykonnejsi.
15.5.2004 18:20:43   0.0.0.xxx 00
proste vykonnejsi.
15.5.2004 18:31:32   0.0.0.xxx 00
Četl jsem všechny tyto články a ATi tam vycházela jako vítěz, když srovnávali X800 XT vs. 6800 Ultra, je tu ale 6800 Ultra Extreme (někdy taky 6850 Ultra), která je rychlejší (o stejně nepatrný drobek jako X800XT vs. 6800 Ultra je vítěz ATi - cituji závěr článku na ExtremeTech).
Těch tvých 25W navíc ti při 24 hodin denně hraní za měsíc dá tak maximálně 50Kč(a to jestli), takže pokud máš 20k na tyto karty, tak ti to vadit rozhodně nebude.
Co se týče těch levnějších verzí, tak si stojím za tím (a na těch serverech to jasně říkali (zase mluvím hl. o ExtremeTech, protože ten jsem četl naposled), že nV vede v průměru o 10 - 15 %
15.5.2004 18:34:08   0.0.0.xxx 00
mluvím hl. o ExtremeTech, protože ten jsem četl naposled)), že nV vede v průměru o 10 - 15 % (GT vs. Pro).
15.5.2004 23:36:33   0.0.0.xxx 00
Myslim, ze jedna je C ROP (color) a jedna Z ROP, takze ta prvni je barva nebo Z/stencil a ta druha Z/stencil only. Takze se pouzije ROP jinak urcena pro praci s barvou, ne nutne jen s alfa slozkou ne?

A taky se mi zda, ze jsi zamenil pojmy stinovani (shading) a stiny (shadows,shadowing) :-) Ale myslels to dobre, ten jas pri praci se stiny byl blbost.
15.5.2004 23:43:52   0.0.0.xxx 00
http://www.3dcenter.de/artikel/r420_technik/index3_e.php



ttp://www.3dcenter.de/artikel/nv40_technik/index2_e.php



A popisovat 3Dc, kdyz je to prakticky jen male vylepseni stare myslenky zname uz od dob FXT1 a S3TC zas tak dulezite neni,staci na to dva obrazky z toho white paperu ATI ...
15.5.2004 23:57:40   0.0.0.xxx 00
Po dlouhe dobe na PCtuningu neco, co ma cenu si precist. Uz se moc tesim na clanky, na ktery bude vic casu, jako je ten o FSAA na tvych strankach. Libi se mi, ze to dava pomerne dobry prehled o tech novinkach a docela ctive to navazuje. Navic oproti prekladateli z jineho nejmenovaneho ceskeho HW serveru bez faktickych chyb.

Jenom par pripominek:
- NV38 130nm ale u TSMC? (teda nevim jiste)
- 3Dc komprese je 4:1 jen podle ATI, ve skutecnosti je 3:1 (alfa slozka se u normalovych map nemusi ukladat) a ATI pocita velikost vysledne komprese k pomeru k 32-bitove RGBA, coz je nesmysl a jen marketing, ve skutecnosti se dokonce da rict,ze je spis 2:1, protoze to dopocitani treti slozky vektoru je nezavisle, neni soucasti primo te 3Dc v cipu spise jen dekomprese
- mozna zminka ze Ultra Shadow je zatim jen GL_EXT_depth_bounds_test v OGL
16.5.2004 00:11:47   0.0.0.xxx 00
A jak to chces udelat jinak? Musi vzit proste nejake white papery ze stranek spolecnosti a nakladat s tim co je k dispozici.

Tezko ho zatim pozvou od NVIDIE na Editor's Day do USA, aby to mel z prvni ruky.
16.5.2004 08:33:48   0.0.0.xxx 00
Ultra extreme bude tak malo, ze prakticky nebude ke koupi a bude tak draha, ze je to uplne jina kategorie. To je trochu zoufaly srovnavani. Kdyby ATI vytahla do boje se RX800XT chlazenym dusikem na buhvijake frekvenci za 5000$, ktery by dokazal byt super nejrychlejsi, tak bych rozhodne netvrdil, ze ATI ma nejrychlejsi reseni na trhu. Co se tyce wattu, jedna se o princip. Ono 25W k 25W a za 2 roky potrebujem gigawatovy zdroje. Intel uz dostal rozum a ted by mohla i NVIDIA. Kdyz navic nenabizi nic zadnou pridanou hodnotu. Shader model 3.0 se vec, na ktere NVIDIA stavi marketing, protoze je to hlavni vec, kterou ma nad ATI navic. O jejich vyuzitelnosti se muzem dohadovat hodiny. Zadna hra vyuzivajici shadery 2.0 neni na trhu. Takove FarCry je stale postavene hlavne na shaderech 1.1. NextGen engine jako Unreal3 (hry na nich postavene) vyuzivaci shadery 2.0 (napr. pouzivajici "virtual" displacement mapping postaveny na shaderech 2.0) prijdou do prodeje za 1,5 - 2 roky a dnesni nove karty od ATI i NVIDIE je jeste jakztakz dychavicne rozbehnou. Mozna se mylim a na podzim tady budou hry masivne vyuzivajici displacement mapping, instant geometry atd. Nikdo nezna budoucnost, ale snazim se pouzivat zdravy rozum abych se rozhodl za co utratim penize a nezbastit vsechno spolecnostem (jak ATI ta k NVIDIA a nejem v IT prumyslu), ktere se me snazi presvedcit, ze bez TEHLE SUPER VLASTNOSTI se proste neobejdu. Ono to vetsinou neni pravda.
16.5.2004 08:34:53   0.0.0.xxx 00
nejem v IT prumyslu), ktere se me snazi presvedcit, ze bez TEHLE SUPER VLASTNOSTI se proste neobejdu. Ono to vetsinou neni pravda.
16.5.2004 08:39:26   0.0.0.xxx 00
Prepsal jsem se. Zadna hra vyuzivajici masivne shadery 2.0 neni na trhu.
16.5.2004 09:48:49   0.0.0.xxx 00
osobni stranky... rad bych se podival
16.5.2004 10:54:53   0.0.0.xxx 00
Alpha-blending ale pracuje se vsemi barevnymi slozkami a ne jen s alpha-kanalem, ne ? A reagoval jsem na pojem "ostinovat" v prispevku J.S., kde ma na mysli vykreslovani stencilovych stinu. A s tim ceskym prekladem je to trochu slozitejsi. Pojem "shading" totiz v podstate nejde ani (spravne) prelozit.
16.5.2004 13:07:16   0.0.0.xxx 00
citujem: "Obě karty (čipy) obsahují 16 pixel-pipelines. Vezmeme-li v úvahu, že před osmi lety byla standardem jedna, pak dojdeme ke skutečnosti, že se jejich počet každoročně zdvojnásobí"
No autor asi nema velmi jasno v matike. za osem rokov zdvojnasobovania by sme mali 128 pipelines
16.5.2004 21:40:14   0.0.0.xxx 00
no ja byt tebou, tak se na tu matiku take podivam ;-)
16.5.2004 21:52:24   0.0.0.xxx 00
jak uz jsem psal vyse ... tady to rozepisu

pred 8 lety 1, pred 7 > 2, pred 6 > 4, pred 5 > 8, pred 4 > 16, pred 3 > 32, pred 2 > 64, letos 128. tzn celkem kolik? ;-)
16.5.2004 21:53:22   0.0.0.xxx 00
muhahahahahahahahahaha
16.5.2004 23:18:09   0.0.0.xxx 00
prvy rok 1, druhy rok 2, treti rok 4, stvrty rok 8, piaty rok 16, siesty rok 32, siedmy rok 64, osmy rok 128... ja mam matiku vporiadku
16.5.2004 23:30:07   0.0.0.xxx 00
jsou odkazovany i v clanku (slovnicek)

nedavno byly v novinkach

no tak dobre ... http://www.no-x-files.webz.cz/3dfx/3dfx.htm

no-X uz tam ma hodne peknych clanku!
17.5.2004 07:05:25   0.0.0.xxx 00
Ad SoftShadows: v reálu stačí jediný zdroj světla, víc zdrojů opravdu nepotřebuješ - ve vakuu máš hard shadows, v plynech soft shadows, to je fyzika :-).
V hardwaru: podívej na demo od ATi a jejich prezentace, SoftShadows zde nejsou použité jen na obličeji Ruby!

Ostatní fce: máš více-méně pravdu, ale pokud tomu výrobci dávaj marketingové názvy a propagují to, tak se mi zdá vhodné, to alespoň zmínit!
17.5.2004 07:13:07   0.0.0.xxx 00
Omlouvám se za tu sběrnici a pipelines. Sběrnice je samozřejmě překlep, 256-bitová je samozřejmostí. Pipelines: smozřejmě nesmysl :-) Počítat umím líp, ale ne ve dvě ráno. Ještě jednou se omlouvám.
17.5.2004 11:14:12   0.0.0.xxx 00
shading je prelozitelny opisem jako nastavit odstin barvy.
17.5.2004 11:20:39   0.0.0.xxx 00
Ted mne napadl jeste lepsi preklad tonovani.
17.5.2004 11:58:39   0.0.0.xxx 00
Fakt si myslim, ze s tema soft shadows nemas pravdu. Duvodem proc je okraj stinu rozmazany je to, ze paprsky z 99% zdroju v realnem svete, a je jedno jestli je jeden nebo jich je vic, nejsou rovnobezne a proto okraj stinu neni ostre ohraniceny. Hard shadows jsou ve skutecnosti rarita a vznikaji napriklad pri ozareni laserem. A je jedno, jestli se jedna o vakuum nebo ne. To je fyzika
A co se prezentace ati tyka, docela by me zajimalo, jak to potom delaji. Samozrejme, ze znam clanky, kde se soft-shadows resi pres pocitani pomoci klinu, coz se da implementovat v shaderech, ale jeste na nvidii gf4800 takove stiny jely par framu za sekundu pro jeden svetelny zdroj a hodne malo objektu vrhajicich stin a nechce se mi verit, ze hardware usel od te doby uz tak dlouho cestu. Vzdyt v porovnani s ostrymi stiny je toto mnohonasobne narocnejsi problem. Jestli to nebude nahodou jenom to, ze rozmaznou okraj stinu podobne jako pri antialiasingu a tvari se, ze jsou to soft shadow. V tom pripade je to ale neco uplne jineho, nez co ukazuje obrazek s valci. A na Ruby prave nic takoveho nevidim.
17.5.2004 12:37:41   0.0.0.xxx 00
Ještě jednou k reálu: Podle toho, co tvrdíš by v případě jednoho zdroje světla (řekněme bodového)musel mít objekt (tímto světlem nasvícený) ostrý stín. A to nemá. Tohle už je trochu mimo, ale vzpomeň si třeba na fotky z měsíce, kde není atmosféra, ve které by se světlo mohlo trochu rozptýlit a vytvořit tak měkké stíny: buď je světlo, nebo stín. Nic mezi tím, žádný polostín, žádné přechody světla-stínu. Ostře ohraničené stíny.

efekt softshadows: Nenašel jsem bohužel, jak toho nV a ATi dosahují (stále hledám). Těch jakoby několik měkkých stínů na obrázku nVidie je podle mě způsobno tím, že jsou ve scéně min. 2 zdroje světla (ty dvě bílé tečky). Jediné, co se mi podařilo zjistit je, že ATi nedosahuje efektu pomocí opakovaného renderingu (jako 3Dfx).

Mám ale pocit, že oba tvrdíme to samé, jen to jinak podáváme: ty tvrdíš nehomogení světlo, já, že vzniká rozptylem v plynu (v podstatě totéž). Ten laser není dobrý příklad, protože paprsky jsou sice rovnoběžné, ale pokud překonají určitou vzdálenost v plynu, jsou mírně vychýleny (každý trochu jinak) a můžou vytvořit měkký stín. Jenže ve chvíli, kdy už jsou rozptýlené jim nelze říkat laser(ové) paprsky :-)
17.5.2004 13:19:10   0.0.0.xxx 00
... tak jsem sledoval vaši diskuzi a tak nějak jsem si řek, že bych taky moch něco "přihodit".
Nevím už úplně přesně jak to bylo (je), ale opravdu za bodovým zdrojem vznikají ostré stíny. Rozptýlení ve vzduchu se myslím dá v podstatě zanedbat neboť je poměrně velice malé. Projevilo by se to až na větších vzdálenostech (aspoň myslím, teď si opět nejsem jist). Polostíny (neboli plynulé přechody ) vznikají u PLOŠNÝCH!!! zdrojů světla (neboli nebodových). Pokud vím, tak se to řešilo pokrytím spojitého zdroje světla jistým počtem bodových zdrojů, spočítání stínu pro všechny tyto body a "dání dohromady".
17.5.2004 13:47:20   0.0.0.xxx 00
Prece mi nechces tvrdit, ze treba tento obrazek
http://www.randybrewer.net/images/Digital-Images/Moon.jpg
ma na sobe hladky prechod svetla ve stin proto, ze je foceny pres atmosferu? Co jsem se dival na fotky z mesice, tak ostre stiny jsem opravdu na zadne nevidel, pouze prechod svetla stinu je velice nepatrny, coz je ovsem pochopitelne, protoze vsechno je osvetlene pouze sluncem, ktere je tak daleko, ze paprsky jsou temer rovnobezne, proto se zda byt stin ostrejsi. A bodove svetlo by samozrejme vytvarelo ostre stiny, ale ta finta je v tom, ze bodove svetlo ma nulove rozmery, takze zadny realny zdroj svetla bodove svetlo neni.
17.5.2004 14:29:52   0.0.0.xxx 00
Problem je v tom, ze tam se s barvou vubec nemusi pocitat. Shadery pracuji i s dalsimi atributy, jako napr. texturovymi souradnicemi, hloubkou, fyzikalnimi velicinami apod.
17.5.2004 17:06:34   0.0.0.xxx 00
Jasne. Vychazel jsem z jazyka, nikoli z nejakeho 3D API. (Vetsinou je snahou pouzivat terminy tak, aby co nejvice odpovidali realnemu svetu pro snazsi orientaci)
17.5.2004 17:14:53   0.0.0.xxx 00
Tak za prvé - lidé, kteří kupují nejdražší karty se na peníze moc nedívají, takže pokud si zaplatí o 10% navíc (550 vs 500 dolarů) vůbec jim to vadit nebude.
A za druhé - souhlasím, že těch karet s 6800 UE bude asi málo, ale nemysli si, že to s X800 XT bude o hodně lepší (i když o fous asi jo), protože tato karta byla taky přidávána na poslední chvíli.
S těmi PS 3.0 souhlasím, ale když bych si měl vybrat 5% výkonu nebo tyto, tak si vyberu Shadery (spolu s dalšími technologiemi - viz UltraShadow)
Jak jsem už psal, tak do půl roku si chci koupit 6800 GT, protože v testech dopadá lépe než X800Pro a toto jsou karty které jsou u nás v ČR tak maximálně myslitelné, že si je někdo koupí. A tu vede bez diskusí nVidia.
Samozřejmě počkám si až výjdou nové ovladače a s nima nové testy. Třeba mě ati s Pročkem ještě překvapí, ale neyslím.
17.5.2004 17:21:01   0.0.0.xxx 00
Pročkem ještě překvapí, ale neyslím.

Jinak toto je poslední můj příspěvek k této diskusi (nebo alespoň do této větve). Své důvody jsem tu řekl. Nemyslím si, že se navzájem přesvědčíme (stejně o to tu beztak asi nejde.

Mimochodem, nevím proč, ale vždy mi to odstřihne poslední větu.
17.5.2004 18:50:07   0.0.0.xxx 00
... když dáš pod svůj přízpěvek nějakej ten enter (čím delší přízpěvěk, tím více - tak jeden až tři), tak ti to většinou neořízne. Ono to přízpěvky neořezává, ale je to dáno "uděláním" zarovnání a zbytek není vidět. Vím přesně čím to je, psal jsem to redakci a ta se mi ani neozvala. Asi na to kašlou. Nevím.
18.5.2004 06:59:25   0.0.0.xxx 00
No to nehomogeni svetlo je taky pekna blbost. Soft shadows vznika z duvodu, ze svetla v realnem svete nejsou bodova ale plosna.
18.5.2004 08:37:03   0.0.0.xxx 00
No, skvělý. Tak koukám, že se asi neshodneme ani dva. S těmi plošnými zdroji světla souhlasím, ale v praxi se na efektu podílí i rozptyl světla po průchodu materiálem (konkr. atmosférou) a to je docela slušná vzdálenost, aby pozorovatelný rozdíl byl (už jsem zmiňoval stíny: měsíc/země). Pokud ještě najdu ty stránky, kde jsem na ten rozbor narazil, hodím sem link. Ve whitepaperech o tom totiž radši výrobci mlčí :-)
18.5.2004 13:37:02   0.0.0.xxx 00
Nenašel jsem, co jsem hledal, ale tady je snad dostatečný důkaz - Rozptýlené světlo musí být pro dosažení správného efektu SoftSahdows simulováno (např.jako zde jiným zdrojem světla, který sám nevytváří stíny) a to tak, aby snížilo nerealistickou kontrastnost stínu:

One source of light light (the sun) with the shadows dropped from an object, is done using shadows maps (these shadows should be soft-edged) and its color is almost white shifted to a purple area (it must be similar to solar spectrum). The other source of light must be displaced, faint, without shadows creation. This source illuminates the shadows in order to make them not so contrast and imitate light dispersion.

Zdroj: http://www.360ok.com/index.html
18.5.2004 14:19:13   0.0.0.xxx 00
já myslel, že se začíná rokem "0".
0=1, 1=2 atd
19.5.2004 17:53:44   0.0.0.xxx 00
Panove, mekke stiny vznikaji pouze u plosnych svetelnych zdroju (kdyz pomineme odrazy a lomy)a v realtime jsou simulovany pomoci stinovych map a promitanych textur. Oboje je mozne jak na ATi, tak na nVidii.
21.5.2004 09:24:19   0.0.0.xxx 00
Ale vždyť já souhlasím! Jen jsem se snažil dokázat (a myslím, že snad dokázal), že v realitě se na tomto efektu podílí i rozptýlené světlo, což mi tady někdo pořád vyvracel :-).

Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz

0 čtenářů navrhlo autorovi prémii: 0Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.