Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2
autor: Souček Jiří , publikováno 23.8.2005
 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

V dnešním díle budu pokračovat v historii společnosti ATi, konkrétně posledních pěti letech. Krom toho se zaměřím i na některé další firmy, které mají k ATi blízko. Pokud vás zajímá, jak blízko má první grafický čip Intelu k poslednímu čipu ATI Xenos, odkud se vzal návrh revolučního čipu R300, nebo jak dlouho se už v profesionální grafice používá "CrossFire", čtěte dál...


 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2
Radeon 256 - Radeon "VIVO"

V dubnu 2000, nedlouho po uvedení GeForce 2 GTS a Voodoo 5, vydala ATi svoje první GPU, R100, neboli Radeon 256. První čip od ATi s podporou DDR pamětí, T&L a 256-bitovou architekturou. R100 byl ve své době nejrevolučnějším počinem (žádný jiný výrobce neudělal takový skok oproti předchozímu produktu) a přestože se R100 zdál být něčím zbrusu novým, vycházel v základu z Rage 128 PRO, důkazem může být i původní označení R6C, neboli Rage6C později změněné na R100. Čip byl ale "překopán" doslova k nepoznání.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

ATi měla zacíleno na hi-end a návrh čipu tomu odpovídal. Nejvíce úsilí bylo věnováno eliminaci limitu paměťové sběrnice. To se sice povedlo, ale ATi to možná přehnala. V základu byly ponechány dvě pixel pipelines, neboť vyšší počet by údajně byl z výše popsaných důvodů zbytečný. 256bit architektura čipu a podpora DDR pamětí byly samozřejmé. O další zlepšení se měl postarat synchronní paměťový řadič - jádro i paměti byly taktovány na stejnou úroveň.

Optimalizace, optimalizace, optimalizace...

To ale nebylo vše. ATi se zaměřila na prvek, který nejvíce zatěžuje sběrnici a zjistila, že nejvíce přenosů se týká používání Z-Bufferu*. Ty mohou sběrnici vytěžovat i z více než 50%, a tak byly prvním prvkem, na který se vývoj zaměřil. Implementována byla Z-komprese s kompresním poměrem 2:1 až 4:1 (loseless Z-Compression). 

Druhou významnou technologií je tzv. Hierarchical Z. Jak jsem zmínil v poznámce, Z-Buffer obsahuje údaje o hloubce scény, srozumitelněji řečeno údaje o tom, jak je objekt "daleko" od pozorovatele. Objekt (vrchol) s nižším číslem (např. 10) znamená, že je blíže, než objekt s číslem 50 (můžete si to představovat jako metry - čím více metrů je objekt od vás, tím je dál). To nám postačí pro pochopení přínosu technologie Hierarchical Z.

* Z-Buffer - (česky paměť hloubky) - část grafické paměti vyhrazená pro informace o hloubce scény a poloze 3D objektů. Tyto informace jsou využívány primárně pro zjišťování/testování vzájemné polohy objektů (který objekt je více v popředí, resp. jakou vzdálenost od pozorovatele objekty mají).

Běžné akcelerátory se nijak nestaraly, zda není právě vykreslovaný objekt ve scéně už "schován" za jiným vykresleným objektem. Prostě vykreslily pixel tohoto objektu, podle Z-Bufferu porovnaly, jestli už v daném místě není jiný vykreslený pixel, který se nachází blíže pozorovateli a pokud ano (tzn. vykreslený pixel je jakoby v zákrytu za jiným již vykresleným), byl prostě anulován. To vedlo k "zahození" 50-80% výpočtů, což je plýtvání výkonem.

Při vykreslování objektu (např. zdi) se standardně do Z-Bufferu zapisovaly údaje o hloubce každého vykresleného pixelu této zdi. ATi se pokusila o jednoduché řešení. Obraz byl rozdělen na čtyřúhelníky (tiles = "dlaždice") a krom klasického Z-Bufferu se ještě vytvořil zjednodušený Z-Buffer, který fungoval na úrovni dlaždic - pro každou dlaždici si uložil pouze Z-hodnotu nejvzdálenějšího pixelu, který se na oné dlaždici nacházel. Když pak případně došlo na vykreslování objektu, který se nacházel za zdí, bylo snadné zjistit, jestli má smysl tento objekt zpracovat. Příklad: Dlaždice, na jejíž plochu spadá vykreslovaný objekt, měla nejvyšší Z-hodnotu 20 a polygon objektu např. 30-40-40. Tím bylo okamžitě jasné, že celý polygon bude schován za zdí (je "dál" než zeď) a nemá smysl ho vykreslovat. Tím se ušetřila jak paměťová sběrnice, tak fillrate jádra.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Tato technologie samozřejmě měla mnohé nedostatky. V okamžiku, kdy zpoza zdi vyčuhovala část objektu, musel být zpracován, stejně tak, když jedna ze Z-hodnot zpracovávaného polygonu byla nižší, než hodnota dlaždice (vzdálenost zdi). Další problém nastal v okamžiku, kdy byl engine hry koncipován tak, že vykresloval objekty v opačném pořadí - nejdříve ty nejvzdálenější, pak až ty bližší. To bylo zkrátka zpracováno všechno bez ohledu na viditelnost, protože každý další vykreslený objekt byl blíže a blíže, tím pádem R100 nemohl žádné výpočty eliminovat. Vykreslování "odzadu" se bohudík příliš nepoužívalo (význam mělo jedině při použití tzv. edge anti-aliasingu, jednoho z prvních AA konceptů, který fungoval na principu průhlednosti hran).

Poslední v pořadí byla funkce Fast-Z-Clear, která se starala o vyprázdnění Z-Bufferu. Tradiční akcelerátory po dokončení snímku vyprazdňovaly Z-Buffer tím způsobem, že postupně všechny hodnoty přepsaly nulou. R100 byl koncipován tak, aby dokázal vymazat obsah Z-Bufferu najednou (resp. po velkých úsecích).

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Soubor technologií Hierarchical Z, loseless Z-Compression a Fast-Z-Clear byl marketingově nazván Hyper Z. V praxi znamenala jeho aktivace nárůst výkonu o 10-40% (ve specifických případech i více). 

Tri-texturing, bump-mapping

Každá (ze dvou) pipelines R100 obsahovala tři texturovací jednotky. ATi viděla budoucnost v masivním využití multitexturingu a trilineárně filtrovaných textur. Třemi texturovacími jednotkami si také chtěla zajistit, aby bylo maximum používaných operací provedeno v jediném průchodu.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

S odstupem času se začaly objevovat názory, že tři texturovací jednotky byla zbytečnost, neboť her, které používají trojvrstvý multitexturing je jen velmi málo. To sice pravda je, ale zároveň je dost her, které používají dvojvrstvý multitexturing + trilineární filtraci, které všechny texturovací jednotky využijí. Každá TMU byla schopna zpracovat až dvě textury, takže R100 byl schopen realizovat až šestivrstvý multitexturing.

Radeon 256 byl také první čip, který podporoval všechny tehdy používané režimy bump-mappingu. Embossed BM, Environment BM, DOT3 MB. Logicky nechyběl ani Environment mapping a Cube-mapping.

Radeon 256 a Pixel Shader?

Radeon 256 byl navržen s ohledem na podporu technologie Pixel Shader 1.0. Ten měl vývojářům umožňovat realizaci mnoha zajímavých efektů, pro které nebyla třeba přímá podpora ze strany hardwaru. To se ale ATi škaredě nevyplatilo, protože R100 byl dokončen a vydán ještě před finalizací rozhraní DX8, které mělo podporu Pixel Shaderů přinést. Tehdy na něm s Microsoftem spolupracovala společnost nVidia a na její podnět byl Pixel Shader 1.0 vyřazen ze specifikace DX8 a byl nahrazen verzí 1.1, kterou podporovala GeForce 3.

Tím skončil Pixel Shader nového Radeonu ještě dříve, než začal. Údajně jediná možnost, jak spatřit tuto technologii v akci, byla jakási prezentační OpenGL dema, která používala speciální ovladač. R100 tedy zůstal v mantinelech vymezených specifikacemi DirectX 7/8 a další funkce musely být oželeny.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Technologie prvního Radeonu byly demonstrovány na demu "Radeon's Ark", které je dodnes k dispozici ke stažení na webu ATI. Bezejmenná hrdinka z tohoto dema (někdy "nápaditě" nazývaná Radeon Girl) byla první maskotkou produktu ATi. Ruby to zrovna není, ale na začátek roku 2000 vypadá demo velice dobře.

Další technologie

Cine-efekty

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

V souvislosti s Radeonem byla zmiňována i podpora efektů akumulačního bufferu (soft shadows, soft reflections atp.), ale tyto technologie ATi nikdy příliš nepodtrhovala. Možná jejich implementace a širší použitelnost do jisté míry souvisela využitím PS, ale to už se asi nedozvíme. Každopádně výše zmíněné efekty bylo možné realizovat a ačkoli šlo o nepatně jiný způsob implementace než jaký nabízel 3Dfx T-Buffer, fungovaly korektně (demo ze kterého je screenshot používá využívá akumulačního bufferu v kombinaci s multitexturingem, render target textures a vertex fog).

Charisma Engine 

... mírně ujetý marketingový název označoval T&L engine R100. Ten se dal zařadit do druhé generace T&L a podporoval pár nadstandardních funkcí. Jednou z nich byla key-frame interpolation, do té doby realizovaná softwarově. Tato technologie se používá při animaci objektů - vývojář vytvoří pouze počáteční a koncovou pozici a interpolace mezi oběma body je provedena automaticky hardwarově. HW key-frame interpolation spadá až pod DX8, takže s dobovými DX7 nemohla být v praxi využita.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Ukázka možnosti využití HW key-frame interpolation: faciální animace

Druhou zajímavou technologií byl tzv. vertex skinning, který umožňoval realizaci hladkého povrchu objektu animavaného technologií bones (cílem je, stručně řečeno, aby hýbající se končetiny nevypadaly, jako by se měly každou chvíli ulomit :-)

MPEG, DVD a Video Immersion

ATi nabídla tradičně bezkonkurenční přehrávání videa. Ke všem technologií přítomným na Rage 128 PRO:

  • Color-Space Conversion (poprvé na MACH64 CT/GX)
  • Video-Scaler (poprvé na MACH64 VT, hi-res scaler na Rage II)
  • Motion Compensation (poprvé na Rage II + DVD, vylepšený na Rage PRO)
  • AGP accereation (Rage PRO)
  • HW iDCT (Rage 128 a 128 PRO)
  • HW DVD subpicture (Rage 128 a 128PRO)
  • HW adaptive deinterlacing (Rage 128 a 128PRO)

Přibyl ještě vylepšený video scaler (4/4-tap, podobně jako na Rage 128PRO, ale s ostřejším obrazem při vyšších rozlišeních) a adaptivní deinterlacing schopný vybírat mezi použitými metodami na úrovni pixelu (nikoli jen na úrovni celých snímků, jako u Rage 128 PRO). 

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Weave Deinterlacing

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Bob Deinteralcing

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

R100 Per-pixel adaptive deinteralcing

Přibyla také oficiální podpora pro HD-MPEG2. Jako vždy, i tentokrát byl All-in-Wonder Radeon samozřejmostí, vyšel ale až o něco později.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

První se na trhu objevil tzv. Radeon VIVO, 183MHz 64MB DDR verze s video vstupem i výstupem (Rage Theater). Ten doplňovala levnější 32MB DDR verze (s volitelným TV-out). Za několik měsíců se objevila i 166 resp. 160MHz SDR verze, která nabízela pouze volitelný TV-out a 32-64MB. 

 Radeon VIVO 183MHz64MB DDR
 Radeon DDR166-183MHz32-64MB DDR
 Radeon SDR160MHz32-64MB SDR
 Radeon LE148MHz32MB DDR
 Radeon 7200155MHz64MB SDR

Radeon VIVO / DDR

První vydaná verze měla sloužit jako konkurence GeForce 2 GTS (Radeon měl být původně nasazen proti GeForce 256, ale jak je známo, GeForce 2 přišla dříve, než všichni čekali). Bohužel, přestože se ATi začala s ovladači zlepšovat, byl Radeon natolik složitý čip, že opět zezačátku nefungovalo vše, jak mělo. Výkon byl poměrně nízký a objevovaly se problémy s technologií Hyper Z ("mizející" objekty).

Radeonu by zřejmě pomohlo, kdyby mohl být taktován asynchronně. GeForce 2 byla taktována na 200MHz jádro / 166MHz paměti, Radeon 183 / 183MHz. Kvůli rychlejším (dražším) pamětem nebyl Radeon VIVO nejlevnější záležitost. Pokud by ATi chtěla kvůli výkonu zvýšit takt jádra, musely by být použity ještě dražší paměti. Pokud by ATi chtěla snížit cenu karty a použít levnější paměti, muselo by být podtaktováno i jádro, takže by výkon citelně klesl... vznikl z toho zamotaný kruh, ze kterého nebylo cesty. Byla to celkem škoda, návrh R100 počítal s 200MHz, snadno zvládal i mnohem vyšší frekvence, ale kvůli paměťovému řadiči se musel držet při zemi (je možné přepnout do asynchronního režimu, ale drasticky klesne stabilita karty, obzvlášť ve 3DMarku).

Radeon SDR

SDR verze byla nejčastěji osazena 32MB (160MHz). Jako novinka byla kvůli slabým ovladačům pomalejší, než konkurenční GeForce 2 MX. Nejslušněji se to dá nazvat ostudou softwarového oddělení ATi. Nejí divu, že se karta příliš nerozšířila.

Radeon LE

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2
Radeon LE
- zdroj: http://www.oldi.ru -

...si mnozí pletou s Radeonem VE, ale každé je něco jiného. Radeon LE byl vydán až v létě 2001. Jde o klasický Radeon 256 běžící na nižší frekvenci (148MHz) vybavený 32MB DDR paměti. Největší rozdíl oproti ostatním byl v softwarově deaktivované funkci Hyper Z, což strhlo několik desítek procent na výkonu (Hyper Z se dalo opětovně aktivovat prakticky v jakémkoli tweakeru pro grafické karty). Radeon LE byl další pokus o vytvoření konkurenta pro GeForce 2 MX. Byl poměrně úspěšný, ale na trhu zůstal jen velmi krátce.

Radeon 7200

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2
Radeon 7200
- zdroj: http://www.oldi.ru -

Poslední karta založená na revolučním jádru R100 byla "sedm-tisíc-dvoustovka", která se na trh dostala až na podzim roku 2001 (společně s novou generací). R7200 nesl 64MB SDR paměti, běžel na 155MHz (6ns paměti) a evropská verze podporovala TV-out. Frekvencí sice nepřekonal neúspěšný Radeon SDR, ale v praxi již byl výrazně rychlejší, než GeForce 2 MX a v několika hrách dokázal pokořit i GeForce 2 GTS. Pozdě, ale přece, se objevily slušné ovladače, které dokázaly R100 umístit na takové výkonnostní příčky, pro jaké byl původně určen.

Radeon MAXX

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

ATi měla v záloze i dvoučipovou verzi Radeonu. Bohužel nedospěla dále, než vývoj podobného řešení - 3Dfx Voodoo 5 - 6000 - tedy do stádia prototypů. Škoda. Všimněte si opět duálního výstupu stejně jako v případě první verze Rage Fury MAXX.

A tak skončila éra R100, prvního kanadského GPU, které se stalo asi nejznámějším příkladem toho, jak může dopadnout hardware bez dostatečné softwarové podpory. Revoluční GPU, které mělo nabízet podporu DX8 PixelShaderů a nevídané grafické efekty při plynulé snímkové frekvenci, se nakonec dokázalo prosadit maximálně jako dražší alternativa ke konkurenčnímu mainstreamu.

Radeon (256) VE / 7000 / RV100

V březnu roku 2001 ATi vydala levnější verzi čipu Radeon - RV100. Lišil se především zúženou paměťovou sběrnicí (64bit, podpora DDR zůstala) a odebranou pixel pipeline. RV100 byl vydán jako Radeon VE (později přejmenovaný na 7000).

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Krom paměťové sběrnice a pipeline byla odebrána i T&L jednotka (CharismaEngine), ale ne všechny změny vedly k horšímu. Přibyl sekundární display controller, druhý RAMDAC a TV-out encoder, takže RV100 umožňoval nezávislý výstup na různých zobrazovacích zařízeních, stejně jako dnešní grafické karty. Standardní verze tikala na 166MHz a nesla 32MB DDR.

Radeon VE byl konkurencí pro Matrox G450 a G550, případně pro nejslabší karty ze série GeForce MX. Nebyl příliš oblíbený. Kdo byl zvyklý na Matrox, si nechtěl odvykat, herní karta Radeon VE také nebyl a pro nejlevnější PC sestavy byl zbytečně luxusní.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2
Radeon 7000

Zhruba po půl roce došlo k přejmenování na Radeon 7000 a v podtaktované podobě, jediným výstupem a mnohdy bez chladiče byl nabízen jako nejlevnější grafická karta, která se hodila obzvlášť OEM výrobcům do nejlevnějších sestav.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Appian -  Rushmore: 2x RV100 pro čtyři monitory

RV100 se nakonec prosadil v profesionální grafice. Mohl za to Appian, společnost, která pro ATi pracuje na softwaru HydraVision, a která sama navrhuje profesionální grafické karty s podporou výstupů na více monitorů. Grafická karta Rushmore je založena na dvou čipech RV100, 64MB DDR paměti a nabízí čtyři nezávislé DVI výstupy. Levnější verze (Typhoon) nese jeden RV100 a je světově první grafickou kartu se dvěma nezávislými výstupy. Za zmínku stojí i karta Hurricane, což je klasický AGP Radeon 7000.

RV200 / Radeon 7500

Čip RV200 vyšel až na podzim roku 2001 jako main-streamový doplněk nové generace. Přesto technologicky spadá k prvním Radeonům. RV200 je mixem 3D jádra R100 a display enginu RV100. Další změny už nejsou výrazné. Je to upravený paměťový řadič podporující asynchronní taktování jádra a pamětí, nový výrobní proces (150nm) a pak jeden drobný rozdíl, který se týkal hlavně BIOSu a ovladačů karty - SW podpora N-Patches (TruForm).

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

Radeon 7500 běžel na 290*230MHz a díky rezervám výrobního procesu a možnosti asynchronního taktování se stal velice oblíbenou kartou overclockerů. R7500 konkuroval GeForce 2 Ti a Ultra, později i GeForce 4 MX 440. Začátkem roku 2002 vyšla "LE" verze taktovaná obvykle na 270*200MHz, často méně. Ta byla přímou konkurencí pro GeForce 4 MX 420 a 440 a tuto úlohu plnila až do poloviny roku 2002.

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2
All-in-Wonder Radeon 7500
260 / 180MHz, 64MB 5ns DDR

Tradičně byla vydána i All-in-Wonder verze, který se ale svoji výbavou a schopnostmi příliš nelišila od AIW Radeonu. Zajímavější byl All-in-Wonder VE, který se objevil až v září 2002:

 Historie společností vyrábějících 3D čipy - díl III.: ATi Technologies 2

All-in-Wonder VE

AIW VE je poněkud rozporuplná karta. Od přídomku "VE" by člověk čekal kartu osekanou až do posledního tranzistoru, ale kupodivu se nic takového nestalo. Pasivně chlazený RV200 běží na 260MHz, použité paměti BGA DDR taktované na 250MHz jsou to nejrychlejší, co bylo v kombinaci s čipem RV200 použito. O digitalizaci videosignálu se stará moderní Theater 200 a TV tuner je pochází z nové generace tunerů Philips. Nejzajímavější z celé karty je PCI sběrnice - AIW VE byl určen majitelům starších PC, případně jako upgrade do desek s integrovanou grafikou bez AGP.



 
Komentáře naleznete na konci poslední kapitoly.
372 čtenářů navrhlo autorovi prémii: 185.2Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.