fyzika-podle-ati-ageia-physx-killer
Hardware Článek Fyzika podle ATi - Ageia PhysX "killer"?

Fyzika podle ATi - Ageia PhysX "killer"?

Štefek Petr

Štefek Petr

16. 6. 2006 01:00 64

V dnešním článku se podíváme na přicházející řešení společnosti ATi pro reálnou fyziku, které má konkurovat společnosti Ageia e jejímu produktu PhysX. Informací je zatím poskrovnu, ale budeme se snažit podělit se s vámi i o to málo, co ATi zveřejnilo na Computexu 2006.

Reklama

Dnešním trendem oblasti nejvýkonnějších herních počítačů je využití 2 a více grafických karet v jednom systému, bez kterých si nejnovější herní pecky na maximální detaily hráč prostě neužije. Na výběr zde máme dvě konkurenční řešení společností ATi a nVidia, kde druhá jmenovaná společnost zašla až tak daleko, že nejnáročnějším (a nejbohatším) hráčům nabízí možnost 4 high-endových karet v jednom systému.

Nově rozvíjejícím se trendem je nástup akcelerátorů fyziky v počítačových hrách. Prvním samostatným Akcelerátorem je Ageia PhysX, na kterou jsme se podívali v jednom z minulých článků. Ageia ale není jedinou společností, která se zabývá urychlováním fyziky ve hrách. Své do mlýna přidají i společnosti ATi a nVidia. ATi se možností akcelerace fyziky na svých kartách Radeon nijak netajila ani před Computexem 2006, kde uvedla první konkrétní čísla a principy tohoto systému.

Musím říct, že pokud ATi ve svých marketingových materiálech nemá moc velké oči (rozuměj nelže), tak má Ageia vážný problém a nad jejím zbrusu novým výrobkem se stahují mračna. Pro porovnání uvedu, že ATI tvrdí, že obyčejný Radeon X1600 má dvojnásobný výkon oproti Ageia PhysX akcelerátoru a k tomu ještě přidává třetinovou až poloviční cenu, což je pro Ageiu velká rána. Navíc systém ATi využívá široce rozšířeného fyzikálního enginu Havok, který nalezneme ve většině moderních her.

ATi a možnosti CrossFire

Společnost ATi narozdíl od nVidie dovoluje využít 2 nebo více karet s rozdílným výkonem a grafickým jádrem. To znamená, že do jednoho systému teoreticky můžete umístit Radeon X1600 spolu s Radeonem X1900 a využívat je při akceleraci her. Stejně dobře je ke CrossFire systému se dvěma kartami Radeon X1900 možno pořídit Radeon X1600 (a výše), který bude zastávat funkci fyzikálního akcelerátoru.

Poznámka: Dovedu si představit, že našinec se stávající kartou Radeon X1600Pro/XT sáhne při upgradu po Radeonu X1900XT/XTX a starou kartu si místo prodeje ponechá jako samostatný fyzikální akcelerátor a ušetří tím pádem nemalé prostředky za nákup Ageia PhysX.

Fyzika podle ATi - Ageia PhysX "killer"?
i Zdroj: PCTuning.cz


2xRadeon X1900XTX + Radeon X1600

Pokud se ATi překoná a všechny kombinace starých a nových karet budou fungovat v jednom systému, tak ja nám slibuje, tak mohou vzniknout opravdu zajímávé možnosti pro upgrade. Nyní je samozřejmě ještě potřeba her, kde bych tento potenciál mohli využít, neboť zatím sledujeme jen technologická dema. Unreal Tournament 2007 a další hry na tomto enginu mají krom podpory Ageia PhysX slíbenu i podporu Havok enginu, takže se máme opravdu na co těšit.

Fyzika podle ATi - Ageia PhysX "killer"?
i Zdroj: PCTuning.cz


Schéma možného zapojení

Fyzika v počítačových hrách

Herní fyzika je dobrým příkladem situace kde je třeba počítat mnoho paralelních výpočtů, což představují pro ilustraci různé kameny, úlomky nebo částečky které jsou v interakci s hráčem (rozuměj virtuální postavou ve hře) a okolním prostředím.  Dále zde máme všemožné deformace, kapaliny nebo kouřové efekty, které jsou zvláště výpočetně náročné, což můžeme pozorovat i v dnešních hrách na značném zpomalení FPS. Právě zpomalení se chceme použitím samostatného fyzikálního akcelerátoru vyhnout. Procesory byť dvoujádrové nemohou v těchto výpočetních  úlohách zastat tyto nastupující obyvatelé našich počítačových skříni, to je prostě daň za stále větší reálnost počítačových her.

Poznámka: Athlon 64 či Pentium D je několikanásobně pomalejší při akceleraci fyziky než obyčejný Radeon X1600/X1800/X1900 díky dynamic branching unit, která zajišťuje maximální efektivitu využití výpočetního času grafického jádra Radeonů X1000.

Fyzika podle ATi - Ageia PhysX "killer"?
i Zdroj: PCTuning.cz


Příklady využití

Klíčem k tomuto problému je rozčlenění do několika úrovní. První úrovní je přibližné vymezení míst kde dojde ke kolizím (Coarse collision decetion stage). Dalším krokem je přesné vymezení konkrétních míst, kde dojde k interakci s dalším objektem (Detailed collision decetion stage). Posledním krokem je určení reakce objektů podle přibližovací rychlosti, materiálů a kolizního směru (Collision response stage). Tím se ušetří značné množství výpočtů o nekolidujících objektů, kde postačí jednoduchý shader a výpočetní síla se tak využije pouze tam, kde je jí třeba.

Fyzika podle ATi - Ageia PhysX "killer"?
i Zdroj: PCTuning.cz


Ilustrační obrázek - Multi Stage

Moderní grafická jádra jsou schopna operovat s mnohem větším množstvím objektů a bodů než klasické procesory, což znamená ve výsledku mnohem větší rychlost pro tento typ výpočtů. Protože se procesor zbaví značně výpočetně náročné fyziky, může se soustředit například na vysoce sofistikovanou A.I., což jednoznačně přispěje ke zlepšení herního požitku při hraní s počítačem řízenými protivníky.

Nové Radeony X1000 mohou efektivně a rychle určovat body, kde dochází ke kolizím díky možnosti pracovat s thready o malých velikostech (4x4), kde díky dynamic branching nové Radeony excelují, což je dáno především jejich pokročilou architekturou.

Dynamic branching dovoluje přeskakovat (nevykonávat) části kódu v shaderu, které nejsou nezbytně nutné ke korektnímu zobrazení (v našem případě určení bodů kolize) scény a tím značně šetří výpočetní výkon a čas. Jak vidíme na obrázku tak je velmi žádoucí aby vlákno mělo co nejmenší počet pixelů (a tím i plochu), neboť právě velikost plochy se kterou se počítá je rozhodující pro efektivitu.

Charakteristickým znakem pro fyzikální výpočty je jejich vysoká aritmetická náročnost, což znamená, že na pro každý kousek vstupních dat musí být realizováno velké množství výpočetních operací. U grafických jader jsou vstupní data načteny texturovacími jednotkami a aritmetické operace vykonávají shader (pixel a vertex) jednotky. Například u jádra R580 najdeme 48 pixel shaderových procesorů, což je velmi dobrý základ pro tento typ výpočtů.

Ilustrační obrázek níže ukazuje jak důležitá je velikost jednotlivých threadů (vláken) při využití dynamic branchingu k výpočtů fyziky za pomocí GPU (Graphic Processong Unit). Tmavé čtverečky indikují místa, kde v současném snímku nedojde ke kolizi (pro tyto části jsou spočítány pouze pozice a rychlost). Oranžové čtverečky naproti tomu indikují pravděpodobnou kolizi a pravě zde je potřeba využít algoritmu pro přesnou detekci možné kolize.  Červené čtverečky ukazují místa kde s nejvyšší možnou pravděpodobností ke kolizi dojde a zde je použití celého "multi stage" postupu pro určení kolize zcela nezbytné.

Fyzika podle ATi - Ageia PhysX "killer"?
i Zdroj: PCTuning.cz


Ilustrační obrázek - Dynamic branching

Pokud chceme vidět výkon řešení ATi musíme se spokojit zatím pouze s materiály pdf, takže je nutné brát výsledky s rezervou. Ovšem je nutné dodat, že společnost ATi co se týká výkonový výsledků (podotýkám výkonových, protože jinde to až tak dokonalé nebylo) Radeonů X1000 nikdy moc "nelhala" ani v pdf materiálech. Pokud se podíváme na výkony jádra R580 (48 pixelových procesorů), tak jsou skutečně ohromující a náskok nad R520 (16 pixelových procesorů) je zcela zřejmý.

nVidia se svými jádry G70 a G71 podle ATi úspěchy slavit nebude, ale to je skutečně jen spekulace, která je založena na poněkud zastaralé architektuře těchto jader a testech ATi(nedošlo k podstatné změně od GeForce 6). Pokud má dynamic branching opravdu až tak stěžejní vliv na tyto operace, tak má nVidia o starost navíc.

Nutno podotknout, že společnost nVidia zatím o podobném řešení mlčí, ale její karty samozřejmě podporu minimálně enginu Havok mají díky Shader Modelu 3.0. Samozřejmě realita je vždycky poněkud střídmější, o čemž jsme se už nejednou přesvědčili. Velká škoda je, že v grafech nejsou zahrnuty výsledky Ageia PhysX, které podle informací výše nepředstavuje pro ATi radeony X1000 rovněž problém (neuvedením výsledků zavdává ATi ke spekulacím, že to tak horké nebude).

Fyzika podle ATi - Ageia PhysX "killer"?
i Zdroj: PCTuning.cz


Výkonový graf z pdf materiálů ATi

Závěr

Zatím se můžeme pouze dohadovat o tom, jaký vliv bude mít to či ono řešení na rychlost a reálnost her, ale sledovat nastupující technologie je v pravdě velmi zajímavé. Jak se zdá, tak Ageia PhysX bude mít přinejmenším velmi silnou konkurenci, ne-li "killera" svého nového produktu PhysX, který je velmi drahý a v současné době velmi nevyužitelný. ATi se svým řešením je mnohem flexibilnější díky využití fyzikálního enginu Havok již dnes. V budoucnu po příchodu DirectX 10 se rozdíly mezi oběma produkty smažou a podpora těchto "urychlovačů" fyziky bude standardem rozhraní.

Jediným vážným nedostatkem je spotřeba takových 3 grafických karet Radeon X1900, která bude opravdu neúnosná. Ovšem, kdo má na tři grafické karty z této cenové kategorie, jistě ušetří i na odpovídající zdroj. Pro klasické uživatele vidím hlavní přednost v možnosti využití low-endových karet ATi Radeon X1000 jako plnohodnotných akcelerátorů, které se svým výkonem budou minimálně rovnat o mnoho dražšímu akcelerátoru Ageia PhysX.

Reklama
Reklama

Komentáře

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

Google Seznam
Reklama
Reklama