Hlavní stránka Hardware Grafické karty Architektura Fermi - Nvidia GF100 se představuje
Architektura Fermi - Nvidia GF100 se představuje
autor: Z. Obermaier , publikováno 18.1.2010
Architektura Fermi - Nvidia GF100 se představuje

Nová generace grafických karet Nvidia byla už několikrát odložena a každá novinka vzbudí rozruch. Velká většina dosavadních informací byla spíše spekulativního rázu, ale ve dnešním článku vám konečně můžeme nabídnou konkrétní fakta o architektuře a vlastnostech čipu. Získali jsme je přímo na konferenci Deep Dive v Las Vegas.


Architektura Fermi - Nvidia GF100 se představuje

Když přišla na trh G80 znamenala první krok k HPC computingu, ovšem jako první svého druhu trpěla vážnými problémy s efektivitou a nedořešenou architekturou. Jako herní GPU uspěla, ovšem v HPC se mnoho neprosadila. Druhá verze G200 vyřešila spoustu prvotních problémů, ovšem zůstala také na půli cesty s mnohými překážkami v masovém rozšíření do HPC sféry. GF100 by mělo být konečně plným řešením zbavených předchozích nedostatků starších čipů. Spousta algoritmů nedokáže pracovat se sdílenou pamětí cache, na což tvůrci u GF100 mysleli. Nové uspořádání pamětí cache udělali z GPU už téměř CPU, na kterém lze spouštět aplikace, které na starší generaci GPU spustit nešly nebo s brutálním dopadem na výkon.

Architektura Fermi - Nvidia GF100 se představuje

Důležitou změnou je také přepracování sheduleru, který přepíná mezi výpočetní a grafickou úlohou. V tomto směru byly G80 a G200 neohrabané a jádro přepínalo ve snímkové frekvenci obrazu. U GF100 šel výrobce dál a mezi úlohami je přepínáno každých 20 mikrosekund a ještě jsou zpracovávány paralelně.

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Jádro GF100 je plně kompatibilní a podporuje všechny hlavní výpočetní rozhraní dnešní doby. Aplikace může být vytvořena v C++ nebo napsáno pro PhysX nebo OpenCL, všechny budou na GPU fungovat. Pro GF100 není problém počítat v jeden okamžik kolize PhysX, renderovat scénu v DirectX 11 a zároveň počítat třeba AI v DirectCompute. Díky rychlému přepínání mezi úlohami je to zvládnutelné. Druhý obrázek pak popisuje možnosti budoucího využití výpočetního výkonu ve hrách. Následuje několik příkladů využití pro budoucí hry v nekomentovaných slajdech.

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Zde se zastavme, demo kapaliny je možné stáhnout ze stránek výrobce a ozkoušet si můžete sami. Zajímavý je nárůst výkonu GF100 proti G200 o více než 100 procent. Je to způsobeno opět pamětí cache v jádru, s jejíž starší verzí v G200 byla simulace kapalin spustitelná jen s velkým dopadem na výkon. Ve hře Cryostasis dosáhla G200 výkonu 30 fps při simulaci 30 000 částic vody, jádro GF100 atakuje hodnotu 140 fps při simulaci 130 000 částic vody. Také nepřehlédněte poznámku, že v nové verzi PhysX 3.0 (nyní máme 2.8.6) lze počítat s navýšením výkonu o dalších 40-60 procent.

Architektura Fermi - Nvidia GF100 se představuje

K výpočetním možnostem se ještě vrací poslední graf. Ukazuje nám, že GF100 je ve všech testovaných scénářích, minimálně dvakrát ale spíše třikrát výkonnější než G200. Testováno bylo ve hře Dark Void, Fluid demu, Raytracingu a AI testu. Podívejte se na dále na video a obrázky z real-time raytracingu:

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Architektura Fermi - Nvidia GF100 se představuje

Pro zvětšení klikněte na obrázky (mají minimálně 5MB)

Architektura Fermi - Nvidia GF100 se představuje

Předposledním obrázkem této kapitoly si ještě jednou shrňme všechny hlavní znaky jádra GF100. V Geometry realismu je jádro až osmkrát výkonnější než jeho předchůdce. Nabízí také až 32xCSAA vyhlazování a třikrát vyšší výkon v shadow-mappingu. Také výpočetní výkon pro hry narostl čtyřikrát proti G200. Poslední řádek říká, že jde o nejvýkonnější GPU co kdy bylo vyrobeno a v nejvyšším nastavení (zde 1920x1200) s vyhlazováním 8xAA je až dvakrát výkonnější než GeForce GTX 285 (tady není konkrétní karta, na starších slajdech byla zmíněná).

Architektura Fermi - Nvidia GF100 se představuje

Na úplný závěr této kapitoly, pro vás mám lahůdku. Zdali pak poznáte co to je? Oficiálně jde o PhysX plugin do Autodesk 3DS Max, ovšem podívejte se jak se soubor jmenuje. Ano tušíte správně, jde s největší pravděpodobností o model pro Mafia 2, která bude skutečně postavena na fyzice PhysX a byla na CES také tak prezentována, zde je důkaz.



 
Komentáře naleznete na konci poslední kapitoly.
245 čtenářů navrhlo autorovi prémii: 43.3Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.