Architektura Fermi - Nvidia GF100 se představuje |
autor: Z. Obermaier , publikováno 18.1.2010 |
Nová generace grafických karet Nvidia byla už několikrát odložena a každá novinka vzbudí rozruch. Velká většina dosavadních informací byla spíše spekulativního rázu, ale ve dnešním článku vám konečně můžeme nabídnou konkrétní fakta o architektuře a vlastnostech čipu. Získali jsme je přímo na konferenci Deep Dive v Las Vegas.
Ještě než napíši závěrečná slova, je zde malý prostor pro informaci o výkonu. Pokud se o grafické karty zajímáte, tak jste určitě zaregistrovali videa na internetu, kde je vidět výkon GeForce 300 ve hře Far Cry 2. Proti sobě tam stojí dva počítače, jeden s GeForce 300 a druhý s GeForce GTX 285. Testovalo se v rozlišení 1920x1200 a nastavením 16xAF a 4xAA. Výsledek karty s jádrem GF100 je na videu zhruba na úrovni GeForce GTX 295, musím vám ale říci, že osazená karta neměla finální frekvence a nevíme, jestli finální verze bude rychlejší nebo pomalejší. Počet CUDA Core byl stejně jako na finální verzi 512, ovšem takty byly pravděpodobně nižší, než budou mít finální produkty. Přeci jenom se jedná o testovací sampl, který měl být prezentován a prioritou byla stabilita. Je také zřejmé, že toto video se na veřejnost nikdy dostat nemělo, ukazuje výkon nefinálního produktu. Dá se tedy počítat s tím, co jsem napsal v úvodu. Od nejvyššího modelu s jedním GF100 se dá čekat minimálně výkon GeForce GTX 295, o kolik ji poté překoná ale dnes nikdo neumí říci.
Shrnout nějak dnešní článek je těžké, už podruhé nám NVIDIA poslala slajdy ve kterých v podstatě nic neprozradila. Podruhé se věnujeme architektuře Fermi, ale stále nemáme ponětí o skutečném herním výkonu nadcházejících grafických karet. Tím obecně NVIDIA uvádí magazíny a novináře do nezáviděníhodné situace, kdy jejich čtenáři očekávali alespoň něco hmatatelného. Pochopil bych podobnou mediální snahu, kdyby bylo možné zveřejnit alespoň některá čísla o výkonu, ale takhle? Dobře, dozvěděli jsme se o teoretickém výkonu proti G200, a ze dvou grafů si můžeme i něco myslet o výkonu vůči konkurenci, na druhý článek o kartách, které přijdou na trh až za dva měsíce, je to opravdu celkem málo.
Tento článek opět rozdmýchá vášně a stejně to bude na všech jiných webech. Čtenáři čekali alespoň něco konkrétního, ale kromě technických detailů o jádře a pěkně nahuštěné prezentace nedostali v podstatě nic konkrétního. Neměla si NVIDIA tento článek nechat až těsně před uvedením? Já myslím, že by to bylo rozumnější. I přes mou jistou skepsi, že měla konference na CES a poté i světová medializace zveřejněných materiálů téměř nulovou výpovědní hodnotu, musím říci, že architektura Fermi pro hráče vypadá slibně. Výrobce se poučil z nedostatků starších čipů a pokud se potvrdí teoretická měření z našeho článku i v praxi, půjde o velice výkonné grafické jádro s množstvím využití. Jeho pravá síla se ale ukáže ale až v herních titulech příští generace, které doopravdy využíjí všech výhod nového hardware. Já jsem hlavně zvědav na výkon s vysokým vyhlazováním, stejně jako na vylepšenou kvalitu obrazu.
Bohužel nic dalšího není povoleno zveřejnit, stejně toho dále moc nevíme. Nezbývá než čekat, až bude rozhodnuto o dni vydání a karty dorazí na test. Na prezentaci nám bylo slíbeno, že se tak stane do měsíc. Nechme se překvapit. Podle všeho by se tentokrát už uvedení posunout nemělo a březen je prý už závazné datum. O stejném termínu hovoří i výrobci grafických karet, takže se zřejmě potvrdí i oficiálně. Čekají nás zkrátka ještě dva dlouhé měsíce, než bude mystérium GF100 kompletně odhaleno. Čekat budeme stejně jako vy.
Ona totiž NVIDIA skutečně nemá kam spěchat, kdo chtěl nový Radeon, tak ho má a další zákazníci stále firmě věří a vyčkávají. Je zvláštní jak silnou pozici NVIDIA na trhu má. Na serveru Techpowerup udělali anketu, do které přispělo už 30 000 čtenářů. Ptali se, zdali příští grafika bude Radeon HD 5000, nebo ne. Téměř třetina (28 procent) respondentů čeká, co vytasí NVIDIA. Dalších 19 procent čtenářů by dalo přednost Radeonu HD 5850 a 17 procent kartě Radeon HD 5870. Duální kartu Radeon HD5970 by si pořídil 9 procent lidí. Ostatně podívejte se do ankety sami, i když NVIDIA na trhu stále nic nemá, drží si stále vysoký počet příznivců.
Na závěr jsem chtěl ještě dopsat takovou menší úvahu na téma mentality diskutujících a nesmyslných táborů fanatiků, obhajujících slepě jednu či druhou značku. Nakonec jsem tuto stať odložil na svůj Blog, kde si ji můžete přečíst. Jde o čistě můj pohled na věc, ne oficiální stanovisko magazínu, tedy umístění mimo bude vhodnější a lépe stravitelné.
Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz
P.S.: dúfam, že tu do obeda zase zakážeš komentáre ...
(vycházim z toho že ati nezačala podobnej čip vynalézat a když to nvidii trvalo 4 roky tak +/- ati to bude trvat stejně)
nějaká nová zpráva, za tuto situaci musí být NVIDIA fanouškům opravdu vděčná. Jediná fotografie jejich nadcházející karty sklízí pomalu víc pozornosti než reálné testy nových Radeonů, které se pomalu ztrácí v hlubinách internet
.."Fermi zastinila dokonce i 32 nm CPU od Intela".. to si teda opravdu nemyslim.
ATI udela vykonou kartu a uvedla ji. Fermi tady neni a porad se o ni mluvi v superlativech. PROC !!!
Nebude nakonec launch Fermi, pri datumu vydani konkurence v podobe ATi 6XXX
Ale ATI sa nechalo pocut že jadro 6XXX vyda s novym vyrobnym procesom a ze to možno ani tento rok nebude, lebo konkurencia na nich netlaci a že jadro 5XXX este nepovedalo posledne slovo a ma slusnu rezervu na pretaktovanie keby trebalo
Co som pozeral tak ATI ma k uvedeniu Fermi pritravene OC5870 ktore si hurkutaju na 1GHz
Hlavně že jim to v demu na CES spadlo
Tezko soudit, ja se na Fermi tesim jako HWfan, NV kolem toho ale dela hrozne tanecky... A DIKY ZA CLANEK !!!!!
P.S.: dúfam, že tu do obeda zase zakážeš komentáre ...
a pokud máš mít v počítači dvě grafiky(resp jádra) kde si každé řekne o 200W nebo jedno jádro co si řekne o 250W a má stejný výkon +nemá problémy se škálováním a kompatibilitou ....pak se pořád jeví dva jádra jako správná cesta??
Bylo by to spíš jak mít dva vícejádrové procesory an desce a to má dnes kolik lidí?
"Shrnout nějak dnešní článek je těžké, už podruhé nám NVIDIA poslala slajdy ve kterých v podstatě nic neprozradila." ...opět nic víc než hromada spekulací, Obr v podstatě spojil všechny svoje předchozí "novinky" do jednoho "článku", ale jak se on sám vyjádřil, jde mu hlavně o návštěvnost, prachy a dělat si legraci ze čtenářů PCT ;) ...až se mu debata přestane líbit, tak ji zase pro jistotu celou zakáže
v angličtině zdatným jedincům doporučuji přečíst článek: http://www.semiaccurate.com/2010/01/17/nvidia-gf100-takes-280w-and-unmanufacturable/, který považuji za celkem objektivní zhodnocení.
Autor se v článku pozastavuje také nad tím proč neporovnali GF100 s HD5970, která by byla jak cenou, tak spotřebou GF100 bližší. Jde o to, že pokud 1 AMD teselační jednotka proti 16 NVIDIA teselačním jednotkám je ve vybraných případech jenom 6x vyšší výkon, tak by v porovnání s HD5970 byla GF100 celkem pozadu ;)
AMD oproti tomu má sice jenom jednu teselační jednotku, ovšem HW a oddělenou od odstatních výpočtů a ta samá jednotka je jak u HD5870 tak třeba u HD5670. u HD5970 jsou samozřejmě dvě, páč má dva chipy, takže hrubý teselační výkon HD5970 je dvojnásobný oproti HD5870 a tudíž větší jak GF100 a proto to porovnání s HD5870 ;)
No a 2x1 = 2. Stale to nie je 6.
V praxi to tak samozřejmě nebude, protože FPS nejsou lineárně závyslé na počtu trianglů, ale jsem hodně zvědavý na to, jak se budou v budoucnu karty testovat. Pokud si počet tri při tesselaci řídí karta sama, jak je recenzent donutí ke stejnému počtu tri (= stejné kvalitě obrazu), aby mohl objektivně změřit FPS???
PS: Zdeňku to si opravdu myslíš že z tohodle udělat duální kartu??? Jak se chladi 500W na jedné desce??
PS: Zdeňku to si opravdu myslíš že z tohodle udělat duální kartu??? Jak se chladi 500W na jedné desce??
To je nepochopena ironie. Vysvetlim. Fermi tady neni, Ati tady je. Nez tady bude Fermi, tak se snad i mars zazelena.
32nm technologie je dle meho to nej co nas mohlo do roku 2010 potkat, mluit se o ni bude a nic ji nezastini. Bez "vyborneho" CPU se ani Fermi (ktera tu neni) neobejde, to je jasne.
Displacement mapping je nejaky obecny nazev, ktery zahrnuje mnoho technik "posunu" pixelu z jeho puvodnich souradnic. Ale v kontextu rozlisujme co je displacement pixelu v obrazku a co je displacement jeste nepromitnuteho pixelu na povrchu modelu. UV/Normal mapping nebo Parallax mapping posovaji pixely na urovni pixel shaderu a je to jen nejake napodobeni, ktere funguje jen pro urcite mensi uhly pohledu vuci normale povrchu (pixelu).
Vsechno ostatni se povetsinou dela zmenou geometrie (aslespon co se herni grafiky tyka) a to je opravdovy displacement, protoze je videt proste i z boku!
Ohanet se nazvama umi kazdej - ale rad bych videl, kdo je zde schopnej vysvetlit, co ktera technika dela. A ze napriklad Parallax Occlusion Mapping je zjednodusene jenon posun a zmena nasvetlovani pixelu vcetne uvazeni stineni pixelu jinymi pixely (vytvarime virtualni hrboly, ktere by meli i stinit na povrch).
Ad Teselace - ano, nic noveho pod sluncem. Svete div se ona jde delat i softwarove. ATI i nVidia meli teselaci hardwarovou uz kdysi davno. Dokonce v dobach s pevnou pipeline se s teselaci koketovalo. Drive ale slo zejmena o tzv Uniform teselaci - a tady se snad mohu domnivat, ze slo prave o ATI True Form, ktera proste kazdou plochu rozdelila na tri...temer mechanicky. Ta zajimava vec, prichazi az dnes - relane pouzitelny vykon grafickych karet pro vypocet Adaptivni teselace. (adaptivni - napriklad muze vytvaret detaily tam, kde jsou potreba, pripadne ubirat tam, kde to videt neni)
A technologicky nejde opet o nic co by bylo nezname, ostatne nVidia o tom mluvi jako o proveditelnem uz od dob GeForce 6800 (coz byl docela slusny technologicky milnik), ale na realne pouzivani ve vetsi mire do ted karty nemeli dostatek vykonu. (ostatne oni nemaji ani ted .. ale aspon to neco trosku dela)
Lidi zkuste prispivat aspon konstruktivne, diskuze ma neco prinest a neni mistem, kam muzu umistit kazde svoje moudro pro potechu ostatnich...
Lidi zkuste prispivat aspon konstruktivne, diskuze ma neco prinest a neni mistem, kam muzu umistit kazde svoje moudro pro potechu ostatnich...
Neni vubec jasne co je porovnavano (osobne tipuju top vzorek GF100 a neco s vykonem GF240 aby to vypadalo dobre).
Ohledne technologii je clanek ok , ale cokoli co se mota kolem fermi je jen vareni z vody protoze nemate/nemuzete podat nejake podlozene informace ohledne vykonu.
Každý kdo prezentuje svůj produkt ho vychválí až do nebes, použije taková testy kde srovnání s konkurencí dopadne v jejich prospěch nejlépe.
Řekněte že to jen hrajete, bůhví třeba kvůli penězům či čtenosti, a pochopím to, ale jak to, že v zahraničí to konkurenční weby dělat nemusejí?
AMD může jít s 5mil grafikami do háje, Nvidia má již 10mil čipů při 20% výtěžnosti, tomu se říká umění!
Ty jsi herec
Ocenil bych spíše rozdíly oproti konkurenci / starším čipům - trochu ukázat, že rozumíte architektuře čipu a skutečné hloubce grafiky.
Taková informace "no to je hezké, jenže to samé dělají radeony už teď, ... nebo třeba něco takového se na konkurenční architektuře udělat nedá... tohle je jen nobl nový název pro něco co čipy umí posledních 5 generací o 5% pomaleji... atd.." - to by bylo něco - prostě byste ukázali, že z architektury něco umíte vyvodit, že tomu skutečně rozumíte. Takhle mi to přijde jen velmi povrchní převyprávění obsahu slidu.
Každopádně mě mrzí, že slajdy v kapitole "Jak se dělají hry" nejsou klikací. Docela bych rád viděl například již zmíněný Empire.
Tessellaci dělá AMD, dříve ATI deset let, jen pro Nvidii je to novost, neboť nejenom o tom je DX11.
Každopádně mě mrzí, že slajdy v kapitole "Jak se dělají hry" nejsou klikací. Docela bych rád viděl například již zmíněný Empire.
A také bych chtěl říct, že upřímně lituji Vaška Vlčka a další redaktory PCTuningu, kteří musí číst a mazat ty výblitky individuí jako jsou Stejskal nebo Federmann. Nechápu proč takoví lidé už dávno nedostali BAN.
Ocenil bych spíše rozdíly oproti konkurenci / starším čipům - trochu ukázat, že rozumíte architektuře čipu a skutečné hloubce grafiky.
Taková informace "no to je hezké, jenže to samé dělají radeony už teď, ... nebo třeba něco takového se na konkurenční architektuře udělat nedá... tohle je jen nobl nový název pro něco co čipy umí posledních 5 generací o 5% pomaleji... atd.." - to by bylo něco - prostě byste ukázali, že z architektury něco umíte vyvodit, že tomu skutečně rozumíte. Takhle mi to přijde jen velmi povrchní převyprávění obsahu slidu.
Četl jsi to vůbec?
Světe div se - četl. Ani u jediného tam není žádná skutečně technická informace, nic technicky podloženého - jediné závěry (u tesselace) jsou udělány z grafu - nikoliv z architektury.
Keby bol u AMD v unigine heaven limitom výkonu slabý tesselator, tak by zrejme HD5870 a HD5770 mali rovnaké výsledky, čo nemajú.
Možná čekám, ale nemyslím, že je to zázrak o čem mluvíme. Jste odborníci ne? Tak nějaké odborné spekulace a odůvodněné závěry byste měli umět vyvodit. Posoudit rozsah změn architektury oproti stávajícímu stereotypu, vyvodit nějaké závěry ze změn průběhu ... (tohle opatření uleví tomuhle bottlenecku, tohle naopak bottleneck přidá, tohle smrdí kolizema tady ... a podobně). Právě v tomhle mi přijde, že je ideální místo ukázat jak to znáte - s prominutím nadělat měření a popsat grafy dokáže opička (opičky z AMD reklamy prominou).
Podle toho jednoho slajdu má výkon až 6x vyšší, musíš si uvědomit, že Unigine není jen o tesselaci:-) Když má karta 10x víc paměti, tak také není nárůst fps o 1000%;-)
tak 99% příspěvků zde sou totální hovadiny tak proč taky jednu nenapsat
::: Obrazek s potvorou - je sice hezkou genezi modelu, ale zavadejici. V druhe fazi "jakoze polygonova" sit tam vypada porad stejne, takze vlastne ani neni poradne videt, jak byly polygony deleny/zjemneny/teselovany. V te same fazi se najednou misto klasickeho plocheho osvetlovani objevuje krasne zaoblene osvetlovani (Blinn-Phong nebo neco podobneho s interpolaci normaly). Pokud by hladke osvetleni nebylo zmenou osvetlovani, mela by uz v tehle fazi postava tolik polygonu, ze by zadneho UV/Normal mapovani nebylo treba. Nasledujici faze (treti) proste jen nema na sobe vykreslenou tu sit. Ve ctvrte je nanesena displacement mapa ale dost pravdepodobne i UV/Normal mapa.
::::
Jo tohle by me taky docela zajimalo, co bude datove vetsi, seznam vrcholu a indexu, nebo detailni textura pouzita pro normalove/displacement mapovani?
Pokud zavedu jednotku 4B (32bitu), ktera mi staci na vyjadreni jednoho vrcholu, jedne normaly, jednoho indexu a jednoho barevneho pixelu. Tri (vrchol, normala, index) jednotky pripadnou na jeden vrchol geometrie. Model o 30K vrcholech (10K trojuhelniku) bude mit tedy nejakych 3*30K*4B = CCA 90K*4B. Mapa/textura o rozmerech 512x512 bude mit 512*512*4B = CCA 262K*4B. ...... ted bych poprosil vsechny vedatory a spekulanty co se tu ohani znalostmi, aby rekli proc je mapa pro displacement "datove malou informaci", kdyz vychazi ze neni.
::::
::::
::::
:::: a vubec, nechci delat ze sebe machra a z autora blba. Ani jedno neni pravda. Snad by se jen sluselo trosku vice to nasprtat, nebo alespon lepe popsat (pokud problem neni ve spravnem pochopeni). Kritika by mela povzbuzovat k lepsim vysledkum priste ... alespon doufam.
::::
::::
:::: a vubec, nechci delat ze sebe machra a z autora blba. Ani jedno neni pravda. Snad by se jen sluselo trosku vice to nasprtat, nebo alespon lepe popsat (pokud problem neni ve spravnem pochopeni). Kritika by mela povzbuzovat k lepsim vysledkum priste ... alespon doufam.
Ta zasadni uspora je v tak proste veci jako je komprese. Diky komprese textur, ktere dosahuji kompresnich pomeru nekde mezi 4-20:1. (bezne je jestl se nepletu neco mezi 4-
Při srovnání záleží víceméně na tom, jaká čísla si vybereš. Obecně tu nehovoříme o 30K vertexů vs. 512x512 mapě, ale zhruba 50M vertexů vs. 2048x2048 mapa, to jsou trochu reálnější čísla z praxe.
Jeste bych se pozastavil nad temi 50M vrcholu a 2048x2048 (coz sem kdysi poslal po OpenGL do starsi nVidia grafiky a ta se mohla zblaznit, pac tak velke textury/mapy jeste relativne nedavno nebyly pouzitelne). Tady trosku nevim jak praxe je myslena? Finalni modely pro hry? Unreal Engine 3 pocita s asi 5-20 viditelnejma "vykreslitelnejma" modelama o asi 3-12K trojuhelniku. Detailni model, podle ktereho vytvari normalove mapy (preprocessing) maji kolem 1-8M vrcholu (nevykreslitelne mnozstvi). Mapy pak u takto detailniho modelu maji pak tech az 2048^2. Ja si dokonce vzpominam pred nejakou dobou velke chvastani (a ted nevim jestli iD ci Epicu), ze oni zvladaji i neco lehce prez Mega vrcholu najednou. Takze, neco sem spatne pochopil? O jake praxi to mluvime?
Pro samotne vertex a normaly se pouziva spise ceckovy float (32bitu), double se sice pro nektere vypocty hodi, ale u te geometrie to zrovna neni potreba (alespon sem na to nikde nenarazil v praktickem pouziti).
Takze jeste jednou (zjednodusene). Vrchol = 3x4B; Normala = 3x4B; Index = 4B (normala se udava i jako ctyrslozkovy vector..ale to nechme bejt tedka,vse je normalizovane, posledni slozka neni treba..a index muze byt i mensi, ale zarovname to). Pak bude vypocet samozrejme (3+3+1)*30K*4B = cca 210K*4B (mapa mela cca 262K*4B). Porad se
Pokud je tady myslena treba 8/16bitova vyskova mapa pro displacement, tak to si dovedu predstavit. Hromada veci se da dopocitat, nejake zakladni osvetleni prez gradienty atd atd. Smer posunuti by se bral dle normaly plochy, na ktere se dana mapa nachazi atd. Ale citim v tom i nektera omezeni (nemoznost si smer displacementu udat a podobne) - ostatne to bylo zmineno, je to vhodne na pravidelne "vystupky".
Co se tyka ostatnich map, treba normalovych map, tak tam je tech dat vice. Klasicky uvazovane RGB/XYZ mapy, s barvou ci souradnici, mohou mit bitu i min, ale pod 24bitu bych to moc neuvazoval. Snad pro ucely toho zjednoduseneho vypoctu mohu nechat ty 4B.
-:-:-:-
-:-:-:-
Ešte k tej dispacement mape... "displacement mapa je definována pozicí vrcholů" zrejme znamená, že ona naozaj ovplyvní geometriu, čiže diery po guľkách na dverách bude vidieť aj z boku. Aspoň to povedal jeden grafik...
A k tomu, ako sa robia decaly... všetko to závisí na konkrétnom prípade, niekde je dispacement mapa zbytočná, niekde nie. Ak by išlo o relatívne veľkoplošný efekt (do dverí sa spraví diera/ostrá prehĺbenina po guľke/inom projektile, ale zároveň sa dvere prehnú na relatívne veľkej ploche), tak to už bude pri dostatočnom ohle z oboch strán. Na zadnú stranu toto prehnutie nemôžeš prilepiť, lebo to by narušilo plynulosť povrchu z hľadiska textúr... Aspoň to si myslím ja.
Presne tak, v clanku jsou jenom rozvedene hlavni body z prezentace. Ale bohuzel i to vysvetleni je velky PR.
Treba ty kecy o teselaci a DM ve filmech =) chacha...
AMD oproti tomu má sice jenom jednu teselační jednotku, ovšem HW a oddělenou od odstatních výpočtů a ta samá jednotka je jak u HD5870 tak třeba u HD5670. u HD5970 jsou samozřejmě dvě, páč má dva chipy, takže hrubý teselační výkon HD5970 je dvojnásobný oproti HD5870 a tudíž větší jak GF100 a proto to porovnání s HD5870 ;)
Tohle jsem nepochopil, asi ta demagogie, jak může klesat počet něčeho, co ta karta (údajně) nemá?
Že by to bylo proto, aby se při úniku poznal člověk, kterému ty slajdy unikly?
Jo a příroda ji má 13,5mld roků, takže nic nového. Nvidia ji má ve všech GPU odjakživa…
Tohle jsem nepochopil, asi ta demagogie, jak může klesat počet něčeho, co ta karta (údajně) nemá?
a ty máš nějakej neodbytnej pocit, že si prostě musíš tu grafickou kartu koupit, abys byl in? já teda ne...já si novou grafickou kurtu požizuju až ju potřebuju, nebo spíš rovnou až přestavuju či obměňuju celé PC, no kupodivu s C2D a GTX260 vydržím ještě zatraceně dlouho, Sony a MS maj v plánu kvačit na svých současných konzolích ještě několik let-a do té doby se grafika ve hrách stejně nikam nepohne, protože je třeba, aby to fungovalo multiplatformově, o těch pár nesmyslných "prej DX11" efektech ve hrách jako Dirt2 či posledním Stalkeru nemá smysl mluvit, jsou k ničemu a bez porovnávacích statických screenů nejsou ani rozpoznatelný
Hezky den vsem.
nojo to vidim jako vy dva co? pro : "jindra72 , lukasg"
no kdyz jsme zrovna u te kapitoly 6, tak je tam velmi zvlastni ta fotka te karty, okraj PCB a mustky pro SLI vypadaji dost pochybne, to je nejaka maketa nebo co to je? Jsou uz vubec vzorky, co vypadaji jako standartni karta, videl je nekso na vlastni oci a funkcni?