| ATi X1900 a problém s 3DMarkem 06 |
| autor: Štefek Petr , publikováno 30.1.2006 |
Ti z vás, kteří pravidelně sledují dění v oblasti grafických karet, jistě ví, že společnost ATi má teď problémy s vizuální kvalitou v novém benchmarku společnosti Futuremark.
Na zahraničních i českých fórech se již od zjištění problému vedou vleklé debaty, co za problémy s vizuální kvalitou na kartách série ATi X1900 v 3DMarku 06 (konkrétně demu Forest) stojí. Dále přetrvávají spekulace o výkonu karet X1800/1900, které by měly teoreticky dosahovat vyššího výkonu, než prakticky mají díky velmi rychlým pixel shaderům. Jedna strana tvrdí, že Futuremark optimalizoval benchmark pro nVidii, což osobně vidím jako čirou demagogii a ta druhá, že ATi má problém způsobený ovladači Catalyst či možným problémem na hardwarové úrovni.
Po zhodnocení části shaderu nejmenovaným programátorem vychází najevo, že benchmark optimalizován pro nVidii pravděpodobně není a programátoři se drželi velmi striktně specifikací DirectX 9.0c. Za vším stojí použití Partial Precision (PP) výpočtů, kterých je v shaderech 3DMarku 06 hojně využíváno, což je pro ATi velký problém, protože její čipy Partial Precision prostě neumí a využívají pouze Full Precision, čili vše se počítá ve 128-bitech a výsledný výkon je tak nižší, než při použití Partial Precision. To ovšem nemění nic na faktu, že benchmark je zcela v zásadách DirectX 9.0c. ATi si usmyslelo, že čas již vyzrál natolik, že bude používat jen plnou 128-bitovou přesnost, ale jak je vidět, tak si tím možná zavařilo na problém a jen čas ukáže, jak hojně budou vývojáři her Partial Precision využívat (3Dmark 06 je ukázkou opravdu hustého nasazení PP). Nvidia se může v klidu posadit a čekat, neboť její čipy zvládají Partial Precision už od NV40. V podstatě lze říci, že obraz ATi díky Full Precison (128-bit) výpočtům bude vždy lepší než u Partial Precision u Nvidie, která rovněž umí plné 128-bitové výpočty, ale zde těží hlavně z PP.
Co se týká problému s vizuální kvalitou v demu Forest (3DMark 06), tak vše je způsobeno pravděpodobně špatnou kompilací shaderu, kde je využívána Fetch4 (poprvé intergována u čipu R580) a 24-bit DST. Tento problém bude podle ATi odstraněn v ovladačích Catalyst 6.2, které budou prvními WHQL ovladači pro Radeony X1900 (R580). Například technologie Fetch4 je velmi přínosná pro zpracování shadow-map, ale v tomto případě díky neodladěným ovladačům způsobila spíše problém.
Po zhodnocení části shaderu nejmenovaným programátorem vychází najevo, že benchmark optimalizován pro nVidii pravděpodobně není a programátoři se drželi velmi striktně specifikací DirectX 9.0c. Za vším stojí použití Partial Precision (PP) výpočtů, kterých je v shaderech 3DMarku 06 hojně využíváno, což je pro ATi velký problém, protože její čipy Partial Precision prostě neumí a využívají pouze Full Precision, čili vše se počítá ve 128-bitech a výsledný výkon je tak nižší, než při použití Partial Precision. To ovšem nemění nic na faktu, že benchmark je zcela v zásadách DirectX 9.0c. ATi si usmyslelo, že čas již vyzrál natolik, že bude používat jen plnou 128-bitovou přesnost, ale jak je vidět, tak si tím možná zavařilo na problém a jen čas ukáže, jak hojně budou vývojáři her Partial Precision využívat (3Dmark 06 je ukázkou opravdu hustého nasazení PP). Nvidia se může v klidu posadit a čekat, neboť její čipy zvládají Partial Precision už od NV40. V podstatě lze říci, že obraz ATi díky Full Precison (128-bit) výpočtům bude vždy lepší než u Partial Precision u Nvidie, která rovněž umí plné 128-bitové výpočty, ale zde těží hlavně z PP.
Co se týká problému s vizuální kvalitou v demu Forest (3DMark 06), tak vše je způsobeno pravděpodobně špatnou kompilací shaderu, kde je využívána Fetch4 (poprvé intergována u čipu R580) a 24-bit DST. Tento problém bude podle ATi odstraněn v ovladačích Catalyst 6.2, které budou prvními WHQL ovladači pro Radeony X1900 (R580). Například technologie Fetch4 je velmi přínosná pro zpracování shadow-map, ale v tomto případě díky neodladěným ovladačům způsobila spíše problém.
Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz
Další články v kategorii
- Toshiba AT10LE-A: Tablet s výkonným čipsetem nVidia Tegra 4
- Lenovo uvedlo konvertibilní notebook Yoga 11S – bez Tegry a Windows RT
- Transend představuje mSATA SSD s označením MSM610
- BenQ představilo 3D projektor W770ST pro promítání z krátké vzdálenosti
- Dell uvádí na trh novou 2U Precision rackovou stanici

Takto to vypada, ze ma ATI jak rezervy v obrazove kvalite, tak ve vykonu.
Vi nekdo, jaky ma vliv uziti PP na vykon?
Teoreticky by to mohlo dopadnout tak, ze by pro spravenych Catalystech byl obraz ATI lepsi (diky Full Precison) nez u nVidie? Nebo je to jedno v momente, kdy kod uvazuje pouze s PP a karta pocitajici na Full uz tomu nepomuze?
PP je vyrazne mene narocny...proto tipuju, ze kdyby nvidia pouzivala jen FP, tak by vysledky mela nizsi...jenze to neomlouva ATi ze PP proste jeji cipy neumi...je to problem pro vykon nikoliv pro obraz.
Příkl.: je rozdíl mezi číslem třeba 1,2 a číslem 1,20000000 ? Ne, neni.
Zaver: Pokud by nVidia neumela PP, tak by jeji vykon byl nizsi...pokud by PP umela ATi, tak vykon u radeonu by byl vyssi...doufam, ze souhlasis?:-)
Tak prosim kaslime na taketo "umele testy" a venujme sa veciam ktore naozaj vyuzivame.
S tim PP vs FP je to jednoduche. Zalezi na algoritmu a a taky na tom, co se pocita. Obecne plati, ze treba pro vypocty s barvou bohate staci PP (vysledek se na konci pipeline stejne vetsinou orizne), kdezto treba vypocty s texturovymi souradnicemi vyzaduji FP. Pokud si je programator (nebo kompilator) jisty, ze v danem pripade staci PP, je dobre pouzit PP, protoze FP stejne vyssi kvalitu neprinese.
Presnost se da na nVidia HW volit pro kazdou instrukci v shaderu zvlast (od NV40 ovsem nemusi PP vzdy znamenat urychleni), takze se mensi presnost da pouzit presne tam, kde je to vhodne.
Dulezite je ovsem to orezavani. Pak je jedno , co je na 15tem miste, zda je cislo periodicke apod. A cela tahle diskuze o presnosti FP cisel je tedy bezpredmetna
Redakcia - neuvazujete o specialnej kolonke nazvanej napr. "kotel", kde by ste kazdy den dali jednu temu a kde by sa mohli ludia do syta vyhadat a vyargumentovat?Bolo by to vcelku zaujimave a v diskusiach pod clankami by bolo miesto len na komenty k danej teme.
Takže se divím, že Futuremark použil optimalizaci, která se v nových hrách už nepoužívá, výhledově se s ní nepočítá (preciznost bude pevně stanovena) a přináší výhody jen pro jednoho výrobce. Nemá náhodou 3DMark ukazovat výkon v nových technologiích a ne v těch starých?
A dále by mě zajímalo, proč je v pořádku a Futuremarkem schvalováno použití FP16 (PP) místo FP32 pro čipy nVidie a naopak pro R520 (která nepodporuje nestandardní D24X8 formát) není povolený 16bit formát pro shadow-maps a Futuremark R520 nutí používat plný 32bit formát pro shadow-map... Myslím, že to mluví samo za sebe.
FP16 vypocty v shaderech jsou ovsem no problem. Pokud shader pocita jen ALU operace s barvou, nedojde k naprosto zadne zmene barvy vysledneho pixelu, takze cely shader muze s klidem pouzivat FP16. Navic, optimalizovat presnost muze dnes i kompilator/optimizer v driverech.
Ovsem je pravda, ze pecliva volba presnosti byla nutna predevsim pro NV3x. NV4x a G7x jsou jiz plne optimalizovane na FP32 a mensi presnost zvysi vykon jen v urcitych pripadech.
Vy opravdu myslite, ze 6600gt je lepsi karta nez x850? A zkousel jste Serious Sam 2 s HDR na 6600gt?
(ted koukam na test, ze ktereho vychazi lepe 6200 s 256MB Turbo Cache nez 2x6600gt se 128MB ve SLI, divne)
No vidis prisel jsi na to sam...tak to udelej nez zacnes osocovat me, ze to mam spatne nebo neco manipuluju. xBit treba nameril v 06ce 4700 bodu na X1900, coz je trosku malo...osobne jsem nenarazil na web, ktery by mel vysledky pod 5200 bodu...z cehoz vyplyva, ze kazdy se nekdy utne:-)...tot k tem stalym prupovidkam o testech.
Nevim, jak to dopadlo Vam, ale podle testu, ktere jsem zahledl, to nevypadalo prilis koukatelne natoz hratelne.
Tim chci jen naznacit, ze v tomhle pomerovani muze karta, ktera bude slaba (napriklad) s HDR i bez nej hodnocena stejne nebo lepe nez karta, ktera sice HDR podporovat nebude, ale bez nej je celkem da hraci relativne slusny pozitek.
Jak to udelat lepe nevim, jen poznamenavam, ze tohle urcite neni dokonale.
Ale zas si nejsem zcela jisty, jestli je to opravdu ten "teoreticky herni vykon". (ja uz proste budu asi brblat vzdy)