Hlavní stránka Hardware Grafické karty Nvidia Turing: nové technologie pro chytřejší rendering
Nvidia Turing: nové technologie pro chytřejší rendering
autor: Adam Vágner , publikováno 14.9.2018
Nvidia Turing: nové technologie pro chytřejší rendering

Dnešním dnem končí embargo na detaily k nové architektuře Turing a podrobnosti o nových funkcích, které karty nabízejí. Asi jen s málokterou premiérou za celou dobu historie grafických 3D akcelerátorů představili výrobci karet tolik nových technologií najednou.


Dnešním dnem končí embargo na detaily k nové architektuře Turing a podrobnosti o nových funkcích, které karty nabízejí. Je jasné, že všechny budou nejvíc zajímat především výsledky testů výkonu a také poměr cena/výkon, který nové karty nabídnou, ale na ty si ještě pár dní musíme počkat (tedy počkat, Nvidia už uvolnila ovladače pro recenzenty, takže se dá předpokládat, že začnou porůznu prosakovat neoficiální výsledky testů výkonu).

I když se ze srpnové prezentace mohlo zdát, že jedinou podstatnou změnou bude ray tracing a podpora nějakého lepšího vyhlazování, těch novinek je mnohem víc. Nová platforma je novými technologiemi doslova natřískaná. Je jich tolik, že má i Nvidia potíže s tím vše nějak srozumitelně odprezentovat, vysvětlit a připravit všechny podklady. A dalším důvodem pro zdržení může být i to, že i když se na přípravě uvedení zjevně pracuje už dlouho (jen ukázky z Battlefieldu V nebo Tomb Raidera jsme mohli vidět už před měsícem), stále není moc možností, jak nové technologie vyzkoušet v praxi.

Dokument s popisem architektury jsme jej k dispozici až v úterý, a i když se jej pokouším od té doby nějak vstřebat, moc to nejde, takže se ve stručnosti pokusím převyprávět, co půjde, a za pochodu ještě článek dále rozšiřovat a doplňovat. A něco málo ještě dořešíme asi s recenzemi karet.

Zatím tedy půjde spíše o úvod (na wikipedii by byl tento článek nejspíš označený jako pahýl). Pokud vládnete angličtinou, určitě už procházíte zahraniční weby. Najdete asi víc informací, my to máme o něco komplikovanější, protože musíme navíc text překlápět do češtiny (a tentokrát je to výjimečně nepříjemná práce a na následujícím textu je to znát, u spousty věcí si ani nejsem jistý, co přesně se tím kterým termínem v daném kontextu myslí a jak jej překládat).

Doporučit můžu i vývojářský web Nvidie, na kterém se s koncem NDA objevil stručný výtah z dokumentace k architektuře a samotný dokument, z něhož (spolu s přednáškou z novinářské prezentace na Gamesconu) v podstatě vychází většina zveřejněných článků.

Klíčové novinky architektury Turing

V prvním vlně se dočkáme tří modelů karet – RTX 2080 Ti, RTX 2080 a RTX 2070. Každá je postavená na jiném čipu – u RTX 2080 Ti je to TU102 (18,6 miliardy tranzistorů a plocha 754 mm²), RTX 2080 využívá TU104 (13,6 miliardy tranzistorů a 545 mm²) a u RTX 2070 není kupodivu postavená na ořezané verzi TU104, ale na menším jádře TU106 (10,8 miliardy tranzistorů a plocha 445 mm²).

Nvidia Turing: nové technologie pro chytřejší rendering

Nejvýkonnější čip TU102 má 18,6 miliardy tranzistorů a je vyráběný 12nm procesem FFN (FinFET Nvidia). Plnohodnotná varianta je pak v Quaddro RTX 6000.

GeForce RTX 2080 Ti Founders Edition (Nvidií továrně přetaktovaná) nabízí následující:

  • výkon až 14,2 TFLOPS v operacích s jednoduchou přesností (FP32)
  • výkon až 28,5 TFLOPS v operacích s poloviční přesností (FP16)
  • výkon až 14,2 TIPS souběžně s FP
  • výkon až 113,8 Tensor FLOPS
  • 10 Giga Rays/sec
  • 78 Tera RTX-OPS

Profesionální Quadro RTX 6000 má pak aktivní celý čip TU102 a následující parametryí:

  • výkon až 16,3 TFLOPS v operacích s jednoduchou přesností (FP32)
  • výkon až 32,6 TFLOPS v operacích s poloviční přesností (FP16)
  • výkon až 16,3 TIPS souběžně s FP
  • výkon až 130,5 Tensor FLOPS
  • 10 Giga Rays/sec
  • 84 Tera RTX-OPS

Těchto výsledků dosahuje RTX 6000 s grafickým čipem, který má aktivních:

  • 4608 stream procesorů (CUDA Cores)
  • 72 RT Cores
  • 576 Tensor Cores
  • 288 texturovacích jednotek
  • 12 32bitových řadičů pro paměti GDDR6 (celková šířka sběrnice je 384 bitů)

TU102 je složený ze šesti Graphics Processing Clusterů (GPC), 36 Texture Processing Clusterů (TPC) a 72 Streaming Multiprocesorů (SM).

Nvidia Turing: nové technologie pro chytřejší rendering

S každým paměťovým řadičem je svázaných 8 rasterizačních jednotek a 512 KB L2 cache. Plné jádro TU102 tak má 96 ROP a 6144 KB L2 Cache.

Uvnitř každého GPC je dedikovaný raster engine a 36 TPC, uvnitř každého TPC jsou ještě dva SM. Každý SM pak obahuje 64 CUDA Cores (nebo jinak stream procesorů), 8 Tensor Cores a 256KB registr, čtyři texturovací jednotky, 96 KB a L1 cache/sdílené paměti, která může být konfigurovaná na různou kapacitu v závislosti na typu grafické či výpočetní zátěže.

Nvidia Turing: nové technologie pro chytřejší rendering

O akceleraci ray tracingu se stará RT Core processing engine v každém streaming multiprocesoru.

Na schématu ještě schází 144 jednotek pro výpočty FP64 (dvě na každý SM). Běží jen na 1/32 výkonu operací FP32 a v čipu jsou hlavně kvůli kompatibiiltě, aby jakékoliv aplikace využívající operace s FP64 fungovaly.

Uvnitř čipů TU102 a TU104 je také druhá generace rozhraní NVLink původně navrženého pro Voltu.



 
Komentáře naleznete na konci poslední kapitoly.
41 čtenářů navrhlo autorovi prémii: 14.1Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.