Nvidia Turing: nové technologie pro chytřejší rendering | Kapitola 6
Seznam kapitol
Dnešním dnem končí embargo na detaily k nové architektuře Turing a podrobnosti o nových funkcích, které karty nabízejí. Asi jen s málokterou premiérou za celou dobu historie grafických 3D akcelerátorů představili výrobci karet tolik nových technologií najednou.
GeForce RTX 2080 Ti vs GTX 1080 Ti v parametrech
Na úvod následujících tabulek, ve kterých srovnává Nvidia parametry aktuálních modelů s modely minulé generace si nemůžu odpustit malé šťouchnutí – není to zrovna férové srovnání, pokud vezmeme v úvahu cenu nových karet. Kvůli ní by se slušelo spíše srovnávat RTX 2080 s GTX 1080 Ti a RTX 2070 s GTX 1080.
Jenom připomenu, že RTX 2080 Ti je postavená na největším čipu TU102, který má některé jednotky deaktivované a v „plné palbě“ jej prozatím pořídíte jenom v podobě Quadro RTX 6000.
Tabulky jso prakticky kompletně ještě v originále v angličtině, nebyl čas je přepisovat O:-).
GPU Features | GTX 1080Ti | RTX 2080 Ti | Quadro 6000 | Quadro RTX 6000 |
Architecture | Pascal | Turing | Pascal | Turing |
GPCs | 6 | 6 | 6 | 6 |
TPCs | 28 | 34 | 30 | 36 |
SMs | 28 | 68 | 30 | 72 |
CUDA Cores / SM | 128 | 64 | 128 | 64 |
CUDA Cores / GPU | 3584 | 4352 | 3840 | 4608 |
Tensor Cores / SM | NA | 8 | NA | 8 |
Tensor Cores / GPU | NA | 544 | NA | 576 |
RT Cores | NA | 68 | NA | 72 |
GPU Base Clock MHz (Reference / Founders Edition) | 1480 / 1480 | 1350 / 1350 | 1506 | 1455 |
GPU Boost Clock MHz (Reference / Founders Edition) | 1582 / 1582 | 1545 / 1635 | 1645 | 1770 |
RTX-OPS (Tera-OPS) (Reference / Founders Edition) | 11,3 / 11,3 | 76 / 78 | NA | 84 |
Rays Cast (Giga Rays/sec) (Reference / Founders Edition) | 1,1 / 1,1 | 10 / 10 | NA | 10 |
Peak FP32 TFLOPS (Reference/Founders Edition) | 11,3 / 11,3 | 13,4 / 14,2 | 12,6 | 16,3 |
Peak INT32 TIPS (Reference/Founders Edition) | NA | 13,4 / 14,2 | NA | 16,3 |
Peak FP16 TFLOPS (Reference/Founders Edition) | NA | 26,9 / 28,5 | NA | 32,6 |
Peak FP16 Tensor TFLOPS with FP16 Accumulate (Reference/Founders Edition) | NA | 107,6 / 113,8 | NA | 130,5 |
Peak FP16 Tensor TFLOPS with FP32 Accumulate (Reference/Founders Edition) | NA | 53,8 / 56,9 | NA | 130,5 |
Peak INT8 Tensor TOPS (Reference/Founders Edition) | NA | 215,2 / 227,7 | NA | 261 |
Peak INT4 Tensor TOPS (Reference/Founders Edition) | NA | 430,3 / 455,4 | NA | 522 |
Frame Buffer Memory Size and Type | 11264 MB GDDR5X | 11264 MB GDDR6 | 24576 MB GDDR5X | 24576 MB GDDR6 |
Memory Interface | 352 b. | 352 b. | 384 b. | 384 b. |
Memory Clock (Data Rate) | 11 Gbps | 14 Gbps | 9 Gbps | 14 Gbps |
Memory Bandwidth (GB/sec) | 484 | 616 | 432 | 672 |
ROPs | 88 | 88 | 96 | 96 |
Texture Units | 224 | 272 | 240 | 288 |
Texel Fill-rate (Gigatexels/sec) | 354,4 / 354,4 | 420,2 / 444,7 | 395 | 510 |
L2 Cache Size | 2816 KB | 5632 KB | 3072 KB | 6144 KB |
Register File Size/SM | 256 KB | 256 KB | 256 KB | 256 KB |
Register File Size/GPU | 7168 KB | 17408 KB | 7680 KB | 18432 KB |
TDP (Reference/Founders Edition) | 250 / 250 W | 250 / 260 W | 250 W | 260 W |
Transistor Count | 12 mld. | 18,6 mld. | 12 mld. | 18,6 mld. |
Die Size | 471 | 754 | 471 | 754 |
Manufacturing Process | 16 nm | 12 nm FFN | 16 nm | 12 nm FFN |
Note: Peak TFLOPS, TIPS, and TOPS rates are based on GPU Boost Clock. Power figure represents Graphics Card TDP only. Note that use of the VirtualLink™/USB Type-C™ connector requires up to an additional 35 W of power that is not represented in this power figure. |