Nvidia Turing: nové technologie pro chytřejší rendering

Nvidia Turing: nové technologie pro chytřejší rendering | Kapitola 6

Seznam kapitol

1. Architektura Turing oficiálně 2. Nové Streaming Multiprocesory 3. Tensor Cores, GDDR6, GPU Boost 4. Pokroky ve stínování (shadingu) 5. Deep Learning, NVLink, USB-C, výstupy

6. GeForce RTX 2080 Ti vs. GTX 1080 Ti v parametrech 7. GeForce RTX 2080 vs. GTX 1080 v parametrech 8. GeForce RTX 2070 vs GTX 1070 v parametrech 9. Snímky z prezentace

Dnešním dnem končí embargo na detaily k nové architektuře Turing a podrobnosti o nových funkcích, které karty nabízejí. Asi jen s málokterou premiérou za celou dobu historie grafických 3D akcelerátorů představili výrobci karet tolik nových technologií najednou.

Reklama

GeForce RTX 2080 Ti vs GTX 1080 Ti v parametrech

Na úvod následujících tabulek, ve kterých srovnává Nvidia parametry aktuálních modelů s modely minulé generace si nemůžu odpustit malé šťouchnutí – není to zrovna férové srovnání, pokud vezmeme v úvahu cenu nových karet. Kvůli ní by se slušelo spíše srovnávat RTX 2080 s GTX 1080 Ti a RTX 2070 s GTX 1080.

Jenom připomenu, že RTX 2080 Ti je postavená na největším čipu TU102, který má některé jednotky deaktivované a v „plné palbě“ jej prozatím pořídíte jenom v podobě Quadro RTX 6000.

Tabulky jso prakticky kompletně ještě v originále v angličtině, nebyl čas je přepisovat O:-).

GPU Features	GTX 1080Ti	RTX 2080 Ti	Quadro 6000	Quadro RTX 6000
Architecture	Pascal	Turing	Pascal	Turing
GPCs	6	6	6	6
TPCs	28	34	30	36
SMs	28	68	30	72
CUDA Cores / SM	128	64	128	64
CUDA Cores / GPU	3584	4352	3840	4608
Tensor Cores / SM	NA	8	NA	8
Tensor Cores / GPU	NA	544	NA	576
RT Cores	NA	68	NA	72
GPU Base Clock MHz (Reference / Founders Edition)	1480 / 1480	1350 / 1350	1506	1455
GPU Boost Clock MHz (Reference / Founders Edition)	1582 / 1582	1545 / 1635	1645	1770
RTX-OPS (Tera-OPS) (Reference / Founders Edition)	11,3 / 11,3	76 / 78	NA	84
Rays Cast (Giga Rays/sec) (Reference / Founders Edition)	1,1 / 1,1	10 / 10	NA	10
Peak FP32 TFLOPS (Reference/Founders Edition)	11,3 / 11,3	13,4 / 14,2	12,6	16,3
Peak INT32 TIPS (Reference/Founders Edition)	NA	13,4 / 14,2	NA	16,3
Peak FP16 TFLOPS (Reference/Founders Edition)	NA	26,9 / 28,5	NA	32,6
Peak FP16 Tensor TFLOPS with FP16 Accumulate (Reference/Founders Edition)	NA	107,6 / 113,8	NA	130,5
Peak FP16 Tensor TFLOPS with FP32 Accumulate (Reference/Founders Edition)	NA	53,8 / 56,9	NA	130,5
Peak INT8 Tensor TOPS (Reference/Founders Edition)	NA	215,2 / 227,7	NA	261
Peak INT4 Tensor TOPS (Reference/Founders Edition)	NA	430,3 / 455,4	NA	522
Frame Buffer Memory Size and Type	11264 MB GDDR5X	11264 MB GDDR6	24576 MB GDDR5X	24576 MB GDDR6
Memory Interface	352 b.	352 b.	384 b.	384 b.
Memory Clock (Data Rate)	11 Gbps	14 Gbps	9 Gbps	14 Gbps
Memory Bandwidth (GB/sec)	484	616	432	672
ROPs	88	88	96	96
Texture Units	224	272	240	288
Texel Fill-rate (Gigatexels/sec)	354,4 / 354,4	420,2 / 444,7	395	510
L2 Cache Size	2816 KB	5632 KB	3072 KB	6144 KB
Register File Size/SM	256 KB	256 KB	256 KB	256 KB
Register File Size/GPU	7168 KB	17408 KB	7680 KB	18432 KB
TDP (Reference/Founders Edition)	250 / 250 W	250 / 260 W	250 W	260 W
Transistor Count	12 mld.	18,6 mld.	12 mld.	18,6 mld.
Die Size	471	754	471	754
Manufacturing Process	16 nm	12 nm FFN	16 nm	12 nm FFN
Note: Peak TFLOPS, TIPS, and TOPS rates are based on GPU Boost Clock. Power figure represents Graphics Card TDP only. Note that use of the VirtualLink™/USB Type-C™ connector requires up to an additional 35 W of power that is not represented in this power figure.