Radeon X1800 - architektura čipu R520
Seznam kapitol
Společnost ATi konenčně uvedla dlouho očekávanou sérii Radeonů X1000 a my se na ni dnes podíváme trošku blíže a vysvětlíme si některé její výhody a nevýhody oproti konkurenční architektuře nVidie a jejímu čipu G70. Na recenzi výkonu nového Radeonu si ještě budete muset nějaký ten den počkat, protože naměření tak velkého kvanta dat trvá delší dobu než u běžné recenze. Ale již dnes mohu prozradit, že se je opravdu na co těšit.
Po dlouhém otálení ATi konečně uvolnila nové série Radeonu X1000, které nás budou provázet napříč celou nabídkou ATi od segmentu low-endu až po high-end. Série X1800 je určena pro high-endový segment a jsou v ní oficiálně pouze dva modely těchto karet. Není vyloučeno, že časem přibudou další modely s jedním vypnutým výpočetním blokem nebo nižšími frekvencemi.
Vše se točí kolem nového jádra R520, které je použito na všech high-endových kartách ATi Radeon X1800. Nové jádro provázely od počátku problémy s výtěžností. ATi zvládlo nový 90nm výrobní proces na ostatních jádrech poměrně dobře (C1, RV530 a RV515), ale samotné high-endové jádro R520 ne a ne splnit očekávání vysokých frekvencí. Tento problém byl způsoben především v TSMC, kteří nebyli schopni zajistit dostatečnou výtěžnost a ATi se proto obrátilo i na UMC, které podle prvních informací bude rovněž vyrábět čipy pro společnost.
Další produktové řady ATi mají označení X1600 a X1300. Řada X1600 je specifická tím, že její jádro RV530 je derivací teprve připravovaného jádra R580 a má poněkud jiné vnitřní uspořádání. R580 bude ještě o něco blíže architektuře čipu ATi Xenos s unifikovanou architekturou. Série X1300 je založena na čipu RV515, který je v podstatě 1/4 jádra R520. Tyto série si rozebereme hned po recenzi Radeonu X1800.
Poznámka: Uživatelé často spekulují o tom, že ATi nechtěla uvést čip podobný C1 (Xenos - Xbox 360) i na PC pouze z marketingových důvodů. Pravda ovšem je, že ve stávající verzi DirectX není pro unifikovanou architekturu místo. Tato vymoženost bude pro PC dostupná až v následující verzi DirectX 10. Pravděpodobně se bud jednat o jádro R600. Nvidia je rozhodnuta vydat se v budoucnu podobnou cestou.
Karty řady X1800:
Radeon X1800XT - karta má k dispozici novější respin (5) jádra R520, které je schopno pracovat na vyšších frekvencích než starší respin (4), který je použit u Radeonu X1800XL. Čip obsluhuje 512MB GDDR, kterou tvoří 8 512Mbitových čipů s časováním 1.2ns, což znamená, že mají rezervu oproti stanovenému taktu 1500MHz ještě 100MHz. Podpora DirectX 9.0c je již samozřejmostí. Samotné jádro pracuje na frekvenci 625MHz a rezerva pro přetaktování tady podle prvních zkušeností ještě je.
Radeon X1800XL - je levnější a slabším bratříčkem Radeonu X1800XT. V tomto případě ATi sáhlo k pouhému snížení taktů, aby tak mohlo využít i čipy, které neobstojí u Radeonu X1800XT. Karta má k dispozici opět 512MB GDDR3 s časováním 1.4ns a opět se jedná o 512Mbitové čipy. Paměti pracují na taktu 1000MHz, což je hluboko pod možnostmi použitých paměťových čipů. Jádro pracuje na frekvenci 500MHz a má stejný počet "pipelines".
Referenční karta Radeon X1800XT
Podle prvních benchmarků je jasné, že mezi kartami Radeon X1800XL a Radeonem X1800XT je docela podstatný rozdíl ve výkonu, který často neodpovídá zmenšených frekvencím. Podle všeho by se mohlo jednat o problém ovladačů nebo opravdu velkou limitací R520 paměťovou propustností.
Specifikace dnešního a minulého high-endu:
Radeon X850XT PE | GeForce 7800GTX | Radeon X1800XT | GeForce 6800Ultra | |
VPU | R480 | G70 | R520 | NV45 |
Výrobní proces | 0.13 µm TSMC | 0.11 µm TSMC | 0.09 µm TSMC (?) | 0.13 µm TSMC low-k |
Technologie čipu | 256-bit | 256-bit | 256-bit | 256-bit |
Počet transistorů | 160 milionů | 302 milionů | 320 milionů | 222 milionů |
Paměťová sběrnice | 256-bit DDR (I - III) | 256-bit DDR (I - III) | 256-bit DDR (I - IV) | 256-bit DDR (I - III) |
Paměť | 512 MB | 256 MB | 512 MB | 512 MB |
Takt čipu | 540 MHz | 430 MHz | 625 MHz | 400 MHz |
Takt pamětí | 590 MHz (1180 DDR) | 600 MHz (1200 DDR) | 750 MHz (1500 DDR) | 550 MHz (1100 DDR) |
Paměťová propustnost | 37. 8GB/s | 38.4 GB/s | 48 GB/s | 35.2 GB/s |
Fill-rate (single-texturing) | 8600 Mpixel/s | 6900 Mpixel/s | 10000 Mpixel/s | 6400 Mpixel/s |
Fill-rate (multi-texturing) | 8600 Mtexel/s | 10300 Mtexel/s | 10000 Mtexel/s | 6400 Mtexel/s |
Vertex Shader | 6 | 8 | 8 | 6 |
Počet Pixel Pipelines | 16 | 24 | 16 | 16 |
Počet TMU | 16 | 24 | 16 | 16 |
Vertex Shader verze | 2.0 (b) | 3.0 | 3.0 | 3.0 |
Pixel Shader verze | 2.0 (b) | 3.0 | 3.0 | 3.0 |
DirectX | 9.0 b | 9.0 c | 9.0 c | 9.0 c |
AntiAliasing | 2-4x RGMS 6x Sparse | 2-4x RGMS 2x OGSS | 2-4x RGMS 6x Sparse | 2-4x RGMS 2x OGSS |
AA speciality | Temporal AA, Centroid Sampling | kombinace SS+MS | Temporal AA, Centroid Sampling | kombinace SS+MS |
Integrované RAMDACy | 2x 400MHz | 2x 400MHz | 2x 400MHz | 2x 400MHz |
Další technologie | 3Dc Compression Temporal AA | UltraShadow Transparent AA Intelli Sample 4.0 | 3Dc Compression Temporal AA Adaptive AA | 3Dc Compression Temporal AA |
Architektura řady X1000
Radeon X1800
Celá série je založena na jádru, které má označení R520 a jeho výroba je uskutečňována 90nm výrobním procesem, což zaručuje menší spotřebu materiálu a vyšší frekvence samotného VPU. R520 obsahuje přibližně 320 miliónů tranzistorů, což je ze všech grafických čipů absolutně nejvíce (G70 má 302 miliónů tranzistorů). Přes vyšší počet tranzistorů je R520 menší než G70 (110nm) právě díky 90nm technologii.
Jádro R520
Podle průřezu jádrem je skutečně vidět 4 fyzické "quad core" umístěné v různých částech čipu. Pro ilustraci jsou vybarveny barevně (obrázek převzat z http://www.cupidity.f9.co.uk/). Z toho plyne, že paralelizace je u toho čipu mnohem menší než u předchozích generací.
Jádro R520 - vybarvená čtveřice "quad core"
Samotná architektura je značně odlišná od toho, co známe z minulých sérií Radeonů či GeForce. Je to spíše takové malé přiblížení unifikované architektuře ATi Xenos z Xboxu 360. Neinformovaný člověk by mohl být zaskočen tím, že R520 má pouze 16 pixel pipelines, což je však velmi zavádějící, protože právě čast pro zpracování pixelů je řešena velmi novátorský způsobem, který je vysvětlen v samostatné kapitole.
Architektura jádra R520
Novotou je také zánik ROP jednotek tak jak je známe z dřívějších architektur. Ty jsou teď nazvány Render Back-End a jsou schopny zpracovat více operací v jednom taktu. Tato jednotka (integruje více jednotek ROP) je zodpovědná za zpracování FSAA, kde se u ATi můžeme setkat s variantami MSAA s programovatelnou mřížkou. Více v kapitole o anti-aliasingu.