radeon-x1800-architektura-cipu-r520
Hardware Článek Radeon X1800 - architektura čipu R520

Radeon X1800 - architektura čipu R520 | Kapitola 4

Petr Štefek a Jiří Souček

Petr Štefek a Jiří Souček

7. 10. 2005 01:00 51

Seznam kapitol

1. Radeon X1800 alias R520 2. Vertex shaders 3. Pixel Shadery 4. Řadič pamětí - ring-bus
5. Anizotropní filtrace 6. Full-Scene AntiAliasing 7. HDR - High Dynamic Range, AVIVO, CrossFire a závěr

Společnost ATi konenčně uvedla dlouho očekávanou sérii Radeonů X1000 a my se na ni dnes podíváme trošku blíže a vysvětlíme si některé její výhody a nevýhody oproti konkurenční architektuře nVidie a jejímu čipu G70. Na recenzi výkonu nového Radeonu si ještě budete muset nějaký ten den počkat, protože naměření tak velkého kvanta dat trvá delší dobu než u běžné recenze. Ale již dnes mohu prozradit, že se je opravdu na co těšit.

Reklama

Paměťový subsystém je u karet Radeon X1800 opět něčím, co si zaslouží velkou pozornost díky kouzelnému slůvku ring-bus. Specifikace uvádějí, že paměťová sběrnice je 512-bitová a někdo by mohl nabýt dojmu, že nové Radeony mají dvojnásobnou paměťovou propustnost oproti konkurenci, kde je stále používán standardní 256-bitový řadič. Není tomu tak, a propustnost paměťového subsystému je určena stále jen 256-bity a frekvencí samotných pamětí. Hned si vysvětlíme proč.

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz


Schéma sběrnice ring-bus

Ring-bus sběrnice u Radeonu X1800 je tvořena dvěma 256-bitovými sub-sběrnicemi, které nezávisle na sobě přenášejí data oběma směry mezi všemi součástmi paměťového subsystému. Vše by se dalo přirovnat k dvěma závodním okruhům s protisměrným provozem, kde se využije toho okruhu, který do cíle doručí danou dodávku (v našem případě data) rychleji. Tyto okruhy vedou kolem samotného jádra a zefektivňují tak komunikaci hledáním nejkratších cest (zde opět zasahuje dispatch procesor). Ring-bus umožňuje pracovat pamětem na mnohem vyšších frekvencích než pracují současné GDDR3. Budoucí typy pamětí GGDR4 a GDDR5 jsou rovněž podporovány, takže ATi nebude muset příliš zasahovat do vnitřního uspořádaní čipu.

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz


Princip paměťového řadiče

Další věcí která prošla zásadní změnou je uspořádání kanálů, kde ATi ustoupila od designu 4x64-bit, protože to velmi omezovalo efektivitu komunikace s jednotlivými čipy, neboť dva z nich byly na sobě víceméně závislé. Tato varianta byla nahrazena designem 8x32-bit, kde 2 kanály jsou připojeny na jednotku zvanou ring-stop, která má na starosti plnit požadavky na přenosy dat mezi jednotkami (klienty). Důležité je ovšem, že ovládá oba čipy zvlášť podle požadavků paměťového řadiče, který vyhodnocuje požadavky klientů seřazuje je podle priority (dopadu na výkon).

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz


Princip fungování sběrnice ring-bus

Celé soukolí pracuje na principu vyhodnocovaní priority požadavků jednotek klientských jednotek na data, které mají zásadní vliv na výkon a tím i rychlost zpracování. Toto vyhodnocování provádí řadič pamětí, který je situován logicky ve středu mezi jednotkami ring-stop. Po zhodnocení priority dochází k poslání dat přes jednotku ring-stop té nejbližšímu klientské jednotce. Další věcí která zefektivňuje komunikaci mezi řadičem a klienty je tzv. Write Crossbar Switch, který zajišťuje optimální (čili nejkratší) cestu k pamětem.

Nejlepší ovšem nakonec. Řadič pamětí je do značné míry programovatelný a jeho chování ovlivňují ovladače karty, takže prostor pro vylepšování efektivity je zde a zřejmě bude i patřičně využit.

Radeon X1800 - architektura čipu R520
i Zdroj: PCTuning.cz


Typy cache

Když po internetu začaly kolovat zvěsti kolem speciální cache pro potřeby paměťového systému, hned jsem si vzpomněl na Xenos aka C1 (Xbox 360) a jeho superrychlou 10MB embeded ram, která odbourává výkonnostní propad při použití 4xFSAA na minimum. Moje nadšení však rychle zchladlo, protože implementace této cache by byla v tomto případě velice těžko proveditelná.

Vše se to totiž točí kolem typu cache, která nepatří mezi typy přímo mapovaných cache, ale patří mezi flexibilnější typ tzv. "plně asociativních cache" (dokáže přistupovat k většímu množství bloků v paměti grafického akcelerátoru). Typ cache má v tomto případě vliv na výkon při maximálním vytížení paměťové sběrnice, což je pro případy, kdy dojde na full-screen antialiasing. Takže všem spekulacím o malých propadech při FSAA zavdala příčinu právě tato cache, což před uvedením nebylo zcela jasné.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama