Jak na přetaktování - Athlon II a Phenom II pro AM3
i Zdroj: PCTuning.cz
Návody Článek Jak na přetaktování - Athlon II a Phenom II pro AM3

Jak na přetaktování - Athlon II a Phenom II pro AM3 | Kapitola 2

Z. Obermaier

Z. Obermaier

14. 12. 2009 03:00 33

Seznam kapitol

1. Použité komponenty 2. Základní principy taktování AMD CPU 3. Odemykání jader CPU 4. Nastavení a otestování 5. Vliv frekvence CPU-NB na výkon 6. Lehký rozjezd - 3,3 GHz (Athlon II)
7. Přitápíme na 3,6 - 3,8 GHz (Athlon II) 8. Finišujeme - skoro 4 GHz (Athlon II) 9. Bonus - 5,3 GHz s kapalným dusíkem 10. Taktování Phenom II X2 Black Edition 11. Vliv taktování na výkon 12. Závěr a doporučení

Vánoce jsou už za dveřmi a možná se mnohým z vás objeví pod stromkem i nová sestava, třeba s procesorem od AMD. Abychom opět pokročili v našem seriálu o přetaktování, dnešní díl bude věnován právě procesorům do patice AM3. Podíváme se jak se taktuje, odemykají jádra a co vše má u této platformy vliv na výkon.

Reklama

Přetaktování procesorů AMD je dosti podobné dnešním konkurenčním Core i7, mnoho aspektů také odkazuje k legendárním Athlonům 64, ovšem zásadní změny se přeci jenom staly. Kdo měl Athlon 64, bude si zřejmě vědět rady i s novými 45nm čipy, pro jistotu si ale tuto problematiku zopakujeme a nejdůležitější momenty připomeneme. Nejprve tedy krapet teorie ..

Jak na přetaktování - Athlon II a Phenom II pro AM3
i Zdroj: PCTuning.cz

Frekvence severního můstku (NB) je klíčovým parametrem u procesorů AMD. Navýšení jeho frekvence znamená také razantní navýšení výkonu celého systému. Pokud si ale myslíte, že onen NB (severní můstek) je pouze čip na desce, mýlíte se. Pokud u platformy AMD AM2+ a AM3 mluvíme o severním můstku, týká se to nejen fyzického čipu na desce (třeba čipu RD 790FX) ale i části procesoru s paměťovým řadičem. Podívejme se na to detailněji.

Na obrázku vidíme schéma 65nm procesoru Phenom, proti dnešním 45nm se ale nic nezměnilo, jen je čip menší. Rozložení hlavních částí zůstalo stejné, tedy nám obrázek poslouží stále dobře. U procesorů architektury K10 jsou procesorová jádra vybaveny 512 kB L2 cache a 128 kB L1 cache. Další paměť L3 cache zabírá velkou část procesoru a lze jí část vypnout nebo zcela odstranit. U plnohodnotných Phenomů II má kapacitu 6 MB. Kromě čtyř jader (Core) je součástí čipu i 128-bit paměťový řadič (IMC) a část označená jako CPU-NB.

Jde o logiku, která se stará o paměť L3 cache, paměťový řadič a sběrnici Hyper Transport. Zde se významně inspiroval Intel, jehož struktura CPU je víceméně stejná, tuto část nazývají unCore. U platformy AMD je to zkrátka CPU-NB. Frekvence této části CPU je nastavitelná zvlášť a má své zásady, o tom ale až za chvilku. Hodnota NB frekvence také značně ovlivňuje výkon paměťového řadiče, který je s ní pevně spojen. Poslední důležitou částí jsou rozhraní Hyper Transport, kterých je v každém procesoru čtveřice. Tento návrh umožňuje každý čip použít jak do serveru tak do běžného počítače, což zlevňuje výrobu hlavně serverových čipů. Skrze tato rozhraní komunikuje procesor se severním můstkem a ten pak z dalšími čipy. I frekvenci této sběrnice můžeme ovlivnit ručně, na výkon ale nemá zásadní vliv (stejně jako QPI u Core i7).

V minulém návodu jsem hovořili o Hyper-Threading (SMT) u procesorů Intel, chystá AMD také něco podobného? V současných procesorech nic takového není, ovšem od roku 2006 na této technologii AMD usilovně pracuje. Jelikož má Intel SMT patentované, není možné implementovat jej stejně a následující architektura Bulldozer jej pod tímto názvem (což AMD hodně brání a hlídá) neuvede. Půjde o jinou podobu této technologie, zatím ale nejsou dostupné žádné detaily, vše co uniklo výrobce poté dementoval.

Teoretická část

Jak na přetaktování - Athlon II a Phenom II pro AM3
i Zdroj: PCTuning.cz

Frekvenční diagram Phenomu

Základní frekvence (HT clock): Mnohdy se stále ještě setkáváme se špatným názvem FSB Frequency, bohužel i u mnoha výrobců desek. Správné označení je ale HT frekvence nebo základní takt. Jde o referenční kmitočet od kterého se odvozují všechny frekvence celého systému a všech komponent. Finální hodnota 200 MHz je generována z 33 MHz krystalu a násobena 6x. Základním kamenem systémů je tedy hodnota 200 MHz. Tento středo-bod architektury AMD K10 ukazuje náš obrázek vpravo v zeleném čtverci (Base Clock). Jakákoliv změna této frekvence má vliv na všechny části systému se kterými je na obrázku spojena zelenou přerušovanou čarou.

Frekvence komponent je odvozována z taktu 200 MHz a hodnoty násobiče. Například Athlon II X2 250 má základní násobič pro jádra 15x (15 x 200 = 3,0 GHz). Násobičů je v systému několik. Jenom samotný procesor má tři oddělené násobiče pro různé své části. Všechny násobiče si nyní popíšeme:

Takt jader CPU (Core)

Nejviditelnějším znakem procesoru je jeho pracovní frekvence. Té je dosaženo vynásobením příslušného násobiče a referenčního taktu. Jak už jsme si řekli u procesoru Athlon II X2 250 (má násobič 15) je to 15 x 200 MHz = 3000 MHz. Každé ze čtyř (dvou) jader, má svůj vlastní PLL obvod a násobič, je možné jejich takt ovládat nezávisle. Zatím ale pouze softwarově utilitou AMD OverDrive, v BIOSu nastavit frekvence samostatně nelze. Vztah mezi základní frekvencí a násobiči jader ukazuje obrázek zelenou čárkovanou čarou mezi "Base Clock" a jádry CPU (v červeném obdélníku nahoře).

Jak na přetaktování - Athlon II a Phenom II pro AM3
i Zdroj: PCTuning.cz

Jednoduchý příklad: Pokud navýšíte základní frekvenci z defaultních 200 MHz třeba na 220 MHz, navýší se tím frekvence jader CPU Athlonu II X2 250 následovně - 15 x 220 = 3300 MHz. Tuto situaci ukazuje náš ilustrační obrázek, frekvenci 220 MHz v dolním rámečku násobíme x15 a výsledek je v horním rámečku. Jak už ale víme, zvýšením základní frekvence se ovlivnil takt i dalších komponent.

Takt L3 cache a paměťového řadiče (CPU-NB)

Jak na přetaktování - Athlon II a Phenom II pro AM3
i Zdroj: PCTuning.cz

Velmi velká L3 cache je energeticky dosti náročná, a tak se její frekvence a napájení často omezuje. Stejně tomu je i u procesorů Core i7 a i5. U architektury AMD K10 (i Nehalem) pracuje paměťový řadič a L3 cache vždy na nižší frekvenci než jádra procesoru. Defaultní hodnota pro všechny čipy je 2000 MHz s násobičem x10. Pouze odemčené procesory Black Edition umožňují nastavit ručně vyšší frekvenci než je defaultní frekvence. U běžných procesorů lze navýšit takt CPU-NB jen přetaktováním základní frekvence. Na našem obrázku (frekvenční diagram) je násobič a celá oblast CPU-NB znázorněna žlutým obdélníkem.

Jak na přetaktování - Athlon II a Phenom II pro AM3
i Zdroj: PCTuning.cz

Příklad: Násobič pro CPU-NB (paměťový řadič + L3 cache) lze u Athlonu II X2 250 měnit pouze směrem dolů, u druhého Phenomu II X2 550 BE jde nastavit i vyšší násobitel. Podle AMD lze nastavit až násobič x35 (CPU-NB FID 1f). Zde záleží na výrobci desky jaký maximální násobič do BIOSu nastaví. CPU-NB snese celkem vysoké takty a hodnot kolem 2600-2700 MHz se nemusíte bát, záleží co váš čip zvládne. Já doporučuji co nejvyšší frekvenci co se vám podaří dosáhnout, čím vyšší takt tím vyšší výkon.

Na obrázku je opět náš Athlon II X2 250 s nejvyšším násobičem x10. Pokud změníme základní frekvenci na 220 MHz, změní se samozřejmě i takt CPU-NB. Vztah mezi základní frekvencí a taktem CPU-NB ukazuje červená šipka. Náš konkrétní procesor nemá L3 cache, tedy zde navyšujeme takt pouze paměťového řadiče a NB přepínače.

Frekvence Hyper-Transport (HT-Link)

Od základního taktu 200 MHz se samozřejmě odvozuje i frekvence sběrnice Hyper-Transport. Tu mají nastavenou všechny procesory na takt 2000 MHz. I tuto frekvenci můžete u procesorů Black Edition o několik násobičů zvýšit, většinou na maximální násobič x13. Náš testovací procesor má frekvenci zamčenou na základní hodnotě x10. Stejně jako u dvou předešlých veličin, i tady se zvýšením základního taktu naroste i frekvence HT-Link.

Příklad: Názorně to vidíme na obrázku, frekvence 220 MHz je násobena x10, výsledkem je takt HT Link 2200 MHz. Tuhle frekvenci je doporučeno udržovat kolem základního taktu (2000 MHz), u kapalného dusíku dokonce snížit na poloviční hodnotu. Jakýkoliv vyšší takt je zbytečný, výkon s vyšší frekvencí již neroste, komunikace se severním můstkem je dostatečná i na základních hodnotách.

Frekvence pamětí (Memory Clock)

Rychlost paměťových modulů je opět odvozena od základní frekvence 200 MHz a nikoliv od finální frekvence procesoru (jako tomu bylo u Athlon 64). Starší platforma AMD AM2+ s paměťmi DDR2 má děliček pět. U nové patice AMD AM3 je děliček čtveřice pro DDR3 moduly. Všechny možnosti obou platforem zobrazuje naše tabulka. Pokud si chcete vypočítat nějakou z možností, stačí vynásobit požadovanou základní frekvenci hodnotou z tabulky. Například při základním taktu 220 MHz budou paměti s děličkou 10:3 pracovat na frekvenci 1466 MHz. [220 × (10/3) × 2 = 1466]. Reálnou podobu nabídky děliček pro DDR3 ukazuje následující fotografie BIOSu:

Poznámka: Pokud se při taktování nebude nějaká z děliček vašim pamětem "líbit" zkuste ji než snížit naopak zvýšit. Při vysokém přetaktování (vysoká základní frekvence) naopak nastává situace, kdy paměťový řadič v CPU už na žádném napětí "neutáhne" vysoký takt pamětí a proto jej bezpodmínečně nenuťte pracovat s takovými rychlostmi modulů. Povíme si o tom detailněji už za okamžik. Snižte o jednu děličku a rozdíl zkuste dohnat snížením časování, většinou to lze bez problémů vykompenzovat.

Režim pamětí na AMD (Ganged - Unganged)

Téměř v závěru této kapitoly o principech taktování se ještě telegraficky podívejme na oba možné režimy pamětí. Sice jsem rozdíl vysvětloval už v mnoha článcích, opakování je ale matka moudrosti. Nejprve tedy teoreticky, poslouží nám k tomu obrázek:

Spolu s prvními Phenomy se v BIOSech objevilo nastavení pro paměti Ganged a Unganged. Procesory architektury K10 mají dva nezávislé 64-bitové paměťové řadiče (kanály). Dvojice pamětí s procesory Phenom mohou pracovat ve třech režimech:

Single channel - Oba moduly jsou nainstalovány v jednom z kanálů (na naší konkrétní desce - bílý a modrý). V tomto režimu je komunikace pamětí pouze 64-bitová a nejméně výkonná.

Dual channel Ganged - Oba moduly jsou nainstalovány ve stejně barevných slotech (modrý + modrý, bílý + bílý) a pracují ve 128-bitovém režimu. Nastavení Ganged učiní pro procesor oba kanály viditelné jako jediný 128-bitový.

Dual channel Unganged - Oba moduly jsou opět osazeny ve správných slotech (modrý + modrý, bílý + bílý), v BIOSu je ale nastaveno Unganged což pro procesor znamená, že vidí oba kanály jako dva nezávislé 64-bitové.

Ptáte se, jaký je v dvou posledních režimech rozdíl? Je to jednoduché, v Ganged musí být oba moduly osazené v jednom kanále stejné, a pokud chcete osadit čtveřici musí být stejné všechny čtyři paměti. Tento limit právě režim Unganged bortí, můžete dát například do prvního kanálu paměti 1066 MHz a do druhého 800 MHz a oba kanály nechat pracovat na svých rychlostech a časováních. Obrázek ukazuje, že Unganged mód by měl být výkonnější - procesor čte z obou kanálů zároveň a za jeden takt dokáže přečíst stejný objem dat jako v režimu Ganged za dva takty - v ideálním případě na obrázku. Z praxe víme, že v režimu Ganged jsou některé single-thread aplikace krapet ve výhodě, ve většině ostatních si ale lépe vede Unganged. U nových 45nm procesorů doporučuji jedině režim Unganged, Ganged je problémovější a nedá se s ním nijak zásadně taktovat.

Časování pamětí

AMD zde doporučuje dvě schémata. Nastavit nejvyšší děličku 4:1 (1600) s patřičným časováním při základní frekvenci do 225 MHz. Druhý scénář uvažuje s o jeden nižším dělitelem 10:3 (1333) a nárůstu základní frekvence libovolně nad 225 MHz. S druhým scénářem se setkáme samozřejmě častěji a dělička 10:3 je pro vysoké taktování nejlepší možná. POZOR! S frekvencí pamětí u platformy AMD AM3 ale nelze jít nad 2000 MHz jako je tomu u Intelu běžné. Limit pro funkční paměťový řadič je někde kolem 1850-1900 MHz, na víc se teoreticky ani prakticky nelze dostat. U vysokých základních frekvencí tedy pak přichází ke slovu další nižší dělící poměr 8:3 (1066).

Pro objasnění pojmů jako je CAS a RAS je třeba si udělat zjednodušenou představu o práci paměti s adresami a bloky. Adresa je koncipovaná formou homogenní matice rozdělené klasicky na řádky (Rows) a sloupce (Columns). Pokud chce paměť vyvolat určitý blok na dané adrese, zadá se nejdříve adresa řádku (Row) s danou prodlevou (RAS - Row Acess Strobe) pro jeho bezpečnou identifikaci (zapsání na výstupní pin, nebe chcete-li cílový blok). Je-li řádek identifikován přichází další prodleva (RAS to CAS Delay) po které následuje identifikace sloupce, pro jeho bezpečné určení slouží časová rezerva sloupce (CAS - Column Address Strobe). Teprve poté je adresa určena a datový blok se může předat do výstupu.

tCL (CL, CAS Latency, DRAM Cycle Lenght, Column Address Strobe) - Nastavuje prodlevu modulů od zahájení čtení a přijmutí požadavků na uvolnění adresy v paměti. BIOS kontroluje toto zpoždění v cyklech procesoru (tj. jde o strašně maličká časová okénka v řádech 10-9 s) a jedná se o důležitou věc při přenosu jednotlivých adresovaných bloků do paměti. Prodleva je nutná k uskutečnění samotného přenosu a přípravu pro přenos dalšího bloku. Čím větší prodleva, tím je operace více "jištěna" a je zaručeno, že se bloky stihnout dostat v poskytnuté prodlevě s rezervou. Sníží-li se tato časová rezerva zrychlí se postup paměťových operací, ale existuje riziko, že na dokončení přenosu toto okno nemusí stačit.

tRCD (RAS# to CAS# Delay, DRAM RAS-CAS Timming, tRCD Delay) - Jedná se o časové okno mezi přechodem řádkové a sloupcové identifikace adresovaného bloku v paměti. Stejně jako u předchozích hodnot platí, že čím menší prodleva, tím rychlejší provedení celé operace.

tRP (Row Precharge, DRAM RAS Precharge Time, RAS Delay) - Jedná se o podobnou funkci jako v případě CAS Latency s tím rozdílem, že zde se určuje počet cyklů, po které čeká adresovaný blok paměti, než je předáno uvolněné místo dalšímu bloku. Snížením této doby se urychlí celý sled těchto operací, ovšem stejně jako v případě CAS Latency nemusí vždy tato doba stačit (je však méně citlivá než CAS Latency, protože se provádí v samotném počátku celé paměťové operace a případná chyba ještě nemusí v této fázi nastat, nebo být "viditelná".

tRAS (Active to Precharge Delay, DRAM Act to PreChrg CMD, DRAM Row Active Time) - Určuje časovou prodlevu ve kterém je možno operovat s jedním adresným řádkem v paměti. Teoreticky se jedná o prostý součet prodlevy řádkové (RAS Delay), prodlevy mezi operací sloupcovou (tRCD = RAS to CAS Delay) a její prodlevou (CAS Latency). Prakticky však zde určujete minimální možné okno mezi celým průběhem celé operace. Vyplatí se proto mít minimálně rezervu o jeden nebo alespoň 1/2 časového cyklu.

Příklad základního časování: Hodnota tRAS se nastavuje výpočtem z ostatních položek, následujícími vzorci - RAS + tRCD + CAS + 1T = Precharge Delay (konzervativní). To jest pro paměti DDR3 s CL=7, RCD=7, RAS=7 - 7+7+7+1=22. Konzervativní časování tRAS je tedy 22. Pro agresivní timing použijeme vzorec CAS + tRCD + 2T = Precharge Delay (agresivnější). To jest pro stejné moduly hodnota tRAS 7+7+2= 16.

CMD (CPC, Command Per Clock) - Počet provedených instrukcí v jednom taktu. Zde velmi záleží na možnostech pamětí a zároveň čipsetu, ovšem hodnota 1T může znamenat drastické navýšení výkonu pamětí. Moduly na 1333 MHz s 1T mohou podávat lepší skóre, než 1600 MHz na 2T. Volba je na vás, a pokud bude systém stabilní na 1T použijte tuto volbu.

tRRD - Minimální čas potřebný k přepnutí do dalšího banku stejného modulu na stejném řádku, pokud je tento bank již předtím aktivován. Zde můžete klidně nastavit hodnoty 1,2,3 na výkon nemají téměř žádný vliv.

tRC (Row Cycle Time) - Hodnota odpovídá součtu tRAS a tCL, jedná se o dobu mezi dvěma provedeními příkazu tRAS. Tato hodnota má veliký vliv na výkon pamětí na nových čipsetech, a nastavujme ji tedy vždy podle vzorce - tCL + tRAS + 1. I malé změny časování mohou znamenat velký skok ve snížení výsledných latencí pamětí, spolu s vyšším výkonem.

tWR, tFAW - První parametr udává potřebný čas mezi příkazy tRP, musí být tedy vždy vyšší. Druhý údaj představuje minimální čas mezi čtením a následným zápisem. Položky, které nemají žádný zásadní vliv na výkon a přetaktování pamětí. Nechávám je vždy na Auto.

tRD (Performance Level / Read Delay, MCH Read Delay) - Možnost přidána na žádost mnoha uživatelů, kteří po ní marně volali. Na čipsetech Intel je ale klíčová, představuje hodnotu doby potřebné řadiči pamětí k přístupu k datům v pamětech. Tento parametr představuje mocnou zbraň k vysokým stabilním taktům FSB, a vysokým hodnotám čtení z pamětí. Bez možnosti měnit tRD není lehké na čipsetech Intelu dosáhnout velmi vysokých přetaktování.

tRFC - Čas potřebný k provedení příkazu tREF (obnovení všech dat ve všech modulech) pokud je tento modul již aktivován. Může mít vliv na výkon a latence pamětí, doporučuji nastavit spíše vysoké hodnoty - minimálně 60 pro dva moduly, vyšší v případě čtyř pamětí a jejich vysoké frekvence.

tREF - Prodleva mezi kompletním obnovením obsahu každého modulu. Nízké hodnoty rapidně zvyšují výkon, ale zvyšují riziko na chyby z nedostatečné rychlosti procesu obnovování. Vyšší hodnoty jednoznačně používejte při osazení více než dvou modulů, velmi to pomůže stabilitě.

Napájení procesoru a pojmy BIOSu

Na úplný závěr této kapitoly ještě pohled na napájení komponent a vysvětlení pojmů. DDR3 Voltage Control je samozřejmě napětí pamětí DDR3. Zde se řiďte napětím vašich modulů udávaným výrobcem. Bez potíží lze provozovat paměti i na 2,1V (pokud to snesou). Já doporučuji maximální bezpečné napětí 2,0V. To ovšem neplatí pro moduly s nízkým napětím 1,65V.

SB/HT Voltage Control je napájení externí sběrnice Hyper-Transport a jižního můstku SB 700. Maximální doporučené napětí je zde stanoveno na 1,35 - 1,45V. Tuto veličinu většinou není nutné vůbec zvyšovat, na taktování má také malý vliv. Další položka je NB/PCIe/PLL Voltage jež ovládá napětí do PLL obvodu (interní generátor frekvence) severního můstku. Maximální doporučená hodnota se pohybuje kolem 1,9 - 2,0V. Pro taktování nemá větší vliv.

Další položka se jmenuje CPU PLL Voltage a jde o interní generátor frekvence v CPU s defaultním napětím 2,5V. Bezpečná hodnota je někde kolem 2,7V. NB Voltage Control je ovládání napětí severního můstku RD 790 FX. Není potřeba zvyšovat napětí nad 1,35V. CPU NB VID napájí CPU-NB část procesoru, to jest řadič pamětí a L3 cache. Absolutní maximum je zde 1,55V my ale doporučujeme nepřekračovat 1,5V. Poslední volba CPU Voltage Control je napětí procesoru, jež by nemělo se vzduchem nikdy překročit hodnotu 1,5V. U extrémního chlazení si ale můžete dovolit jít mnohem výše, až kam vás pustí deska.

Předchozí
Další
Reklama
Reklama

Komentáře naleznete na konci poslední kapitoly.

Reklama
Reklama