Hlavní stránka Hardware Procesory, paměti Architektura procesorů Nehalem (2/2)
Architektura procesorů Nehalem (2/2)
autor: Petr Koc , publikováno 4.9.2008
Architektura procesorů Nehalem (2/2)

Nehalem bude první masově nasazovaný procesor Intelu, který bude integrovat řadič pamětí blízko procesoru. Tím ale výčet novinek nekončí. Inženýři se při návrhu zaměřili také na návrh samotné výpočetní části a kompletně předělali také návrh cache subsystému. Pojďme se podívat, v čem budou největší změny samotné architektury procesoru.


Oblast, v níž se Intel v poslední době velmi angažuje (zejména po fiasku s Pentiem 4) je úspora energie. Přestože jeho procesory obsahují více transistorů než konkurence od AMD, mívají nižší spotřebu. Ta je dána agresivním power managementem. Ten Intel poprvé použil u Pentia M a současné generace z tohoto přístupu čerpají. Údajně je nyní filosofie taková, že za každé 1 % spotřeby energie navíc se musí výkon zvýšit o 2 %.

Uvedená filosofie je pochopitelně značně diskutabilní, protože dnešním trendem je zvyšování výkonu jen za určitých okolností. U procesoru prakticky existuje jediná veličina, která zvedne výkon za všech okolností – frekvence.

Architektura procesorů Nehalem (2/2)

Nehalem je první procesor Intelu, který zavádí nezávislé napájení některých částí. Celý čip je nyní rozdělen do třech oblastí: výpočetní jádro, paměťový řadič, zbytek. Každá z těchto částí má přitom svoje vlastní napětí, a tedy její spotřeba může být optimalizována na základě požadavků.

Architektura procesorů Nehalem (2/2)

Zároveň je zavedena další specialita, kterou Intel nazývá Power Gate. Jedná se o speciální transistor s velmi velkým odporem, který je schopen fungovat jako „uzávěr“ pro protékající proud. Využití takového transistoru je zřejmé – umožňuje téměř plně odpojit jednotlivé části od napájení. Výhodu to má zejména při power managementu více částí sdílejících stejný zdroj napětí, tedy například u jader procesoru.

Současný stav a nový stav si vysvětlíme na příkladu. Představme si, že máme procesor s dvěma jádry. Pokud obě jádra budou využita, poběží obě na plné frekvenci. Pokud bude využito jen jedno, pak jádro 0 poběží na plné frekvenci a jádro 1 bude moct frekvenci snížit na minimum (aby uspořilo energii). Spotřeba sestává z části dynamické (způsobené frekvencí) a z části statické (způsobené úniky proudu – leakage). Primárním faktorem ovlivňujícím leakage jsou počet transistorů a napětí. Podíl leakage na celkové spotřebě se zmenšujícími se transistory neustále roste, protože menší atomární velikost nedokáže tak dobře bránit průsakům elektronů. Například u Pentia 4 Prescott činila statická spotřeba až 62 Ampér, tedy více než polovinu z maximálních 119 Ampér.

Aby v našem příkladu mohlo jádro 1 co nejvíce omezit svojí spotřebu, musí snížit jak spotřebu dynamickou (snížit svojí frekvenci na minimum), tak také snížit napětí. Snížení frekvence je věc velmi jednoduchá – stačí odpojit PLL generátor frekvence nebo alespoň v určitém poměru odstranit jím generované hodinové cykly. Tuto techniku všechny dnešní procesory zvládají velmi dobře a výsledné frekvence jsou v řádu maximálně pár desítek MHz. Horší je to s poklesem napětí. To je totiž mezi jádry sdíleno. Pokud tedy jádro 0 potřebuje vysoké napětí pro práci na maximální frekvenci, může jádro 1 omezit jen dynamickou spotřebu. Statická spotřeba zůstává a dochází ke zbytečné spotřebě elektřiny a zahřívání čipu. A právě pro vyřešení této situace Intel implementoval Power Gate. Při požadavku na snížení spotřeby jádra 1 stačí jednoduše napájení tohoto jádra zaizolovat – spotřeba v ten okamžik poklesne na téměř nulu. Toto řešení je oproti plně individuálnímu napájení jednotlivých jader elegantní v tom, že náklady na jeho zavedení jsou mnohem nižší a přitom účinnost je podobná.

Architektura procesorů Nehalem (2/2)

S odpojováním jader souvisí i nová funkce „Turbo Mode“. Jejím úkolem je prakticky to samé, co má u mobilních procesorů Core 2 Duo na starosti funkce Intel Dynamic Acceleration – zvyšování frekvence individuálních jader v případě nevytížení jader ostatních. Po třech letech od uvedení dvoujádrových procesorů se tedy skutečně dočkáme první vlaštovky toho, co zde mělo být už při jejich uvedení a čehož absenci jsem také kdysi kritizoval – skloubení výhod vícjádrových procesorů s výhodami procesorů jednojádrových - možnosti dosahovat podstatně vyšších frekvencí (protože nejsou limitované spotřebou). Nehalem bude podporovat dvoustupňový Turbo Mode, kde v každém stupni bude frekvence navýšena o 133 MHz. Navýšení frekvence se může týkat více než jednoho jádra, přičemž záleží na odběru proudu a spotřebě. Pokud budou tři jádra velmi málo vytížená, může být čtvrté urychleno o dva stupně. Pokud budou dvě jádra vytížena hodně (a zbylá vůbec), tak patrně bude možné zvýšení frekvence jen o jeden stupeň, ale to u obou jader. Pro celkové řízení spotřeby, frekvencí a monitorování teplot slouží samostatná logika nazvaná Power Control Unit, která sestává z asi 1 milionu transistorů (což je zhruba tolik, kolik má procesor 80486). Tato jednotka je částečně programovatelná, neboť akceptuje firmware nahrávaný při startu počítače BIOSem.

Architektura procesorů Nehalem (2/2)

Lepší řízení spotřeby a frekvencí se projevilo i na změně u technologie Thermal Monitor. Ta byla zavedena již v Pentiu 4 a později v Pentiu M se dočkala verze 2. Jejím cílem je v případě přehřátí snížit spotřebu procesoru. To se provádí prostřednictvím eliminace hodinových cyklů (Thermal Monitor 1) nebo snížením frekvence a napětí (Thermal Monitor 2). Preferovanou variantou je přitom ta druhá, neboť při stejném snížení spotřeby nabízí vyšší výkon. V současnosti je u procesorů architektury Core použita politika, kdy při přehřátí se procesor automaticky přepíná na definovanou nízkou frekvenci, typicky s nejnižším možným násobičem 6x. Nehalem jde v tomto ohledu trochu dál, neboť stupňů pro přepínání bude mít víc. Při současném real-time monitoringu spotřeby toto řešení umožní realizovat míře přehřátí přiměřenou odezvu, a tedy dosáhnout vyššího průměrného výkonu v případě přehřátí.

S novým procesorem souvisí i nová patice – LGA1366. Ta je výrazně větší než u současná LGA775 použitá u procesorů architektury Core. Intel přitom stále volí variantu s dutou střední částí, neboť zde již dlouhou dobu dává na procesor kondenzátory (AMD je dává u svých procesorů na vrchní stranu, proto má patici bez volného středu).

Architektura procesorů Nehalem (2/2)

Maximální povolená hmotnost chladiče CPU činí u nového socketu 550 gramů, stejně jako v současnosti. Přesto je zde rozdíl – chladiče mohou nyní být širší a i samotný BOX chladič od Intelu by měl být o 10 mm v průměru širší. Jeho účinnost tak bude vyšší. Proč? Nehalem zřejmě i přes všemožné úsporné techniky nebude právě úsporný. Zlepšení v jádře si vyžádala jeho značné zvětšení (zhruba o 30 %) a to samozřejmě znamená více transistorů. Společně s integrací paměťového řadiče je výsledkem velký čip obsahující velké množství logiky. Přestože celkový počet transistorů je menší než u čtyřjader Core 2 Quad, je to právě logika, které je výrazně více a která má velkou spotřebu (cache má spotřebu minimální). Thermal Design Power (cílová „průměrná“ spotřeba v plné zátěži) prvních modelů se má vyšplhat na 130 W.

Mimochodem, Intel přešel s Nehalemem na transistory, které mají nižší spotřebu, ale také nižší rychlost přepínání . Co je cílem? Přirozeně bojovat proti příliš vysoké spotřebě velkého komplexního čipu a to i za cenu nižšího výkonu. Zda je taková cesta dobrá nebo zda je lepší mít transistorů méně a spoléhat se primárně na frekvenci anebo více oddělených čipů, nechám již na vás.



 
Komentáře naleznete na konci poslední kapitoly.
176 čtenářů navrhlo autorovi prémii: 84Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.