architektura-procesoru-nehalem-2-2
Hardware Článek Architektura procesorů Nehalem (2/2)

Architektura procesorů Nehalem (2/2) | Kapitola 7

Petr Koc

Petr Koc

4. 9. 2008 01:00 71

Seznam kapitol

1. Front-end 2. Dekódování 3. Out-of-order engine 4. Cache subsystém
5. Paměťový subsystém 6. Správa energie 7. Co od Nehalemu čekat?

Nehalem bude první masově nasazovaný procesor Intelu, který bude integrovat řadič pamětí blízko procesoru. Tím ale výčet novinek nekončí. Inženýři se při návrhu zaměřili také na návrh samotné výpočetní části a kompletně předělali také návrh cache subsystému. Pojďme se podívat, v čem budou největší změny samotné architektury procesoru.

Reklama

Jak vidno, Nehalem není principielně žádná velká revoluce. Je to spíše oprášení některých konceptů známých z Pentia 4 a jejich integrování do architektury Core + okopírování konceptu integrovaného řadiče RAM od AMD.



Architektura procesorů Nehalem (2/2)
i Zdroj: PCTuning.cz

Celkové schéma procesoru Nehalem



Přesto se domnívám, že Nehalem se po uvedení s přehledem stane nejrychlejším procesorem na trhu a to zejména v oblasti multithreaded software – tedy u serverů a pracovních stanic. Prostřednictvím integrovaného paměťového řadiče Intel konečně odbourá poslední vážný nedostatek architektury Core – vysokou latenci při náhodném přístupu k datům, která se nevešla do cache.



Na druhou stranu se nabízí otázka, co Nehalem přinese běžným uživatelům. V některých případech (třeba u Photoshopu náročného na propustnost pamětí) určitě vyšší výkon, v mnoha jiných ale přínosy nebudou až tak razantní a místy dokonce může dojít v důsledku změn k poklesu výkonu, byť to bude spíše výjimečná situace. Jednoduše řečeno Nehalem nepřináší ani nic úžasně převratného, jako tomu bylo u Core (fúzování instrukcí, spekulativní načítání potenciálně aliasovaných paměťových adres, 128bit SSE jednotky), ani nijak rapidně nezvyšuje frekvence. Majitelé stávajících procesorů architektury Core patrně nebudou mít mnoho důvodů k upgrade, pokud tedy zrovna nepoužívají silně multithreaded aplikace.



Co se dle mého na Nehalemu opravdu povedlo?



  • Integrovaný paměťový řadič odbourává hlavní nedostatek současné platformy. Pro integrované grafické karty sice znamená určité nevýhody, na druhou stranu očekávaná integrace GPU do procesoru tento problém odstraní. Navíc od integrované grafické karty asi sotva lze čekat nějaké převratné výkony.
  • Větší instrukční okno znamená lepší možnosti paralelizace.
  • Fúzování instrukcí funguje i v 64bit režimu.
  • Turbo mode – konečně aspoň maličké zlepšení pro neoptimalizované aplikace.
  • Zavedení konceptu NUMA, kde s každým CPU přibývá osaditelné množství paměti i jejich celková propustnost (u serverů).
  • Hyper-Threading (u serverů; u desktopů je lepší ho vypnout).

Hovořit o tom, co se na Nehalemu nepovedlo, je ještě před jeho uvedením troufalé. Přesto si dovolím v několika bodech shrnout hlavní

„nedostatky“

:



  • Procesor je striktně zaměřen na multithreading. To je sice skvělá zpráva pro servery, ale již méně pro desktopy, kde stále většina aplikací je jednovláknová a nic nenasvědčuje tomu, že se to v blízké době změní. Na architektuře Nehalemu je vidět, že multithreadovému výkonu ustupuje výkon na jedno jádro – cache je oproti Core pomalejší a fyzické jádro sdílí prostředky mezi logická jádra, v některých případech dokonce ne na bázi konkurence, ale na bázi pevného rozdělení zdrojů na polovinu.
  • Počáteční úvodní frekvence jsou pouze na stejné úrovni jako u předchozí generace procesorů a to při podobné / vyšší spotřebě. To může znamenat, že aplikace, které nejsou schopné těžit ze zlepšení (tj. zejména aplikace, které nejsou příliš závislé na rychlosti přístupu k paměti) a které by naopak těžily z vyšších frekvencí, na novince nepoběží o mnoho lépe než na současných generacích.
  • Využití Hyper-Threadingu je stále v mnoha ohledech diskutabilní. Opět je to vynikající věc pro servery, ale u desktopů vede k velmi nepříjemnému fenoménu ignorování priorit procesů, tedy situaci, kdy jsou potírány snahy uživatele / operačního systému o přidělování výpočetních prostředků na základě potřeb. Obávám se, že dokud tento problém nebude vyřešen (a to může být pouze na úrovni spolupráce výrobce CPU + programátora operačního systému), bude stále lepší Hyper-Threading vypnout, stejně jako v dobách Pentia 4.

A to je pro dnešek všechno, na pokračování článku s reálnými testy výkonu budete muset počkat až na konec NDA začátkem příštího měsíce.
 

 

Předchozí
Další
Reklama
Reklama

Komentáře

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

Google Seznam
Reklama
Reklama