Nehalem - nové revoluční platformy (1/2) |
autor: Petr Koc , publikováno 3.9.2008 |
Seznam kapitol |
---|
1. Platforma – největší změna |
2. Klasické řešení s Front Side Bus |
3. Integrovaný řadič paměti |
4. Platformy v podání Nehalemu |
Letošní podzim se ponese ve světě IT v duchu revoluční změny v oblasti platformy společnosti Intel. Ta poprvé ve své historii nahradí u nového produktu dnes již řádně zastaralou koncepci čipové sady a sběrnice FSB něčím, co slibuje v mnoha případech přinést razantní změnu k vyššímu výkonu aplikací...
Jedním z překvapivých prvků nových procesorů rodiny Nehalem je poměrně velké množství navržených řešení. Ty se liší dle cílového segmentu. V první fázi přijdou na trh desktopové verze kódově označované Bloomfield. Ty budou využívat následující platformy:

Procesor bude umístěn do socketu LGA1366 a bude obsahovat tříkanálový paměťový řadič. S čipovou sadou bude spojen pomocí sběrnice Quick Path Interconnect (dříve nazývané také Common System Interface – CSI), která je ekvivalentem HyperTransportu používaného u AMD a která má i podobné výkonnostní parametry. Toto řešení má prakticky identické vlastnosti jako dnešní řešení od AMD.

Neméně zajímavé je řešení, které bude uvedeno až zhruba za rok – plně desktopová verze se socketem LGA1160. V té bude CPU obsahovat nejen paměťový řadič, ale také grafickou kartu, resp. PCI Express vývody pro externí grafickou kartu. To umožní jak zvýšit výkon samotného procesoru, tak také nesnížit výkon grafické karty, neboť oba budou blízko paměti RAM. Zároveň to umožní nepoužít pro spojení s čipsetem sběrnici QPI, ale namísto ní jednodušší Direct Media Interface, která se už nějakou dobu používá u čipsetů ke spojení severního a jižního můstku (dnes typicky pracuje s propustností 1 GB/s jedním směrem a je plně duplexní). Toto řešení se zdá být ideální pro téměř všechny desktopové segmenty.
V souvislosti s integrovanou grafickou kartou některé zdroje hovoří o tom, že tato nebude na jednom čipu, ale bude pouze vložena do stejného pouzdra jako CPU. Vzájemné propojení by údajně mělo být realizováno pomocí QPI. Uvedená informace je ale neověřená.
Největší změna se uskuteční tam, kde je nejvíce potřeba – u serverů. Počínaje Nehalemem Intel přechází na architekturu NUMA. Implementuje přitom velmi podobnou koncepci jako AMD.

Každý procesor obsahuje vlastní řadič pamětí (některé zdroje hovoří, že v nejvyšším segmentu by mohl být až čtyřkanálový) a tyto řadiče jsou navzájem spojeny pomocí sběrnice Quick Path Interconnect. Přenosová rychlost QPI by v tomto případě měla dosahovat 12,8 GB/s jedním směrem s tím, že sběrnice je plně duplexní. Jedná se tedy o výkon velice podobný HyperTransportu 3 od AMD.
Přechod na NUMA umožní dobré škálování s rostoucím počtem procesorů. Stejně jako u AMD si ale zároveň vyžádá operační systém, který je schopen alokovat aplikacím paměťový prostor s ohledem na specifika NUMA. Pokud takový systém nebude přítomný, může výkon při práci s pamětí dosáhnout úrovně současných procesorů architektury Core pracujících na FSB1600 – zhruba taková totiž byla změřena latence při přístupu do paměťového prostoru ovládaného jiným procesorem, než který požaduje data. Z hlediska práce s pamětí tak na nové platformě dojde jen ke zlepšením.

Určitě příjemnou zprávou pro budoucí majitele je, že Nehalemy již nebudou vyžadovat paměti typu Fully Buffered, neboť stejné kapacity pamětí bude možné díky více řadičům dosáhnout i s běžnými moduly. S příchodem NUMA se také vysvětluje, proč Intel údajně odstupuje od nasazení FB-DIMM s DDR3.
Druhý díl povídání najdete na našich stránkách zítra a podíváme se v něm podrobně na rodinu procesorů Nehalem a všechny její varianty.
Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz
Nakonec i Intel quadcore procesory, spojené dvě dvoujádra přes FSB, jsou výrazně rychlejší než jejich AMD Phenom protějšky, přístup do paměti a latence je +/- stejná, výpočetní výkon mnohem vyšší.
FSB *není* omezení pro i velice nadupaný desktop.
Integrace řadiče na desktopu znamená změnu socketu, základních desek, nesnadný upgrade pamětí.
I proto socket 775 žije už velice dlouho a dál bude žít. Přínos NUMA je na destopu .. nulový ;)
AMD nasadilo serverové CPU do desktopů, což není ideální, a (bohužel) k tomu směřuji i Intel.
Co je to za provokaci ten odkaz pod tou 5? :-0
Dale take to, co pouziva AMD nelze za NUMA v pravem slova smyslu oznacit. U AMD je rozdil v latenci lokalni a vzdalene pameti ~20-30% a propustnosti jeste mensi. Celkove je vliv na vykon vetsinou minimalni. Proto se vzilo oznaceni teto architektury Uniform Enough Memory Architecture.
Opravdove stroje pouzivajici NUMA pro spojeni vetsinou osmi nebo sesnactiprocesorovych nodu do vetsich celku se charakterizuji rozdily v latenci v radu stovek procent.
To není úplně vhodná volba - neznám jazyk, který by byl procesoru dál.
Btw. Microsoft se zřejmě sanží udělat z C++ něco jako HTML
Zadne dalsi nastroje snad nejsou potreba, ne ? zadny framework, zadne stahovani - prijde mail, rozbalim a spustim.
A myslim, ze po urcite snaze lze i udelat C++ kod rychlejsim, nez ten .NET.
ale, nehadam se, ze treba .NET nema treba taky nejake ficury (jako v C jsou intrinsicty ...)