Pentium 4 Prescott: šampión nebo pouhý předskokan? |
autor: Kwolek Jirka , publikováno 2.2.2004 |
20.11.2000 byl uveden zbrusu nový procesor Pentium 4 s kompletně přepracovaným jádrem. Jednalo se o nástup zcela nové architektury kterou Intel pojmenoval NetBurst. Klíčovou vlastností nové architektury bylo, že byla navržena pro dosažení mnohem vyšších frekvencí než které dosahovaly tehdejší jádra. První jádro, které uvedlo NetBurst do reálného světa, bylo 0.18um Willamette (první Willamate bylo určené pro patici typu Socket 423 která byla v zápětí nahrazena novějším Socketem 478 - podobnost s dnešním uvedením Prescottů které budou záhy přecházet na patici Socket T alias LGA775 je nasnadě).
První výkonová srovnání Pentií 4 s procesory Pentium III vyznívala pro novou řadu velmi nepříznivě (jako příklad uvedu jeden graf z našeho staršího testu):
Komentář: Původní Pentium 4 (tehdy samozřejmě Willamette s256kB cache L2, FSB 400MHz) taktované 1.4GHz (ano, i takové tehdy byly :) dosahovalo v době svého uvedení v testu CPUmark 99 indexu 88. Dnešní P4 (Northwood) 3.2GHz dosahuje v tomtéž testu 217 bodů. Pokud do vývoje započítáme zvyšování frekvence FSB a zlepšování čipových sad vidíme, že se Intelu podařilo navrhnout architekturu schopnou dosažení dvounásobku původní frekvence (přičemž první procesory byly pouhým můstkem k vyšším, mnohem efektivnějším typům).
Po krátké době kdy se neustále zvyšoval takt procesorů Pentium 4 se nové procesory definitivně předchozím typům výkonově vzdálily. Průlomovým jádrem u Pentií 4 byl pak tzv. Northwood - mimo několika interních změn přinesl 0,13um polovodičovou technologii a především zvýšení paměti cache z 256 na 512kB.
HyperThreading (aka HT)
Jádro Northwood bylo následně vylepšeno o jednu zajímavou funkci s názvem Hyper-Threading. Zjednodušeně to znamená zpracováni více (zde konkrétně dvou) programových vláken souběžně (některé interní jednotky procesoru byly už v době návrhu prvních Pentií 4 znásobeny).
Operační systém podporující multiprocessing pak takovýto 1 fyzický procesor často "vidí" jako 2 logické jednotky. Pokud je software optimalizován pro vícevláknové zpracování, dojde v optimálním případě ke zvýšení výkonu (0 - 25%). S odstupem času můžeme říci, že hlavním důvodem proč současná Pentia vedou v některých testech výrazněji nad procesory AMD, je právě HyperThreading. Aplikacemi, které HT využívají, jsou aplikace pro kompresi videa a audia, editaci obrazu, šachové programy, renderovací a vědecké aplikace...
Další systémové změny
Postupně byla navýšena rychlost sběrnice procesoru (Front Side Bus, FSB) z 400, přes 533MHz na 800MHz. Společně s procesory, které využívaly FSB 800MHz, Intel také představil své velice úspěšné dvoukanálové čipové sady i865PE (Springdale) a 875P (Canterwood), které dokázaly tyto "datově" hladové procesory nakrmit.
Pentium 4 | |||
Jádro | Willamete | Northwood | Prescott |
Rok uvedení | 2000 | 2002 | 2004 |
L1 cache | 12K micro-ops, 8KB data | 12K micro-ops, 8KB data | 12K micro-ops, 16KB data |
L2 cache | 256 KB | 512 KB | 1024 KB |
Výrobní proces | 0,18 | 0,13 | 0,09 |
FSB (MHz) | 400 | 400, 533, 800 | 800 |
Frekvenční rozsah | 1300 - 2000 MHz | 1600 - 3400 MHz | 2800 - ??? MHz |
Instrukční sady | MMX, SSE, SSE2 | MMX, SSE, SSE2 | MMX, SSE, SSE2, SSE3 |
Počet tranzistorů | 42 milionů | 55 milionů | 125 milionů |
Usazení | Socket 423, 478 | Socket 478 | Socket 478, Socket T |
Pentium 4XE: Extreme Edition
Doposud (a stále) výkonnostní favorit Intelu pro desktopy nese označení Pentium 4XE Extreme Edition (vyznačuje se mj. také i extrémní cenou). Jedná se o mírně upravené (přizpůsobené pro socket 478) serverové jádro Gallatin s L3 Cache o velikosti 2 MB.
V zásadě jde ale o Northwood s přidanou obrovskou cache třetí úrovně, díky čemuž vzrostl počet tranzistorů na 169 milionů. Technologie Hyper-Threading je samozřejmostí.
Kabátek
První Prescotty v provedení pro Socket 478 jsou prakticky k nerozeznání od klasických Pentií 4:
Uvnitř se skrývá čip s 125mil. tranzistory, který má díky 0.09um polovodičové technologii
menší plochu plochu (112mm2) než klasické Northwoody...
Budoucí provedení využije nového upínacího pouzdra a odpovídajícího "socketu" (ve skutečnosti se nejedná o klasickou patici, kontakty jsou zde totiž plošné) typu LGA775 (Land Grid Array - také známý jako Socket T):
Co se změnilo, co se nezměnilo...
Jádro Prescott je přímým pokračováním architektury NetBurst. V této řadě bude předposledním typem, po něm bude následovat jen Tejas, pak Intel uvede zcela novou architekturu - Nehalem.
Jádro, struktura
plocha čipu je 112mm2 - přesto na tuto plochu Intel "vtěsnal" 125mil. tranzistorů
(rekordmanem zůstává Pentium 4XE s 237mm2 a 178mil. tranzistorů)
Poznámka: Intel také tentokrát zcela přepracoval interní strukturu jádra (pryč jsou jednoznačně definované funkční obdélníčky, výjimkou je cache). Cílem byla optimalizace umístění a propojení jednotlivých celků tak, aby byly schopné pracovat na vyšších frekvencích. Zásadně se np, zmenšilo zpoždění (skew) při distribuci základní taktovací frekvence.
Změny funkčnosti a počtu interních jednotek v případě Prescotta nejsou natolik zásadní, aby Intel pojmenoval tento procesor jako Pentium 5. Podívejme se na odlišnosti oproti jádru Northwood:
- 90nm (0.09um) výrobní technologie
- prodloužena pipeline z 20 na 30-35 stupňů
- "cílová" frekvence 4 - 5 GHz
- L1 data cache zvětšena na 16 KB
- L2 cache zvětšena na 1 MB
- 13 nových instrukcí SSE3
- zrychlení celočíselných výpočtů
- zlepšené předvídání větvení kódu
- zlepšený pre-fetch mechanismus
- vylepšen power-management
- vylepšen Hyper-Threading
- další buffery pro Write Combining
- bezpečnostní technologie La Grande
Polovodičová technologie
Oproti 60nm širokým bránám tranzistorů u 0,13ľm technologie nabízí 0,09ľm (90nm) technologie přechody o šíři pouze 50nm a napětí kolem 1,3V. To umožní zmenšení plochy čipu, rychlejší přepínání tranzistorů s menší spotřebou a dosažení vyšších maximálních frekvencí.
Navíc Intel připravil technologii Strained Silicon. Když elektrony procházejí skrz různé materiály, vlivem magnetických polí a vyhýbání se jádrům atomů dochází k jejich zpomalování. Tím jsou elektrony bržděny a ztrácejí svou rychlost. Technologie Strained Silicon se zakládá na méně husté struktuře materiálu, čímž elektrony mají při jeho průchodu "méně překážek". To usnadňuje a zrychluje jejich pohyb. V praxi se jedná o zlepšení v řádu 10 až 20 procent přičemž náklady na aplikaci této technologie jsou minimální (kolem 2 procent).
{mospagebreak title=Interní architektura jádra}Intel slibuje zlepšenou předpověď větvení (branch prediction), zlepšený pre-fetch a zrychlení celočíselných výpočtů.
Prodloužení pipeline
Delší výpočetní pipeline je cestou, jak využít více výpočetních "slotů" v situaci, kdy rychlost paměti zdaleka nestačí sledovat rychlost moderních procesorů.
Proč delší pipeline?Procesory dnes interně pracují na frekvencích které se blíží 10ti násobku frekvence paměti. Bez dlouhé výpočetní pipeline by jejich vysoký takt neměl žádný smysl - procesor by jen čekal na paměť. Dlouhá pipeline (tu si můžeme představit jako výrobní linku v továrně která montuje auta) dovoluje provádět množství elementárních operací souběžně a současně (představte si, že by se v opačném případě celé auto montovalo na jednom pracovišti). Problém nastává, pokud dojde ke stavu "cache miss" (např. chybnou předpovědí větvení) - je to jakoby na lince zjistili, že už se má vyrábět jiný model auta. Pipeline se v tom případě musí vyprázdnit (rozdělaná práce je "resetnuta") a začíná se plnit od začátku. Čím je pipeline delší, tím déle trvá celý systém znovu rozběhnout (samozřejmě nedojde ke ztrátě dat, jen k "mikro" zdržení). Předpokládá se, že délka pipeline je u současných Prestottů 30 nebo dokonce i 35 "stages" - to by mělo stačit k dosažení asi 4GHz, výše se tato pipeline musí ještě dále "prohlubovat". Pozn: u Nortwoodů stačilo 20 a u Pentií III jen 10 "stages". |
Nevýhodou dlouhé a úzké pipeline je, že výkon procesoru je velmi závislý na technologiích snižujících latence (zpoždění) v systému jako je np. efektivní předpovídání větvení kódu (branch prediction), "předzásobení daty" (prefetching) a také na efektivní práci vyrovnávací paměti cache. Také Intelem tolik oblíbené vícevláknové paralelní zpracování dat (HyperThreading) je metodou jak snižovat ztráty způsobené zpožděním - v případě stavu "cache miss" může procesor, v ideálním případě, naplnit jednotky instrukcemi z dalšího výpočetního vlákna.
Je tedy pravděpodobné, že v klasickém "jedno-threadovém" scénaři a na nízkých počátečních frekvencích nebude Prescott nijak excelovat. Je také zřejmé, že nový vítr do plachet Prescot nabere s dalším zvýšením frekvence FSB (to už ale bude s novými čipsety a na platformě Socket T).
Instrukce SSE3
Prescott obsahuje 13 nových instrukcí (PNI, Prescott New Instructions) které jsou nazvané SSE3.
Kuriózní je, že většinu nových instrukcí stanoví instrukce, na které se v sadách SSE nebo SSE2 "zapomnělo". Výjimkou jsou nové instrukce pro synchronizaci výpočetních vláken a instrukce LDDQU, která by mohla urychlit kompresi videa až o 10%.
Cache a paměťový subsystém
Většinu tranzistorů v jádře zaměstnává 1MB velká paměť cache druhé úrovně (i když cache L1 pro data také narostla, z 8KB na 16KB). Zdá se však, že další honba za vyššími takty způsobila, že rychlost cache Prescottu je ve srovnání s Nortwoodem nižší.
graf je převzatý ze serveru XBirLabs.com
Změny jádra si vyžádaly změny v časování paměti cache - u 16KB bloku dat jsou to 4 a 28 cyklů (L1 a L2) proti 2 a 19 cyklům Northwoodu. Lze tedy konstatovat, že v současné situaci je paměť cache nejenom větší, ale zároveň i pomalejší - latence cache L1 je prakticky dvojnásobná!
Pozn. redakce: evidentně se počítá s vyššími takty jádra, kdy by byl nízký počet čekacích cyklů Northwoodu (2 cykly přístupu k L1) neudržitelný. V případě některých menších testovacích smyček dojde ve srovnání s Northwoodem téměř jistě ke zpomalení výpočtu.
Pojďme se podívat co na Prescottu inženýry nejvíce pálí...
{mospagebreak title=Žhavá záležitost: teplo a spotřeba}Kvůli změnám ve vnitřní architektuře (zejména díky nárůstu počtu tranzistorů) Prescott spotřebuje a pochopitelně i vyzáří mnohem více energie než jeho předchůdci. V minulosti tomu bylo různě - občas přechod na novou technologii / produktovou řadu sebou přinesl problémy (následující revize si s taktováním a teplem obvykle radily mnohem lépe), občas proběhl přechod hladce.
Procesor | spotřeba TDP W/100MHz (typicky) |
Pentium III Katmai (0.25um) | 5W |
Pentium III Coppermine (0.18um) | 2.8W |
Pentium III Tualatin (0.13um) | 1.2W |
Pentium 4 Willamette (0.18um) | 3.6W |
Pentium 4 Northwood (0.13um) | 2.6W |
Pentium 4 Prescott (0.09um) | 3.2W |
Už, už se zdálo, že pokrok v polovodičové technice je natolik velký, že se podaří udržet měrnou spotřebu na co nejnižší úrovni, ale první Prescotty ukázaly, že spíše nastal horší scénář.
Před časem se na Internetu objevil neoficiální "výhledový" graf s hodnotami TDP (Thermal Design Power) pro jednotlivé řady procesorů s architekturou NetBurst. Pokud se tyto hodnoty naplní, stane se nástupce Prescottu, procesor s jádrem Tejas, skutečným budoucím ekvivalentem Northwoodu (a dnešní Prescotty budou pro Pentia 4 pouhým přechodným "startérem" mnohem kvalitnějších procesorů - stejnou úlohy dříve splnily procesory s jádrem Wilamette). Celý příměr ještě dokresluje předpokládaná hodnota měrné spotřeby která by u Tejasu mohla znavu činit 2.5W /100MHz taktu!
Ve spodní části grafu jsou barevně označené konstrukční specifikace FMB (Flexible Motherboard guidelines) pro jednotlivé řady procesorů týkající se napájení ale také chlazení. Nejdříve se předpokládalo, že prvním Prescottům stačí požadavky podle "Prescott FMB1" prakticky se shodující s požadavky jaké jsou kladené na výkonnější Pentia 4 s jádrem Northwood (podle normy Northwood FMB2). Po prvních testech bylo jasné, že rané Prescotty vyžadují lepší napájení i chlazení a dočasně vznikla specifikace FMB1.5. Žhavými místy v konstrukcí (a někdy doslova) se stalo napájení a chlazení. Pokud máte výkonný zdroj a moderní základní desku, nemělo by osazení Pentia 4 3E, 3.2E, případně 3.4E činit problémy, co však může činit problémy, je efektivní a účinné chlazení.
Podívejte se na srovnání TDP dnešní Intelské "špičky":
P4 (Prescott) |
Pentium 4 |
Pentium 4 XE | |
Vcore |
1.25 - 1.4V |
1.475 - 1.55V |
1.475-1.55V |
3.2GHz |
103W |
82W |
92W |
3.0GHz |
89W |
81W |
- |
Přes 100W "živého výkonu" (a více v maximu) jsou hodnoty, které na první pohled vypadají tragicky, ale které jsme tu prakticky měli v podobě posledních 2GHz Pentií 4 první generace (Willamette CPUID 0F0x a 0F1x).
PCtuning komentuje
Málo příjemným zjištěním je, že honba za vysokým výkonem rapidně předbíhá rozumné limity týkající se spotřeby a tepelného výkonu. Této otázce se nevyhne ani firma AMD, i když otázkou je v jaké míře s ní bude zápasit.
{mospagebreak title=Testy: CPU}Zanechme ale už té teorie a pojďme se podívat na to, na co jsme všichni tak dlouho čekali. Následující testy nám pomohou odhalit, zda si Prescott polepšil či pohoršil oproti předchůdci a hlavně jak si vede oproti konkurenci od AMD.
Testovací sestavy
- Procesor Intel Pentium 4 3,2GHz Northwood a Pentium 4 3,2GHz Prescott
- Základní deska ASUS P4C800 Deluxe
- 2x 512MB/400MHz Kingmax (CL2-3-3-6)
- Grafická karta Triplex Radeon 9800XT
- Windows XP Professional SP1 CZ, Catalyst 4.1, Intel INF 5.1.1.1002
sestavu s Prescottem zapůjčila firma ATComputers a.s.
- Procesor AMD Athlon64 FX-51 (2,2GHz)
- Základní deska ASUS SK8N
- 2x 512MB/400MHz Infeon (CL2-3-3-6)
- Grafická karta Triplex Radeon 9800XT
- Windows XP Professional SP1 CZ, Catalyst 4.1, nVidia 3.13
- Procesor AMD Athlon64 3200+ (2GHz)
- Základní deska Epox 8HDA3+
- 2x 512MB/400MHz Kingmax (CL2-3-3-6)
- Grafická karta Triplex Radeon 9800XT
- Windows XP Professional SP1 CZ, Catalyst 4.1, VIA 4in1 4.51
Výkonnostní testy
Ceny procesorů s jádrem Prescott jsou identické jako u stejně taktovaných Northwoodů. Evidentně se nemá jednat o žádného "bijce" Athlonů 64 FX (typ s dvoukanálovým řadičem paměti) - na té pozici mají být stále Pentia 4 Extreme Edition (alespoň do doby než Prescotty zvládnou frekvence blížící se frekvenci 4GHz). Než se tak stane, Prescotty mají být spíše protivníky Athlonům 64.
Testovalo se v klasické plejádě testů: od 3D benchmarků, testů propustnosti pamětí tak i v CPU testech jednotlivých programů a právě těmi začneme.
3DMark 2003 CPU Score
I když je 3DMark 03 primárně určen k testování grafických karet, dokáže ve svém CPU testu výborně rozškálovat výkony procesorů. Těžiště testu spočívá mezi výpočetním výkonem a propustnosti pamětí. Není proto divu, že Athlon FX-51 s rychlým přístupem k paměti a enormně nízkými latencemi poráží ostatní zúčastněné procesory o více než 13%.
Rozdíly mezi Prescottem a Pentiem jsou zanedbatelné. Athlon 64 3200+ je v těsném závěsu.
AquaMark 3 CPU Score
Další z 3D benchmarků, který má implementován i test CPU - tento test by měl využívat i Hyper-Threadingu. Díky tomu Pentium s jádrem Northwood v tomto testu vyrovnává výkon Athlona FX-51 (Prescott mírně zaostává), o Athlonu 64 3200+ nemluvě.
PCMark 2004 CPU Score
PCMark 2004, stejně jako předchozí test, dokáže využít HyperThreadingu a je tedy více "nakloněn" procesorům firmy Intel. Prescott dává podobné výsledky jako Northwood - rozdíl 0.5% je pod předpokládanou chybou měření.
CPU Mark 99
Letitý test CPUmark 99 je souborem sestávajícím z fragmentů často používaného neoptimalizovaného "syrového" kódu. Je velmi závislý na paměti cache (fragmenty jsou poměrně malé) a příliš přesně dnes již neukazuje, jak si procesor bude radit s moderními aplikacemi.
To, že Prescott nebude excelovat (pomalá L1 cache), bylo jasné o začátku. Že však dostane takový "kartáč" (14% ztráty), jsem nečekal.
Sandra 2004 Arithmetic FPU
V testu Arithmetic opět vede starší kolega Northwood. Zvětšená cache a délka pipeline u Prescottu poněkud brzdí jeho výkon. Stejně tak je tomu i u testu SSE2.
Sandra 2004 Multimedia
V subtestu "Multimedia" Sandry 2004 je na tom lépe stále jádro Northwood (Prescotta brzdí pomalejší paměť cache a). V Integer je rozdíl větší než 15%, u testu Float je to pak cca 8%.
Sandra Arithmetic SSE2
Syntetické CPU testy Pentiím 4 s jádrem Prescott příliš nesvědčí - čím je test jednodušší, tím se negativněji projevuje pomalejší paměť cache (CPUMark 99). U složitých aplikací jako je Aquamark CPU test jsou výkony nováčka na úrovni Northwoodu.
Nejdražším procesorem v tomto testu je Athlon FX-51 (730USD), zatímco Pentia 4 3.2 (Northwood i Prescott) stojí cca 280USD.
{mospagebreak title=Testy: propustnost paměti}Testy propustnosti pamětí by měly jít Prescottu o něco lépe než testy předchozí. Zde by se mohla projevit velká paměť L2 (latence cache by se neměla tolik projevit - latence L2 cache ve srovnání s latenci paměti je tak jak tak asi 10x menší).
PCMark 2004 Memory
V testu propustností pamětí u PCMarku 04 vede jednoznačně Athlon FX-51 (který exceluje díky dvoukanálovému radiči paměti který je integrovaný do procesoru) - přesto je postup Prescottu poměrně vysoký - dotahuje se na FX-51 a Northwood překonává o více jak 7%.
AIDA32 Memory
Stejně jako u předchozího testu i v Aidě 32 vede Prescott před Northwoodem. Zde je rozdíl už dokonce nad 16% u zápisu, u čtení je to pak +15%.
Sandra Memory
Trend větší paměťové propustnosti následuje i u memory testu Sandry 2004. Rozdíly jsou však menší, pohybují se v řádu +1% pro Prescott.
PCMark 2002, Memory test
Testovací program PCMark 2002 ukazuje, že samotná výpočetní práce je pro jádro Prescott více náročnější a v testu CPU dostal od svého staršího bratříčka na frak. Test pamětí je však pro Prescott opět jakousi "živou vodou". Takřka 17% je značným rozdílem.
{mospagebreak title=Testy: Kombinované testy}Hry
3DMark 2003
Obecný "3DMark 03" je především o výkonu grafické karty (a grafického procesoru GPU).
Nemůžete se proto divit (i když jsme použili Radeona 9800XT), že v oblíbeném 3DMarku 03 příliš velké rozdíly mezi soupeři nejsou.
3DMark 2001
Tento starší test nevytěžuje grafiku jako jeho bráška "2003" - ke slovu přichází ten, kdo dokáže grafické kartě poskytnout zpracovaná data rychleji.
3DMark 2001 jde o poznání lépe procesorům firmy AMD, rozdíly mezi Intely jsou nepatrné.
Aquamark3 Default FPS
Výsledné FPS v testovacím programu Aquamark 3.0 ukázaly, že (mnohem dražší) AMD FX-51 dokáže s 3D prostě pracovat lépe. Rozdíly mezi Pentii jsou spíše v řádu statistické chyby, Athlon 64 3200+ je poslední.
Rendering, Raytracing
Cinebench 2003 (Cinema XL)
Cinebench 2003 patří mezi aplikace, kde se jen potvrdilo, že optimalizace kódu pro procesory Pentium 4 (znovu využítí HyperThreadingu pro raytracing) dokáže procesory konkurence zatlačit do kouta. Rozdíly mezi Notrhwoodem a Prescottem jsou opět minimální.
Video
DivX Compression (DivX 5.12)
Také tento poměrně moderní "polokomerční" kodek je optimalizovaný pro HT. Dokonce bych se nedivil, kdyby se zjistilo, že byl kompilován s využitím SSE3.
V testu komprese DivX vítězí jednoznačně procesor Prescott. Je to, mimo testu propustnosti paměti, jediný test, kde výrazněji uspěl nad Northwoodem.
WinRAR 3.20
Žádná optimalizace, žádný náskok procesorů Pentium 4 (zde evidentně platí "no pain, no gain"). AMD chroustá "syrová" data rychleji.
Stejně tak komprese souborů je oblast, kde si jádro Prescott oproti Northwoodu (díky 1MB paměti cache) polepšilo.
{mospagebreak title=Závěr}Co dodat? Jádro Prescott má jistě své opodstatnění v evolučním řetězci firmy Intel, přesto je na tom poněkud hůře, než všichni čekali. Vzhledem k jeho výkonům na současné platformě (pokud přihlédneme k jeho taktování, k 800MHz FSB, k rané revizi jádra...) je v současnosti zbytečné jakkoli na něj upgradovat - svá křídla nejspíše rozvine (s vyšším fsb a novějším čipsetem) později, až pod Socketem T.
Abych byl přesnější, výkony nejsou špatné, občas dokonce i velmi dobré - problémem je však cena, kterou za to bychom dnes museli platit - tím myslím generované teplo a následný hluk.
Více by se postupem času mělo změnit, až bude více optimalizován programový kód (a ten bude, neboť Intel své továrny překlopí na Preccotty ať se to nám líbí nebo ne).
Chcete mě?
Pokud jde o architekturu jádra, doznala několika účelových změn. Byla prodloužena pipeline, zvětšila se paměť cache avšak její časování již není tak "agresivní". To vše otevírá prostor k tomu, aby Prescott zvládl frekvence 4GHz a vyšší. Dnes je to jako těžší auto se zesíleným podvozkem a účinnými brzdami které čeká na... výkonnější palivo! Pokud porovnáme Prescott a Northwood na stávajících aplikacích při stejné taktovací frekvenci, snadno zjistíme, že Prescott v některých případech zaostává - není divu, nové auto s původním palivem (procesor běžící na stejné frekvenci) bude stěží akcelerovat lépe než původní odladěný vůz.
Otazníkem je, jestli nepříliš dynamický start nezpůsobily komplikace při výrobě. Intel přešel na novou technologii výroby 90nm s využitím technologie Strained Silicon a zdá se, že ne vše jde přesně podle plánu (je tady minimálně zpoždění) - při prvním oznámení Prescottu na IDF v roce 2002 se odhadovalo, že jeho startovací frekvence bude kolem 4 GHz. Ano, v tom případě by se jednalo o procesor, na který jsme všichni čekali.
Dnešní situace je podobná té z doby počátků architektury NetBurst. Její zástupci měli také prodlouženu pipeline oproti tehdejším zástupcům architektury P6 (a to rovnou o 100%). Kdybychom porovnali nejrychlejší Pentium III s jádrem Tualatin na 1.4 GHz a Pentium 4 na stejné frekvenci (jednalo se o jádro Willamete), snadno bychom zjistili, že Pentium III bude mít výkonnostně značně navrch.
Osobní poznámka: Satisfakci mohou mít příznivci AMD, neboť se praxi prokázalo, že výkon skutečně nelze měřit pouhým taktem jádra (vypadá to, že ten ze začátku zpochybňovaný Performance Rating u AMD není až tak špatný nápad). Jediným východiskem jsou testy, případně srovnání procesorů ve stejné cenové kategorii. Díky politice AMD a Intelu dnes všechny modely Athlon 64 3200+, Pentium 4 HT 3.2 (NW i Prescort) stojí prakticky stejně. Je tedy na vás, co byste si vybrali - vzhledem k tomu, že i Athlony 64 budou měnit "socket", je jedinou rozumnou volbou... počkat.
Overclocking
K dispozici jsme měli předprodukční verze procesorů - nelze tedy usuzovat, jaký je jejich taktovací potenciál. Zvyšováním FSB jsme se dostali na 3.52GHz (výkony byly podobné P4 běžící na stejné frekvenci) - potom bychom procesor již museli vymontovat ze skříně.
P.S. "defaultní" napájecí napětí bylo 1.35V.
Za zapůjčení Sestavy s Pentiem 4 Prescott děkujeme firmě ATComputers a.s
S architekturou P6 jako první přišel již procesor Pentium Pro, kterého postupem času následovaly procesory Pentium II a Pentium III. Pentium Pro se ale pro svou komplikovanost a hlavně cenu nikterak nerozšířil. Byl uveden již v roce 1995 (2 roky před Pentiem MMX) a proto neobsahoval MMX instrukce. Paměť L2 cache byla u něj řešena poměrně atypicky. Dosahovala velikosti od 256KB až po 1MB a kvůli tomu a výrobnímu procesu 0,50 později 0,35um (na tu dobu byla plocha teto paměti obrovská) nebyla implementována do jádra. L2 cache tvořila druhý samostatný čip který byl umístěn vedle jádra a oba čipy byly kryty společným heatspreaderem (rozptylovačem tepla), což nebylo z hlediska chlazení jádra zrovna ideální. Následovník Pentium II měl L2 cache již oddělenou zcela.
Pentium II
Tento procesor přinesl změnu ve způsobu usazováni procesoru. Nové pouzdro bylo označováno S.E.C.C. (Single Edge Contact Cartridge). Namísto socketu šlo o "slot", konektor do kterého se zasunovala cartridge, která obsahovala procesor. Samotný procesor byl umístěn na desce plošných spojů společně s vyrovnávací pamětí druhé úrovně (L2 cache) o velikosti 512 KB (což by v té době při 0.35 mikronovém výrobním procesu nebylo možné do jádra vtěsnat). Paměť cache byla tvořena 2 samostatnými čipy SRAM. Celá konstrukce byla z jedné strany přikryta rozsáhlým hliníkovým pasivem opatřeným větráčkem a výsledný celek byl uzavřen do černé plastové cartridge.
Změny, které přineslo Pentium II:
- velikost L1 cache byla zvýšena na 32 KB (16 KB pro instrukce, 16 KB pro data),
- L2 cache velikosti 512 KB umístěna mimo jádro pracující na jeho poloviční rychlosti,
- zrychlena systémová sběrnice na 100 MHz,
Pentium II | ||
Jádro | Klamath | Deschutes |
Rok uvedení | 1997 | 1998 |
L1 cache | 32 KB | 32 KB |
L2 cache | 512 KB | 512 KB |
Výrobní proces | 0,35 | 0,25 |
FSB (MHz) | 66 | 66, 100 |
Frekvenční rozsah | 233 - 300 MHz | 333 - 450 MHz |
SIMD | MMX | MMX |
Počet tranzistorů | 7,5 milionů | 7,5 milionů |
Usazení | Slot 1 | Slot 1 |
Pentium III
Přineslo s sebou novou instrukční sadu s označením SSE (Streaming SIMD Extension). Byla tak rozšířením MMX o novou sadu 128-bitových registrů. Způsob usazení prvních procesoru PIII byl kompatibilní s procesorem Pentium II - Slot 1. V případě jádra Katmai se ale jednalo jen o trochu vylepšené Pentium II - tehdy se Intel znovu začal vracet k Socketům. Další změny přineslo až následující jádro Coppermine.
Změny oproti svému předchůdci
- Přidány nové multimediální instrukce SSE
- inovace jádra Coppermine:
- přechod zpět do socketového provedení
- změny L2 Cache
- Advanced Transfer Cache - byla přesunuta do jádra procesoru
- zmenšena z 512 KB na 256 KB
- zdvojnásobena její rychlost - pracovala již na plné rychlosti jádra
- zrychlena systémová sběrnice na 133 MHz
Pentium III | |||
Jádro | Katmai | Coppermine | Tualatin |
Rok uvedení | 1999 | 1999 | 2001 |
L1 cache | 32 KB | 32 KB | 32 KB |
L2 cache | 512 KB | 256 KB | 512 KB |
Výrobní proces | 0,25 | 0,18 | 0,13 |
FSB (MHz) | 100 | 100, 133 | 133 |
Frekvenční rozsah | 450 - 600 | 500 - 1130 | 1130 - 1400 |
Instrukční sady | MMX, SSE | MMX, SSE | MMX, SSE |
Počet tranzistorů | 9,5 milionů | 28 milionů | 44 milionů |
Usazení | Slot 1 | Socket 370 | Socket 370 |
Inovované jádro Coppermine přineslo změnu v provedení procesoru. Jednalo se o FCPGA (Flip Chip Pin Grid Array). Posledním jádrem vycházejícím z architektury P6 byl Tualatin pracující na 133 MHz systémové sběrnici se zdvojnásobenou L2 Cache. Jádro měl narozdíl od svého předchůdce kryté heatspreaderem. Tualatin zakončil architekturu P6 na frekvenci 1.4 GHz. Jednalo se již o vypilovaný a bezproblémový procesor.
V té době ale začal Intel prosazovat svou zcela novou architekturu NetBurst, která nám přináší i dnešního oslavence - Prescott.
{mospagebreak title=Dodatek 2: Architektura NetBurst}- Rapid Execution Engine
- aritmeticko-logické jednotky (ALU) běží na dvojnásobné frekvenci procesoru
- základní celočíselné operace se provedou v 1/2 taktu procesoru
- poskytuje vyšší propustnost a snížení čekacích dob výpočtů
- Hyper Pipelined Technology (Hyper řetězová technologie)
- 20-ti stupňová pipeline k dosažení vysokých frekvencí pro desktopová PC a servery
- možnost dále zvyšovat frekvence oproti konkurenci
- Advanced Dynamic Execution (vyspělé dynamické provádění)
- zvýšená schopnost předpovědi větvení
- snižuje chybu špatné předpovědi spojenou s hlubším řetězením
- vylepšený algoritmus pro předpověď větvení
- Innovative Cache Subsystem
- L1 Cache
- Execution Trace Cache vyrovnává dekódované instrukce
- Execution Trace Cache odstraňuje čekací dobu dekodéru u hlavního prováděcího cyklu
- Data cache s nízkým spožděním 2 cyklů
- L2 Cache
- Advanced Transfer Cache pracující na plné rychlosti jádra
- šířka pásma a výkon roste s rostoucí frekvencí procesoru
- Vysokorychlostní systémová sběrnice
SSE2 (Streaming SIMD Extension 2)
- Přínáší s sebou rozšíření sady SSE o další sadu 144 nových instrukcí s označením SSE2, které obsahují:
- 128-bit SIMD instrukce pro celočíselné aritmetické operace
- 128-bit SIMD instrukce s dvojnásobnou přesností operací s plovoucí desetinou čárkou
- Lze říci, že SSE2 zrychluje hlavně práci s videem, rozpoznávání řeči, šifrování a zpracování obrazu.
400, 533 a 800 MHz systémová sběrnice
- Datový tok 3.2 GB/sec (3x více než Pentium III)
- 100 MHz sběrnice, která pracuje v režimu QDR efektivní rychlostí 400 MHz
- Podpora pro vyšší datový tok s vyšší rychlostí sběrnice (533 MHz - 4.3 GB/sec, 800 MHz - 6.4 GB/sec)
Podpora pro technologie Hyper-Threading
Kompatibilní s aplikacemi a operačními systémy napsanými pro běh na procesorech architektury IA-32.
Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz
Go Go AMD
Nejdriv tedy "oba"?? pentia predhaneji nejakeho FX-52 (51 asi) a nakonec pak Prescott mirne zaostava?
/opraveno...
Pritom prave Northwodd ma vyrazne lepsi skore nez Prescott.:
A pak jeste k "hernim" testum: Hraje nekdo z vas 3D marky? nebo Aquvamark? Kde jsou ty herni testy proboha?
Nei to spatna recenze, ale tech nepresnosti a chyb je opravdu pozehnane...
je typicka spotreba P4E@3,2Ghz 115W a max. niekde okolo 125W
Podme sa v tejto zime teda zahriat...
AMD 1 - Intel 0 ;)
"Letitý test CPUmark 99 je souborem sestávajícím z fragmentů často používaného neoptimalizovaného "syrového" kódu. Je velmi závislý na paměti cache" Jestli je tak zavisly na cache, tak proc v nem nevede Prescott s 1MB L2 Cache?
"Zvětšená cache a délka pipeline u Prescottu poněkud brzdí jeho výkon" Co s tim ma spolecneho velikost kdyz se cely kod CPU testu Sandry do te cahce vejde, prave proto je to test ciste vypocetnich jednotek, zalezi tedy jen na rychlosti cache, ne na velikosti.
AMD = CPU do multimediálního počítače
AMD Duron = CPU do kancelářskýho (i herního) počítače
intel = :-(
ked je konkurencia je to len vyhoda prenas - snazia sa dodat najlepsie cpu a ceny idu dole (neze by bol Athlon64 FX taky lacny :-) ale som fanda AMD, Intel mam na haku
AMD RULEEEEEEEEZ!
Jestli situace bude stejna jako u prvnich P4 (Willamete).
Tak jdu opet do AMD.
1) Pro AMD je pouzita nforce3 i kdyz kazdy vi ze konkurence od VIA je mnohem lepsi
2) Ve spouste testu neni ukazan rival od AMD. Proc?
3) V tech testech co FX vitezi je mezi radky - jen diky onDie radici pameti => nevsimejte si jich. HMMM.
A nakonec Zajimave je videt jak rostou vykony Hammeru se zvisovanim frekvence. Na 200MHz je tak 10% narust a to taky o necem svedci
Jedine co bych vyzdvihl je poznamka ze AMD bude prechazet na novej socket a tak je opravdu lepsi pockat
na 3Ghz. Aha maly pokles je pokrok, tak to je presne mysleni Intelaka
NW je vetsinou rychlsji za stejnou cenu, ma mensi spotrebu, mene se zahriva, podporuje ho kazda deska.
BTW mam radeji AMD
1) Athlon XP 1700+, KT266A, 256MB RAM, 60 GB Seagate, GF 4200Ti, CDRW, TV (127W, 143W)
2) Athlon XP 1800+, KT333 , 256MB RAM, 80 GB Seagate, GF 440MX, CDRW, TV atd. (115W, 130W)
3) Athlon 1000, 256 MB RAM, GF 440 MX, TV (100W, 110W)
4) Athlon 850, 512 MB RAM, Matrox Parhelia, 40GB Seagate (95W, 105W)
6) Pentium 4 Nothwood 2.4, 512 MB RAM, 80 GB Seagate, Radeon 9200 (60W, 105W)
Kdyz vezmu ucinnost zdroje asi 66% => spotreba PC asi 40W (CPU, MB, grafarna atd.)
Myslim, ze kdyz Amd 64 ma nejnizsi spotrebu 35W (+ spotreba mustku, a zbytku MB), urcite to zase da tech 40W.
Podle mne to take muze vysvetlovat to, ze AMD se hure chladi (kdy bere v IDLE 2x vice nez Intel). Chtelo by to nejake nezavisle testy v recenzi.
Zarazil mne rozdil mezi idle a full load asi 15W u systemu na AMD a 50-60W u Intelu.
Meril jsem prikon celeho pocitace digitalnim meridlem spotreby.
Myslim, ze system by se pri necinesti urcite mel dostat pod 50W, jestli chci mit pecko trvale zapnute v obyvaku v dobe, kdy jsem doma.
Zajimaly by mne mereni ostatnich.
Zatez CPU jsem provadel pomoci CPUStabTest.exe, (CPU Stability Test) v.6.0.
Nanesl jsem to pouze jako namet k dalsim merenim ostatnich.
Ale prikon tech dvou intelu proste byl fakt od 60 do 110W a
u merenych AMD Athlon XP 120W - 135W plus minus.
I kdyby vsechno jine ovlivnovalo mereni, tak porad to vychazi, ze Northwood v idle nemuze mit brat vice nez tech 60W ze site (ale je tu ucinnost zdroje, grafarna, disky, pameti, ventilatory, floppy atd.).
Nebyla by spatne, kdyby se na toto zamerili i pri testovani sestav pocitacu. Zmerit spotrebu sestavy je to nejmensi.
Na intelu ale neni ve Win2000 ani XP treba nic instalovat, zadne SW chlazeni. Je to standardni chovani a pruhy v TV tam nejsou :-)
To s tou TV kartou je spis nahoda, TV karty jsou obecne dost problemova zalezitost - mozna by ti v jine masine s Intelem delala jeste horsi problemy. Spis jsem mel problem pri SW chlazeni s praskanim zvuku integrovane zvukovky, ale nova zvukovka to vyresila. Jinak uprime receno, tohle nativni SW chlazeni u Intelu ja teda zrovna za nejakou obrovskou vyhodu nepovazuju - spis z nouze ctnost. Jestli mi doma zere proud nejaky ekvivalent 100W zarovky navic me netrapi (kdyby me to vadilo, koupim si notebook), s teplotou, stabilitou, hlukem ani s vykonem problemy nemam, takze jsem da se rict celkem spokojeny AMD-ckar...:-)
proc vyvojari firmy intel myslej pozpatku? K cemu je ten nizsi vykon dobrej?
Jo a co to teplo i pres 90nm, to byl taky tajnej zamer vyvojaru? Prosimte uz i intelaci videj ze to tentokrat intel zkonil, tak se tu neztrapnuj.
A od ceho myslis ze jsou SSE instrukce? neprinasej poradnej vykon, ani nic uzitecnyho (lepsi clanek je na svethardware) ale prinasej intelu vyhodu kterou si podle antimonopolniho uradu muze zachovat maximalne rok, a pak musi licenci na
tuhle technologii nabidnout konkurenci aby nebrzdil konkurencni boj, jenze kdyz tuhle vyhodu za rok ztrati, tak co udela - vymysli si dalsi instrukce - SSE2 a ma zase na rok vystarano ;) a tak to jde dal, proto mame dnes SSE3 a bude jich vic, pritom je videt ze jsou na nic - viz komprese videa TMPGenc kde SSE2 zpomalujou vykon opteronu!
2 Redakce: To si snad děláte srandu - použít desku s nForce 3, která má tuším 600 MHz HT oproti VIA s 800 MHz HT?!? Ztráta 25 % v šířce sběrnice kvůli tomu, že jste použili šitovou desku - tomu říkáte objektivní recenze?!? FUJ!!!!!
Mam P4 2.4GHz 800qFSB a v idle 16C(SW cooler ve WXP) a pri warm 28C. Je na tom CoolerMaster DI4-8KD3B-0L (http://www.coolermaster.com /index.php?LT=english&Language_s=2&url_place=product&p_serial=DI4-8KD3B-0L&other_title=0)
1. Testovat 64bit Athlona v doske s nForce3??? Su aj lepsie chipsety (aspon 1 urcite k8t800)
2. Je sice pekne, ze porovnavate to najlepsie od Intelu a to najlepsie od AMD, ale co tak skusit nainstalovat 64-bit OS a porovnavat potom... Windows sice este nieje ale aj v unix systemoch by slo zmerat vypoctovy vykon. Intelu ste podmienky vytvorili (soft s podporou HT a SSE3), ale AMDcku nie.
3. Zatial nam ustredne kurenie sluzi, ale keby sa nahodou upchal plynovod z Ruska tak urcite kupim Prescott (mozno aj 2)
Intel ma teraz sklamal. Osobne sice uprednostnujem AMD, ale proti P4 NW som v zasade nic nemal (mozno keby boli za 1/3 ceny mam tiez P4) - ale Prescott urcite nie.
Moja situacia: V lete som kupil Athlon XP 1800+ (asi 50$
Ze by byly boxovane chladice tak super, ze uchladi 80W na 35stupnu???
Zvlastni je, ze "usporne" Athlony nemaji s box chladicem v klidu 35 stupnu ani nahodou. Spis 40-45 a maximalka je 60 i vice stupnu.
Dokaze mi to nekdo vysvetlit?
http://www.vrforums.com/showthread.php?s=e91689f48cbee3a265cd0b10ec7f4f5d&threadid=12686
Jen tam BTW proč se furt AMD tak chvástá s procesory označenýmy jako 3200+ když jejich výkon není ani zdaleka takovej jako P4 3.2 ghz ??? Koneckonců zákazníkovi by se nemělo nic nalhávat....
Prescott je projektovan (a zahy pobezi) na frekvencich 4-5GHz (mozna i vice). Dnesni srovnavani je, jako kdyz si svyho Bartonicka nebo FX-jakykoli hodis na FSB 100MHz a budes porovnavat s procesorem na 200MHz FSB.
Prikon? V cem je problem? Fyzika je neoblafnutelna, zakony zachovani energie zatim ve znamem vesmiru plati, stejne tak i termodynamika. A ta rika, ze vetsi vykon pri stejnem fyzikalnim principu premeny energie vyzaduje vetsi prikon, a pri dane ucinnosti procesu (ktera je stejna nebo podobna, pokud pouzijeme stejny polovodicovy substrat, stejnou technologii vytvareni tranzistoru a propojek mezi nimi)a diky termodynamice budou i vetsi ztraty (v absolutni velicine), coz je ono zbytkove teplo. vratme se do skoly a vzpomenme si, jak se chova entropie entalpie v uzavrenem systemu, ze.
Takze strkat Prescotta do dnesnich desek s dnesnima FSB, dnesni propustnosti RAM a sbernic je zatim strkani motoru z Ferrari do sasi VW Golfa. 320kmph ten Golf s nim totiz nepojede, driv se rozpadne, nez takovou rychlost vubec nabere. A kdyz ten motor uskrtim na 50% vykonu, nebo ho necham bezet na 4 valce z osmi (nebo 6 z 12), tak to asi taky nebude optimalni varianta, ne?
zajemce o kvalitnejsi info muze zacit napr na
http://arstechnica.com/paedia/c/cpu/part-2/cpu2-1.html
šmejd a blud co se o ní vykládá? Předem děkuji za informaci
http://dejv.webz.cz
Warning W234 - You are using a Hyper-Threaded system on an Operating System that either does not support HT or does not support the total number of logical CPUs of the system. Thus Hyper-Threading is not properly utilised. You may as well disable it.
Fix: Make sure you are using the right Hyper-Threading kernel or update your Operating System for HT support (use Windows XP/2003 or later). Do note that some Operating Systems and software have licensing limits that may prevent you from using all CPUs or you may be in violation of your licence.
SiSoftware Sandra Help File
netusite jak tuhle chybu opravit jestli sehnat nejaky update Windoze nebo skusit sehnat ten Win XP/2003? ono se to totiz neda nijak ostranit ani zakazat ikdyz to vse udelam porad ji pouziva a tuhne a tuhne diky za kazdou pomoc