Hlavní stránka Hardware Procesory, paměti 2v1: Pentium4 3GHz HT aneb až 30% zdarma
2v1: Pentium4 3GHz HT aneb až 30% zdarma
autor: Kwolek Jirka , publikováno 14.11.2002
Když jsme před časem psali o technologii HyperThreading, připadaly nám záležitosti okolo této technologie, umožňující "rozdvojení" procesoru na dvě logické jednotky, jako pouhé plané teoretické úvahy - prostě něco co začne a skončí v laboratořích. A přesně tak to i skončilo... považujeme-li kancelář PCtuningu za laboratoř :-) Pojďme se podívat blíže na něco, co v budoucnu nakonec možná skončí v "laboratoři" nejednoho z nás. {mospagebreak title=HyperThreding - vo co go?}

V tomto článku se nebudu dlouze věnovat přece jen poněkud nezáživné teorii - tomu raději věnujeme samostatný článek. Dnes se pouze zaměřím na klíčové aspekty nové technologie a na to, co nás zajímá: "co to znamená pro běžnou praxi u nás, v ČR...".

Teorie - absolutní minimum

U základů teorie HyperThreadingu je poznatek, že jednotlivé jednotky procesoru nejsou v průběhu vykonávání programu využity stoprocentně. Při vykonávaní jednoho výpočetního vlákna (anglicky thread) se vyskytují okamžiky, kdy určité části jádra procesoru (ALU / FPU) zahálí. Proč tedy nevytvořit mechanizmus, kdy by se v daném okamžiku volné jednotky nevyužily pro výpočet dalšího, druhého programového vlákna, které by se tak vlastně počítalo souběžně. Nejedná se tedy ani o zdvojnásobení všech jednotek procesoru, ani o dva procesory "zabalené" do jednoho pouzdra, ale o technologii, která využívá výpočetních jednotek procesoru potenciálně lépe.

2v1: Pentium4 3GHz HT aneb až 30% zdarma

2v1: Pentium4 3GHz HT aneb až 30% zdarma
2v1: Pentium4 3GHz HT aneb až 30% zdarma

Poznámka: Jelikož jednotlivé virtuální procesory technologie "HyperThreading" zpracovávají paralelně pouze výpočetní vlákna (thready), můžete se setkat i s pojmem SMT, Symmetric Multi-Threading, a to narozdíl od klasické koncepce SMP, Symmetric Multi-Processing, kdy jsou k dispozici dva kompletní procesory "se vším všudy".

Efektivita Hyper-Threadingu (HT)

Prvky procesoru HT které nejsou zdvojené, jsou logickými procesory sdílené. V praxi pak mohou nastat tyto situace:

- jednotlivá vlákna budou využívat zdrojů jádra relativně efektivně:

2v1: Pentium4 3GHz HT aneb až 30% zdarma

Tento model je jistě ideální (Intel uvádí nárůst výkonu až 40%) - v této skupině si lze představit především ty programy, které jsou či budou pro HyperThreading speciálně optimalizované. Někdy však stačí, že si daný program, s HyperThreadingem prostě "sedne" - většinou se jedná o programy, kde je už od začátku počítáno i s více procesory (tedy o programy které jsou například optimalizované pro SMP, Symmetric Multi-Processing). V praxi může nastat situace, kdy je zrychlení 1 - 40%.

- běží jen jedno výpočetní vlákno:

2v1: Pentium4 3GHz HT aneb až 30% zdarma

Některé programy a procesy využívají jen jednoho výpočetního vlákna - zde nepomohou ani dvouprocesorové stroje, ani technologie HyperThreading (HT). Takových programů je dnes většina (viz. test).

- vlákna si budou navzájem "krást" potřebné jednotky:

2v1: Pentium4 3GHz HT aneb až 30% zdarma

Jednotlivá vlákna si navzájem "kradou / obsazují" stejné jednotky - druhý virtuální procesor pak čeká na uvolnění prostředků prvním (a vice-versa). Zde by pomohl plný multiprocesorový stroj. HyperThreading zde selhává.

V praxi, jak jsme zjistili, nastává mix všech tři případů - to v závislosti na množství a charakteru spuštěných programů. Někde HT skutečně pomáhá, jinde je jeho přínos nulový (od 0% až do 35%). S výkonovým propadem jsme se v našich testech nesetkali (*za předpokladu nasazení správného OS i hardwaru - viz. dále).

V další části probereme procesory, které umí HT + potřebné vybavení...

{mospagebreak title=Intel, Pentium4 a HyperThreading}

Technologii HyperThreading, známou dříve jako "Jackson technology", se u Intelu zabývají již poměrně dlouho. Je tomu téměř rok, kdy se tato technologie dokonce objevila v konkrétních procesorech. Tehdy se jednalo se o serverové (rozuměj tedy i drahé) procesory založené na jádrech Foster MP a Prestonia. Vše bylo o to smutnější, že delší dobu se zároveň vědělo, že tuto technologii mají dokonce implementovanou i běžná Pentia 4, avšak standardně je vypnutá (či nezapojená). Tehdy se zdálo, že HT (HyperThreading) se stane čistě serverovou záležitostí.

Nedávné (oficiálně dnešní :-) uvedení nového Pentia 4 3.06GHz však bylo pro mnohé milým překvapením. Více důrazu než na pokoření hranice 3GHz se totiž v tomto případě dostává... zapnutému HyprThreadingu těchto procesorů. Poznámka: Jeden procesor z první tranže jsme měli možnost testovat i my.

2v1: Pentium4 3GHz HT aneb až 30% zdarma
Obrovská výhoda: Hyper-Threading lze zapínat i vypínat přímo v BIOSu

2v1: Pentium4 3GHz HT aneb až 30% zdarma
nové vlastnosti, nové logo
(všimněte si písmen HT vpravo nahoře)

Zároveň "vyšly najevo" požadavky, které musí systém splňovat, aby byl HyperThreading vůbec možný.

Kompatibilita hardwaru a softwaru

Operační systémy - nejlépe Windows XP (.NET)

Dosud jediným operačním systémem Windows umožňujícím efektivní využívání HT jsou Windows XP (.NET server) s aktualizací Service Pack1. Předchozí operační systémy způsobují větší či menší problémy. Windows 2000 sice rozpoznají dva procesory, avšak pro provoz SMT (Symmetric Multi-Threadingu) nejsou Win 2k optimalizované - ve výsledku po zapnutí Hyper-Threadingu poklesne výkon u běžných "single-threadových" aplikací o 10 až 20%! V případě operačních systémů jako jsou Windows 95, 98 a Me doporučuje Intel HT vypnout v BIOSu.

Poznámka: Windows XP jsou naproti tomu operačním systémem pro HyperThreading speciálně optimalizovaným. V případě procesu, který enormně vytěžuje (např. intenzivní benchmark, náročný výpočet atd.) jedno výpočetní vlákno, dojde k uvolnění všech prostředků procesorů tím, že se souběžné vlákno vůbec nespouští (druhý logický procesor je ve stavu HLT). To má za následek nesnižování výkonu u neoptimalizovaných aplikací - na druhou stranu je jasné, že se systém s HT nechová tak elegantně jako klasické systémy SMP, kdy i pod zátěží je k dispozici stále druhý samostatný procesor (není zde totiž třeba sdílet výpočetní jednotky).

Pro ostatní OS se HyperThreading navenek "tváří" jako běžný multiprocesorový systém - odtud plyne jeho kompatibilita np. s Linuxem (doporučený je kernel 2.4.18 a vyšší).

Kompatibilní hardware

Podmínkou správného provozu HyperThreadingu je následující hardware:

  • odpovídající procesor - zde Pentium 4 3.06GHz (s HT),
  • správná čipová sada - 850E (na té jsme testovali), 845: E, PE, GE, G (rev. B) a GV,
  • odpovídající BIOS - čipová sada nebude vždy zárukou,

Jak vidíte, jedinými čipovými sadami, které umožní běh Hyper-Threadingu jsou poslední čipové sady Intelu. Dosud není jasné, jestli i ostatní výrobci vyrobí odpovídající čipové sady, zdá se však, že by jim na cestě nemuselo stát nic zásadního (většina funkcí je integrována v procesoru, otázkou čipové sady je správná inicializace dvouprocesorového režimu).

Co se týče nových současných a budoucích desek, je podpora HT ve většině případů jistá - horší to je se staršími deskami, zde budete položku "Hyper-Threading - Enabled / Disabled" nejspíše hledat marně.

{mospagebreak title=Testy a závěr}

Testy jsme prováděli na pracovní stanici od firmy Vahal. Ta byla vybavena takto:

  • procesor Pentium 4 3.06GHz, podpora HT,
  • základní deska Intel D850MV, čipová sada 850E,
  • 512MB paměti RDRAM, Samsung
  • základní disk Seagate Barracuda IV, ST340016A,
  • grafická karta MSI G4 Ti4600, 128MB DDR SDRAM,  Det. 40.72,
  • operační systém Windows XP Professional, Service Pack 1

Na sestavě jsme provedli standardní sestavu testů v konfiguraci se zapnutým i vypnutým Hyper-Threadingem. Musím poznamenat, že většina testů nebyla optimalizovaná ani pro HT, ani pro SMP (Symmetric Multi-Processing).

SiSoft Sandra 2002 a 2003

2v1: Pentium4 3GHz HT aneb až 30% zdarma

2v1: Pentium4 3GHz HT aneb až 30% zdarma

Tento benchmark ukazuje opravdu razantní nárůsty výkonu - v testu Multi-Media Benchmark je nárůst 53% a 16%, u Arithmetic Benchmarku je tomu obdobně. Propustnost paměti zůstala na stejné úrovni. PCtuning komentuje: Zcela evidentně se programové smyčky tohoto testu do HT strefily... (a je možno spekuloval, jestli náhodou nebo záměrně). Musím však říct, že Sandra je testem, kde se s několika procesory (SMP ale i SMT?) počítalo už od začátku.

ReMpeg 1.5.2

Je oblíbeným programem běžně používaném k rekompresi záznamu MPEG2 na nižší datový tok, typicky pro snížení objemu dat při kopírování DVD, kdy je často potřeba "vtěsnat" np. 5.8GB film na 4.3GB medium. Program zachovává strukturu dat (GOP-y).

Program není příliš optimalizován - rekomprese 2h filmu trvá typicky 10-15 hodin. Program však podporuje SMP.

2v1: Pentium4 3GHz HT aneb až 30% zdarma

Rekomprimoval jsem 486s (cca 8min) záznamu na 60% datový tok (byla zapnuta volba Reference DCT). Výsledky jsou zajímavé:

2v1: Pentium4 3GHz HT aneb až 30% zdarma

I když program umí obsloužit dva procesory, s Hyper-Threadingem se nedokáže "domluvit", a lépe pracuje ve svém jednovláknovém režimu (lze nastavit - viz. šipka). Je však možné (a i docela pravděpodobné), že další verze tohoto programu, pokud vůbec vzniknou, budou již pro SMT optimalizované.

3D mark 2001, CPU mark 99, kompese MP-3 s Lame 3.91

Možná se ptáte, proč tolik programů házím do jednoho pytle? Je to tím, že zapnutí či vypnutí Hyper-Threadingu zde nečiní žádný rozdíl. Výsledky jsou, až na chybu měření, identické. Je vidět, že klasické aplikace si dokáže operační systém "pohlídat" tak, aby včas uvolnil běžícímu programu všechny prostředky procesoru. Takže uvedu jen výsledky (HT off / on):

  • 3D mark 2001: 13658 / 13676
  • CPU mark 99: 199 / 199, souběžný chod dvou kopii: 100+139 / 127+126
  • encoding do MP-3, Lame 3.91 (tento program není optimalizován pro SMP): 43 / 43 s

XMPEG - konverze MPEG-2 (DVD) do DivX 5.02

Tato oblast mě, a jistě nejenom mě, docela zajímá. Komprimoval jsem stejný záznam jako výše (tedy 8min.), na datový tok 1100kbps jednoprůchodovým způsobem.

2v1: Pentium4 3GHz HT aneb až 30% zdarma
bez HT

2v1: Pentium4 3GHz HT aneb až 30% zdarma
s HT

2v1: Pentium4 3GHz HT aneb až 30% zdarma

Ooops, to je příjemné překvapení! Nepodezíral bych totiž ani firmu DivXnetworks, ani autora XMPEG s jakéhokoliv nadržování Intelu.

Závěr

HT a budoucnost

Intel plánuje v budoucnu možnost rozšíření současné technologie HT tak, aby na nástupcích Pentia 4 (jádro Prescott) dokázala emulovat na jednom jádře až čtyři virtuální procesory. Zdá se tedy, že se bude jednat o trend, který bude sílit - což zase klade nároky na novou optimalizaci softwaru.

Mezi řádky můžeme tušit, že SMT (symmetric multiprocessing) má být prostředkem, jak se vyrovnat s případnou hrozbou ze strany 64-bit. procesorů od Hammer AMD - i když cesta k vyššímu výkonu je zcela jiná.

HT - optimální nasazení

Díky tomu, že v současné koncepci HT u Intelu dochází především ke sdílení jednotek FPU a ALU, zdá se, že právě multimediální programy (audio, video, encoding, rendering...) používající typicky obou jednotek, mohou z této technologie profitovat nejvíce. Podle mého názoru se nyní rozhodně nejedná o technologii vhodnou pro serverové nasazení. V praxi zde nejsou vlákna (thready), které by například požadovaly jednotku FPU. V budoucích verzích procesorů (s nárůstem jednotek ALU) se může optimální nasazení HT měnit směrem, k téměř dvouprocesorovým systémům.

Celkový dojem

Celkový dojem z HyperThreadingu je veskrze kladný. Pokud máte, či hodláte používat Windows XP, umožní Vám občas, pokud si s touto technologii budou rozumět běžící programy, profitovat z nárůstu výkonu v řádu až 30%. V opačném případě, pokud si programy s HT nerozumí, nebudou trpět žádnou výkonovou ztrátou. Existuje sice stále několik programů, které na strojích s HT odmítají běžet - musíme si však uvědomit, že to pouze otázkou určité přechodné doby. Po ni bude nekompatibilních programů ubývat, zatímco počet optimalizovaných bude narůstat. I když se jedná o první krůčky teto technologie ve spotřební oblasti rozhodli jsme se udělit Hyper-Threadingu (odvisle od současné prvotní implementace) ocenění Golden AWARD PCtuningu.

2v1: Pentium4 3GHz HT aneb až 30% zdarma
GOLDEN Award, Listopad 2002

"za Hyper-Threading, technologii umožňující efektivnější využití jádra procesoru"

 
Komentáře k článku
RSS
Pouze registrovaní uživatelé mohou přidat komentář!
14.11.2002 12:50:38   0.0.0.xxx 1515
jestli to bude fungovat ze vsema 0.13 northwoody tak je to v poho opacne kdo si koupi 3ghz P4 za 25000
14.11.2002 12:51:52   0.0.0.xxx 1616
vim o te zprave myslim z X-bit labs ze to podporujou secky ale nechce se mi tomu verit pokud to ovsem neni tah intelu proti amd
14.11.2002 14:11:43   0.0.0.xxx 1716
Z tohoto článku a nejen z něho mi připadá tato technologie jako marketingový tah firmy Intel. Dvouprocesorové základny jsou na trhu už poměrně dlouho a nemyslím, že mají pro běžného domácího uživatele smysl. Další otázkou bude jak se k této technologii postaví výrobci software. Ocenění byste měli šetřit na výrobky (technologie), které budou prospěšné i běžným uživatelům.
14.11.2002 14:46:26   0.0.0.xxx 1617
...urcite zjistil, ze to je technologie urcena pro vsechny (tj. ne pouze pro servery). A ze je prvni procík s HT drahy... to je jasne, na novinkach se vzdy vydelava nejvice...
14.11.2002 15:02:07   0.0.0.xxx 1716
Četl jsem článek pořádně a jsem si vědom toho, že tento procesor by měl do budoucna sloužit pro "normální" uživatele, proto jsem se pozastavil nad tím jak budou na tuto technologii reagovat výrobci software. Nejsem si úplně jist zda "rozdvojení" je ta zprávná cesta ke zvíšení výkonu.
14.11.2002 15:04:47   0.0.0.xxx 1717
Klidně ať si to Intel namaluje na růžovo a prodává to s lentilkama, důležité je, že to prostě rychlejší a je a to mne zajímá. Jasně, můžu mít dvouprocíkovou mašinu, jenže to mne bude stát děsný love. tady dostanu 1,5 procesoru za cenu jednoho a to je podle mne dobrý.
14.11.2002 15:09:12   0.0.0.xxx 1717

multiprocesing je lepší, problém u obyčejných aplikací je, že dvouprocesorových počítačů není tolik, aby to bylo pro jejich vývojáře jasnou konkurenční výhodou. HT ale snižuje nutnou laťku pro výkonný dvouprocesorový stroj, takže si to za chvíli bude moci dovolit každý. jasně teď je to obludně drahý, ale brzy nebude.

14.11.2002 15:40:04   0.0.0.xxx 1515
Já to vidím na 64bit procesory, krom toho 1,5 procesoru nedostanete ani kdyby se aplikace optimalizovali pro tuto technologii. Než bude tento procesor dostupný pro "normální" uživatele tak AMD svůj procesor bude mít na trhu. Dnes jdu domů, v práci budu zase až v pondělí, rád budu reagovat.
14.11.2002 15:49:50   0.0.0.xxx 1717
Myslim, že bude zahodno si počkat na Hammera od AMD. Je přeci jen větší krok kupředu => lepši investice. Jo tak to je můj názor. Kupředu za 64bit
14.11.2002 17:11:20   0.0.0.xxx 1717
Nevim kde ste vzali tech 53% v Snadre, podle tech grafu je tam narust asi 0-10%, pokdu dobre chapu ze horni je bez HT a dolni s HT, i kdyz u obou je napsano HT
14.11.2002 18:41:23   0.0.0.xxx 1618

ja to pochopil tak, ze napis HT ma stejnou barvu jako graf ktery znazornuje. 53% taky nevidim (jen 51% v multimedia a 58% v FPU Whetstone iSSE2- oboje Sandra 2002) :-)

14.11.2002 19:48:10   0.0.0.xxx 1717
No, nevim nevim. O neco nahore se pohorsujete nad tim, ze procesory s HT nejsou pro normalni uzivatele a tady lamujete nad 64 bit. procesory. Mimochodem, pro 64 bity potrebujete taky optimalizovanou technologii a jedinym systemem, ktery vam dovoli vyuzit vas 64 bit CPU naplno jsou některé distribuce Linuxu a taky MS Windows XP 64 bit edition, která je ovšem nekompatibilní se vším co dýchá. HT tu navíc už je, když to HAMMER tu bude až já budu v důchodu a rohlík si budu namáčet do mlíka.

Připadá mi to, jakoby většina z vás odsuzovala dobrou technologii jenom proto ze je od Intelu. A Hammer od AMD nebude pro normalni lidi. Navic co se vam nelibi na Intelu, ze je drahy??? Ale no tak, alespon neni ve ztrate a nemusi propoustet zamestnance a nemusi prodavat za dumpingove ceny. Jo, AMD dela dobre CPU, ale je jim to houby platne kdyz ohlasi Athlona XP 2700+ a muzete si ho koupit tak maximalne v jednom obchode z deseti.
14.11.2002 19:54:15   0.0.0.xxx 1717
Podle znalosti tveho pravopisu usuzuji, ze bys potreboval tak 4×HyperThreading k tomu, abys přestal dělat chyby - Zprávná (lepší by bylo Správná), či snad zvÍšení (tady by bodlo spíše zvÝšení).

A HT je nahodou dost dobra technologie, vyrobci SW ji nemohou ignorovat, protoze Intel ovlada 80% trhu. (nepocitam notebooky).
14.11.2002 19:56:51   0.0.0.xxx 1617
A to jako pro ktere produkty by se mely setrit oceneni?

Jen pro Athlony a Hammery (apod.) od AMD?

Jsi trapny. HT je uzitecna technologie, ktera bude za chvili urcena sirokym masam lidi. Nebo si snad myslis, ze neco co je od Intelu je spatne a proto si nezaslouzi dostat oceneni? Vzpamatuj se.
15.11.2002 07:28:14   0.0.0.xxx 1717
Chces si pockat na Hammera?Ok tak cekej:-)uz cekas dost dlouho a jeste asi budes:-))Zatimco 3GHZ bude do pul roku za kolem 7K bez dane a bude si ho moci koupit kazdej ty stale naivne budes cekat na zazrak od AMD ktery bud neprijde nebo nebude takovy zazrak.BTW:Hammer JE lepsi krok kupredu?Jak muze byt kdyz jeste neni?Jak vis ze zrovna 64bit aplikace budou to jedine prave?A myslis ze pokud bude 64bit to prave ze Intel je pablb a neimplementuje to do svych desktop CPU?Ve finale ty se dockas draheho(zapomen ze bude levny) Hammeru se 64bit a my ostatni budem mit Intel se HT a se 64bit a buhvi cim jeste.Ale abych jen nehanil ja osobne si preji aby uz konecne AMD pustilo aspon neco do sveta co bude nejak konkurovat Intelu(i za cenu podplacenych recenzi,daru a lzi) neb pak budu ja mit levne P4 a budu vysmatej.Pokud AMD se nevzchopi bude to znamenat draha P4:-(
16.11.2002 23:27:29   0.0.0.xxx 1717
Jak je to ve skutečnosti s HT u stračích procesorů NW ?? Já osobně mám P4 2Ghz nw a sisoft sandra 2002 Pro mi hlásí podporu HT a sisoft sandra 2003 standart hlásí že nemám.
Snad na to přijdu. Příšzí týden kamarád sežene desku s i845PE chipsetem a tak to konečně skusim.
18.11.2002 11:48:37   0.0.0.xxx 1717
3GHz Pentium 4 nemůže stát do půl roku 7 tisíc korun, protože cena procesoru je závislá na tom, co je právě teď nejvýkonější model. No a to je zase omezeno výrobní technologií. Intel již u Northwoodu vyčerpal frekvenční potenciál, letos sice Pentium 4 zvýšilo svou frekvenci o 1 GHz, příští rok když to bude o 500 MHz, můžeme se radovat. Do uvedení Prescottu (který byl odložen) cena současných Pentií 4 Northwood nijak výrazně neklesne.

Pentium 4 bych z hlediska návrhu pipeline příliš nevychvaloval, nebýt výborné 0,13um technologie Intelu (a nepovedené 0,13um AMD), je dnes Northwood někde hluboko zapomenut, stejně jako Willamette.
18.11.2002 11:52:58   0.0.0.xxx 1616
Vzhledem k tomu ze jiz nyni ma Intel vyteznost 0,09 technologie nad 60% a je schopen ji okamzite nasadit je odlozeni Prescotu jen obchodni tah.Ono kdyz AMD nema zatim zadnou odpoved na nove P4 proc by Intel spechal s uvadenim neceho noveho.V pripade ze AMD se vzchopi a vypusti nejakej CPU ,Intel spusti vyrobu Prescottu a 3GHZ okamzite padne na 7K ci mene.
18.11.2002 11:53:09   0.0.0.xxx 1717
Podpora Hyper-Threading je hlášena CPUID instrukcí, má to ovšem jeden háček. Všechny procesory Pentium 4 včetně Willamette hlásí podporu Hyper-Threading, ovšem pouze pro jeden logický procesor. Programátor musí ověřit podporu Hyper-Threading a dále pak ověřit počet podporovaných logických procesorů. Pokud je počet logických procesorů roven 1, pak Hyper-Threading de facto podporován není. Tuto druhou kontrolu ale někteří líní programátoři jednoduše neudělali.

Kdysi jsem k účelu detekce Hyper-Threading stvořil program. Odkaz na něj je v článku Dva v jednom - HyperThreading na Živě.
1.1.2005 13:06:54   0.0.0.xxx 1617
No a ted vo dva roky pozdejc se vi,ze HT je skoro na CENZURA a 64bit athloni vedou ;-)

Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz

0 čtenářů navrhlo autorovi prémii: 0Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
TOPlist
Tento web používá k poskytování služeb soubory cookie.