Opteron přichází: AMD vyráží do útoku |
autor: Štěpánek Martin , publikováno 23.4.2003 |
První zmínky o AMD K8, jak byly tyto procesory zprvu označovány, se objevily už před více než třemi lety. Na první "civilní" 64-bitový procesor, K8 / Hammer se ve svých dobách shlíželo tak trochu jako na svatý grál všech příznivců AMD. V roce 2000 byl úspěch Athlonů natolik velký, že nikdo nebyl na pochybách, že K8 bude ještě větší "bomba". Přesto málokdy se podaří všechno tak, jak si lidé plánuji a přejí - nesplnily se optimistické plány AMD ani přání AMD fandů. Přestože první kousky K8 byly vyrobeny už v létě 2001, trvalo skoro dva roky než procesor opustil laboratoře a vydal se na svou pouť.
Nejdříve byl plánován na podzim roku 2002, tehdy bylo počítáno s mnohem vyšší frekvenci - já osobně si pamatuji, že jsem slýchával "zaručené informace", že K8 bude startovat na 2,4 GHz atp. Sami uznáte, kdyby všechno dopadlo podle těchto plánů, tak by to byla opravdická bomba. Bohužel výrobní problémy s novou technologii SOI pořádně zamíchaly AMD s kartami a procesor se nakonec zpozdil o půl roku a navíc nestartuje na takové frekvenci jak by se AMD hodilo. Přesto vše nakonec dopadlo relativně dobře a Opterony dnes byly vypuštěny do světa...
Opteron, nový král firmy AMD - zapouzdření je podobné jako u Intel Pentia 4, ale je keramické.
Poznámka: Fotografie a výsledky testů jsou převzaty ze zahraničních serverů, především z Tomshardware (bohužel, dosud jsme s Opteronem neměli možnost seznámit se osobně). Při nejbližší příležitosti provedeme své vlastní testy.
Opteron je procesorem na rozhraní dvou světů - je schopný vykonávat všechny klasické 32bit "x86 aplikace", navíc je k tomu ještě přidána podpora práce v 64bit režimu. Opteron je také prvním procesorem, který v sobě integruje duální paměťový řadič DDR 333. O správnosti toho rozhodnutí jsou vedené velké spory. Na straně jedné jsou zde velmi malé latence (zpoždění mezi vystevením požadavku a "dodávkou dat" z paměti) na straně druhé je paměťová technologie s jádrem svázaná snad až příliš pevně. Na začátek příštího roku Intel plánuje uvedení čipsetů s podporou DDRII a aby AMD mohlo využít propustnosti DDR II bude muset měnit řadič, který je v jádru procesoru.
Bližší pohled na Opteron: OSADA244 značí schopnost pracovat v 2 procesorovém režimu, další číslice označují výkon.
Jádro
Pohled na jádro dlouho očekávaného Opteronu; více než 50% část jádra zabírá L2 cache
Při bližším pohledu na jádro, si můžete všimnout fyzické podobnosti se starším AMD Athlonem. Rozdíl totiž není v uspořádání jádra, ale v nepatrných detailech. Jednou z výraznějších změn je integrace paměťového řadiče.
SledgeHammer má více než 940 pinů, tím se stává rekordmanem v x86 světě.
Konečně, Opteron se již dodává s odvaděčem tepla, ten také chrání jádro proti úrazům.
V procesoru je celkem 9 jednotek (3 ALU, 3 AGU, FADD, FMUL a FMISC) a 3 jednotky pro dekódování x86 instrukcí. Téměř nezměněná zůstala L1 cache s velikostí 64KB pro data a 64KB instrukce. Tedy víceméně je procesor hodně podobný klasickému Athlonu. K8 se od K7 liší v detailech - int. paměťový řadič, hyper-transport, x86-64 - ale v mnoha ohledech jakoby mu Athlonu z oka vypadl.
Pohled na část jádra bez L2 cache a řadiče paměti.
Porovnání procesorů, vlevo Opteron a vpravo Athlon. Jak je vidět rozmístění jednotek zůstalo stejné. Rozdíly jsou až při detailnějším zkoumání.
Hlavní změna je v centru jádra, tam přibyl řadič XBAR, který ovládá tok dat mezi paměťovým řadičem, výpočetními jednotkami a 3 porty Hypertransportu. XBAR u procesoru Athlon64 nenajdete. Ten má totiž jen jeden port Hypertransportu a je určen pouze pro jednoprocesorové sestavy. Díky XBARu u Opteronu nebude potřeba northbridge pro komunikaci mezi procesory.
Dalším vylepšením je podpora SSE2, které na rozdíl od Pentia 4 má 16 registrů (tedy dvojnásobek). Zlepšení se dostalo i instrukčnímu bufferu, který je teď schopen pojmout až 1000 vstupů.
Základní struktura Opteronu není příliš odlišná od Athlonu: 3 ALU a 3 AGU jsou nyní schopny zpracovat 64bit instrukce
Pro lepší dosažení vyšších frekvencí a vylepšení zpracovávání 64bit instrukcí byla zvětšena pipeline na 12 stupňů (Athlon má 10 a P4 má 20). To dává vyrovnaný poměr, kdy pipeline není příliš krátká (CPU nemusí čekat na instrukce), a zároveň není moc dlouhá (při špatném předpovězeni instrukcí nedojde k zahození dlouhé fronty a následného čekání).
HyperTransport
Narozdíl od používání běžné paralelní rychlosti FSB, je komunikace zajišťována přes Hypertransport. Výsledkem je rychlost přenosu dat až 3,2GB/s v obou směrech na jeden Hypertransport port. pro srovnání, Pentium 4 má maximálně 3,97GB/s, ale v obou směrech dohromady.
Šířka datového pásma je u serverových opteronů tvořena 3 porty Hypertransportu, to zaručuje dostatečný datový tok pro všechny aplikace. Díky řadiči XBAR může CPU přistupovat i do paměti jiného procesoru.
Režimy CPU
V závislosti na použitém bitu v LME registru, procesor rozpozná v jakém režimu má pracovat. Tím je zaručena zpětná kompatibilita pro starší aplikace.
Registry
Novinka: rozšířený 64bit registr
Opteron může obsluhovat až 1TB (1024 GB) systémové paměti, což znamená 40 bitovou délku adres a 48 bitovou délku virtuálních adres. Je to méně než 64 bit, ale i tak je velikost paměti 1TB dostatečná.
AMD64 rozšiřuje 32bit sadu registrů IA32 procesorů na 64bit. Ale pokud aplikace běží v tzv. legacy modu, tedy v 32bit, jsou nadále používány staré registry EAX, EBX, ECX, EDX, EBP, ESI, EDI a ESP.
Pokud procesor pracuje v x86-64 režimu, jsou registry rozšířené na 64bit pomocí R prefixu. Potom jsou registry nazývané RAX až RSP.
Při práci v čistě 64 bitovém prostředí, lze dále využívat 8 GPR (General Purpose Registers) R8 až R15. Pro počítání v desetinné čárce byli přidány zdvojené SSE2 registry. Ale i je lze využít pouze v 64bit modu.
Socket 940
Nová serverová platforma AMD: Socket 940.
Uchycení procesoru do patice se nezměnilo.
Dual-Opteron.
Socketu 462 (A) již začíná zvonit na poslední kolo. Jeho dny jsou spolu s nástupem AMD Athlonu 64 a Opteronu sečteny.
Rozdíl v počtu pinů u Athlonu 64 a Opteronu spočívá v počtu Hypertransport portů, Athlon 64 má pouze jeden. Pouzdro procesorů mPGA je podobné pouzdru Pentia 4 - nutno říci, že se jedná o osvědčenou konstrukci.
Integrovaný paměťový řadič
Koncept procesorů Opteron předpokládá s pamětí pro každé CPU, ale díky XBAR lze přistupovat i do paměti jiného CPU. Pro každý procesor může být použito až 8 slotů s kapacitou 8GB. Technologie Dual-channel nabízí rychlost přenosu až 5,4GB/s.
FAB 30: Maximálně 89 Opteronů na wafer
AMD používá pouze 200mm wafery a z toho také plyne malé množství vyrobených CPU. Teoreticky lze vyrobit až 148 procesorů, ale při výtěžnosti jen 60% to činí 89 CPU.
64 Bit: pro koho se hodí
Pro desktopové aplikace je hranice 2GB paměti vcelku dostatečná, obzvláště při práci s WinXP, které umí adresovat pouze 2BG pro aplikace.
Typickým využitím procesoru Opteron budou rozsáhlé databáze a složité CAD/CAM programy. Databáze už v současné době dosahují velikosti přes 4GB a nasazení Opteronů proto bude výhodou.
K prolomení 4GB bariery na 32bit systémech Win2000 a WinXP se využívá několika triků. Používá se PAE (Physical Address Extension) a Enterprise Memory Architecture. S těmito úpravami lze adresovat na systémech Win 2000/XP až 8GB paměti. Ale tyto řešení nejsou příliš rychlé a používají techniky podobné z dob 16bit procesorů, kdy se nazývaly EMS-memory. Přes všechny úpravy je maximálním stropem 64GB na 32bit procesorech. Aplikace požadující větší paměť musí běžet na 64bit strojích. Takové aplikace jsou využívané především ve velkých podnicích, kde je nutnost centrálních výpočtů nebo v telekomunikacích.
{mospagebreak title=Testy - serverové aplikace}Testovací sestavy
Testy byly provedeny na serveru www.tomshardware.com
AMD Procesory (Socket 940) | |
Dual DDR 333 (166 MHz) | Opteron 1.8 GHz (1800 MHz / 128/1024 kB) |
AMD Procesory (Socket A) | |
166 MHz FSB (Dual DDR333) | Athlon XP 3000+ (2166 MHz 128/512 kB) |
Intel Procesory (Socket 604) | |
133 MHz FSB (Dual DDR266) HT | Xeon 3.06 GHz (3066 MHz 12-8/512 kB) |
Intel Procesory (Socket 603) | |
100 MHz FSB (Dual RD PC800) HT | Xeon 2.8 GHz (2800 MHz 12-8/512 kB) |
Intel Procesory (Socket 478) | |
133 MHz FSB (Dual DDR333) HT | Pentium 4 3.06 GHz (3066 MHz 12-8/512 kB) |
Paměť | |
PC 1066 (533 MHz) | 2 x 256 MB / 32ns / 16 Bit (Kingston) |
DDR400 (200 MHz) | 2 x 256 MB / 5ns / 64 Bit (Corsair) |
PC 800 (400 MHz) | 4 x 256 MB / 45ns / 16 Bit (Infineon) |
DDR333 (166 MHz) ECC, REG. | 4 x 512 MB / 6ns / 64 Bit (Infineon) |
DDR266 (133 MHz) ECC, REG | 2 x 256 MB / |
Základní desky | |
Intel 850E | Asus P4T533-C Rev: 1.03 Bios: 1010 BETA 001 (1/20/2003) |
Nvidia nForce2 | Asus A7N8X Rev: 1.03 Bios: 1002 Beta 004 |
Intel 875 | Asus P4C800 Rev: 1.03 Bios: 1003 Beta 3 |
Intel 860 | MSI MS-6508 Rev: 1 |
Intel 7505 | Intel SE7505VB2 Rev: unknown |
Ostatní HW | |
Grafická karta | ATI Radeon 9700 Pro Memory: 128 MB DDR-SDRAM Memory Clock: 620 MHz (256 Bit) Chip Clock: 325 MHz |
HDD | 40 GB, 6L040J2 , Maxtor UDMA100, 7200 rpm, 2 MB Cache |
Síť | D-Link DFE-530TX (10/100 Mbit) |
CDROM | Asus 52x |
Ovladače | |
Intel Chipset | V 5.00.1009 |
Intel IAA | V 2.3.0.2160 |
Nvidia nForce | Asus V1.16 |
Graphics Driver | CATALYST 3.2 Version: 6.14.01.6307 ATI Control Panel Version: 6.14.10.4029 |
DirectX | Version: 9a |
OS | Windows XP, Build 2600 SP1 Linux Enterprise 8.1 |
Server Benchmarks s operačním systémem Linux 32/64 Bit | |
Test databází | MySQL 3.23.52 - 32 Bit SuSE Enterprise 8 MySQL 3.23.52 - 64 Bit SuSE Enterprise 8 |
Memory transfer | Stream 5.1 with customizations - 64 Bit |
FPU/Integer performance | Unixbench 4.1 (Drystone/Whetstone) |
FPU performance | Whetstone with 3 compiler flags |
NASA Benchmark 1 | ARC 2D (Euler algorithm, depth 100) |
Workstation Benchmarks s Windows XP | |
3D Rendering | Lightwave 7.5 Build 572 Cinema 4D XL 8.001 3D Studio Max 5.1 |
MP3 Audio Encoding | mp3 Maker Platinium 3.04 |
MPEG-2 Video Encoding | Pinnacle Studio 8.5 Main Concept 1.3.1 |
File compression | Winrar 3.11 |
CPU and Multimedia Bench | PC Mark 2002 SiSoft Sandra 2003 SP1 |
Pro dosažení maximální objektivity byly použity dva různé balíky testů.
Výsledky Serverových testů
V testech MySQL se projevuje síla procesorů Opteron. Především při vkládání do databáze je procesor Xeon poražen. Především jeden Xeon 2,8GHz v bitvě s Opteronem dopadl téměř jako sedláci u Chlumce.
I přes integrovaný paměťový řadič je procesor Opteron poražen při testech práce s pamětí. Ale nutno podotknout velmi malou latency pamětového sub-systému, která pro změnu hraje do karet Opteronům.
Wheatstone = to pravé pro pro AMD, jak Athlon tak i Opteron drtivě porážejí konkurenci.
Testy v 3 Renderingu nedopadly nejhůř, ale Opteron byl překonán dvojí konkurentů.
Na výsledku se projevuje nízký takt. Frekvence o více než 1GHz nižší se podepisuje o 20 sekund horším čase.
U encodování videa platí stejné jako u mp3, tedy nízká frekvence = nízký výsledek (dlouhý čas).
Pouhých 5817 bodů je zarážejících, obzvláště když je dvou-procesorový systém překonán i samotným procesorem Opteron.
V testu Sisoftware už je situace lepší.
Konečně aplikace, která sedí Opteronům, které porážejí Xeon o téměř 20 minut.
{mospagebreak title=Závěr}Po důkladných testech se systémem Linux Enterprise Server 8, nelze než doporučit tento procesor do serverových řešení. Především v testech MySQL a NASA benchmark1 systém s procesory Opteron porazil svého soka od firmy Intel, dvou-procesorovou sestavu Xeon 3,06GHz, bez menšího zaváhání.
Jinak to už vypadá v testech pracovních stanic, kde je procesor poražen téměř ve všech testech. Zajímavé je pozorovat, jak si vede Opteron proti desktopovým procesorům jako Pentium 4 nebo Athlon XP. V jednoprocesorové konfiguraci zůstává hluboko v poli poražených, ale stále pevně věřím, že Athlon64 dopadne lépe.
Teď přichází finální účtování s Opteronem. Přes trochu negativní ohlasy před uvedením se zdá, že Opteron mile překvapil. I přes nízkou frekvenci ukázal, že optimalizace a velká cache dokážou své. Xeony mají opravdu těžkého konkurenta. Přesto si myslím, že to mohlo dopadnout mnohem líp pro AMD, kdyby tento procesor uvedla dřív a na vyšší frekvenci. Bohužel je málo věcí, které jdou podle plánu.
Největší výhoda AMD v případě Opteronů je fakt, že přináší 64-bit technologie do segmentu serverů střední třídy, kde nyní kralují 32-bitové Xeony. Nelze pochybovat, že nový produkt v daném segmentu zamíchá kartami, protože Opetron toho opravdu nyní může nabídnout více, ale paradoxně je také dražší než Xeon.
Vyšší cena je vyvážená podporou 64-bit, což se v oblasti serverů obzvlášť hodí. Itania, jediné 64-bit procesory od Intelu, jsou velmi drahé. Těžko polemizovat zda jsou Itaniua rychlejší než Opterony. Dovoluji si říct, že Opteron a Itanium jsou naprosto odlišné procesory, které si budou konkurovat jen částečně, proto možná ani nějaké výkonnostní porovnávání není potřeba.
Otázkou také zůstává podpora 64-bit. Je opravdu důležitá? V případě některých serverů určitě, vždy ale závisí na aplikaci. Proto si myslím, že pokud někdo bude chtít linuxový 64-bit databázový server za rozumnou cenu, tak jsou Opterony velmi dobrá volba. Přesto ale má cenu používat Opterony na obyčejný webserver? Zde si možná vystačíte jen s Athlonem MP.
Dost ale otázek - poslední a nejdůležitější věcí - na které stojí a padá úspěch AMD není jen samotný procesor, ale to jak se ji povede procesor prodat. Serverový trh je velmi konzervativní, ještě dnes se v daném segmentu hojně používají SDRAMy či masově prodávají procesory s 686 architekturou (PIII server např.). Vždyť samotný Intel měl velké problémy s uplatněním svého Itania, což je Goliáš oproti AMD.
Teď před AMD stojí úkol myslím nejtěžší, přesvědčit serverový svět, aby začali chtít jejich kvalitní, byť v serverovém světě ještě příliš neznámé procesory Opteron. Zde nepomůžou oslavné články, skvělý výsledky benchmarků či masivní reklama. Serverový odborníci jsou zvláštní sorta lidí, která se těžko přesvědčuje, většinou si vše musí "ohmatat" sami a nejlepší reklama je pro ně vlastní dobrá zkušenost.
AMD nyní nezbývá nic jiného než nové procesory tlačit "horem, dolem", to znamená hojně pořádat školení, dělat zajímavé nabídky serverovým odborníků a hlavně přemluvit firmy IBM, HP, Dell či Sun (některé z nich už spolupráci přislíbily), aby prodávaly servery založené na Opteronech. A nejenom to - tito výrobci serverů musí taky tuto platformu tlačit.
Úspěch Opteronů ukáže čas, je to trošku risk pouštět se do rozbouřených a nevyzpytatelných vln serverového světa. Pokud ale AMD uspěje, tak se nevždy vyhrabe z finančních problémů. Je to hra, kde vítěz bere vše a poražený odchází s prázdnou ... to je případ i Opteronu.
Fandům AMD nyní nezbývá nic jiného než, aby Opteronu drželi palce ...
Ceny procesorů:
-
Opteron 240 (1,4GHz) 283 dolarů
-
Opteron 242 (1,6GHz) 690 dolarů
-
Opteron 244 (1,8GHz) 794 dolarů
Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz
ekvivalentni testy by byly na Win64bit for opteron
takhle akorat zmerite, ze pokud je opteron bez SSE2 a 2/3 registru ma celkem slusny vykon - realny maximalni vykon je vsak(doufejme) vetsi
PS:pokud ovsem byl v 64bit modu, tak se omlouvam
Zajímavé by byly testy v 3Dstudiu, nebo testy Unreal enginu, který má být pro Opreton optimalizován. Chtělo by to aby se Opreton dostal do rukou PCTuningu a ne aby překládaly články z cizích webů a ještě bez poděkování.
Na to, že Opteron je optimalizovaný pro 64bit aplikace, tak jsou výsledky perfektní.
Zajímavé je taky to chlazení. Jak tam přidělali ten chladič ?
Nechapu proc vubec testovat temito pochybnymi utilitami
Byla tady kritika na to, že článek vychází z hodnot naměřených lidmi z http://www.tomshardware.com">Tomshardware. K tomu chci dodat několik věcí:
Honza Dudek ten článek dělal do pozdní noci / rána a jeho cílem bylo, den po uvedení dlouho očekávaného Opteronu, napsat o tomto procesoru a jeho výkonu stručný článek v češtině. Anglických recenzí je několik - kdo má dostatek času a je jazykově i odborně vybaven, najde jich na webu nejméně 6. My jsme zde chtěli naznačit jen to nejdůležitější. Link na původní zdroj už přidávám (včetně odpovídajícího komentáře) ke článku.
Grafy: Naše logo tam automaticky vkládá naše "udělátko" na grafy. Už to opravuji.
Za PCtuningem a autory si stojím. Neříkám že každý den, ale originálnách článků, testů a analýz jsou na našen serveru spousty (jistě tomu tak bude i u Opteronů, jakmile jej budeme testovat) - věřte mi, v těchto věcech jsou desítky a stovky hodin práce... tak na to berte alespoň ohled. Píšeme pro Vás každý den - i pro ty kritiky, kteří už soptí po ranní kávě...
BTW XBAR je samozdrejme pritomen i v jinych procesorech, tedy ale vetsinou je az na northbridgi.
PS: Není zarážející že testy, které zvládají P4 lépe jsou v PCmarku několikrát opakovány a naopak každý test ve kterém vítězí Athlon je pro jistotu pouštěn jenom jednou. Toto je fatk, který si můžete na internetu ověřit.
Musíme počkat až Pctuning udělá vlastní testy a pak se uvidí
Uvazuju totiz o koupi oveho a rovnou drazsiho co nejakou dobu vydrzi a je tichej - a ten mi asi zustane i po tom co prodavam stavajici sestavu a zdroj si necham. Bude stacit 350W?
PS: skoda ze memuze pouzivat SSE2 uz v 32bit modu, asi by v DivXu P4 celkem slusne nakopal. Ma prece 2x vic SSE2 registru (takze je SSE jednotka asi tak 1,5-1,8x vykonejsi nez u P4na stejny frekvenci, co znamena ze je stejne vykona jako u P4 na odpovidajici frekvenci), jenze P4 je bez SSE2 asi o 30-50 pomalejsi nez se SSE2, narozdil od AMD kde se to resi hrubou silou. ->> docela by me zajimalo jak bude vypadat SSE2 + hruba sila
PS: P4 "==" Xeon - je to stejna archytektura
Ale stejne tohle je zbytecne resit, to si do kompu nikdo neda, drahe a na desktop pomale, tusim ze to chce zasadne ultramastne ECC pameti, atd...
http://www.aceshardware.com/read.jsp?id=55000268
+/- 52.5 Watts for Opteron 244 (1.8 GHz) -vykon 2.7hz P4 -podla priemeru vykonu - anvyse 246 2.0Ghz bude mat 0.1 V nizsie napajacie napatie (1.45V namiesto sucasnych 1.55V )!!!! (Podla the Inquirer)
Athlon XP 2100+ (1733 MHz) generates 56.4 Watts (TPD).
P3 3Ghz ma 97W prikon... Takze kl
Drahe neviem, 240 za 285 USD/kus, to je dobra cena .
Prostě něco, kde je napsáno "i386" a "nt"
jakpak jde dohromady pravopis a čeština se smajlíky, jirko p?