Hlavní stránka Návody Úpravy: přetaktování Rozvaha: Sandra a nastavení pamětí
Rozvaha: Sandra a nastavení pamětí
autor: Štěpánek Martin , publikováno 27.5.2003
Seznam kapitol
1. Výsledky testu
2. Vyhodnocení
Rozvaha: Sandra a nastavení pamětí

V současné době, kdy programy zpracovávají obrovská kvanta dat (to platí zejména pro multimedia a video), jsou nároky kladené na paměťový subsystém větší než kdykoli předtím. Server Techwarelabs provedl megatest různých nastavení parametrů paměti a jejich vliv na výkon. Hodně z Vás v diskusních fórech mluví o pamětech a jejich nastavení. Proto jsem se rozhodl přinést test, který ukončí všechny dohady, test, který popíše kombinace nastavení a také rozdíly mezi jednotlivými nastaveními.

BIOS kvalitních desek obsahuje velké množství různého nastavení, které se týká pamětí. Nastavování se může týkat frekvence nebo časování. Na začátek je nutno říct, že rozdíl mezi základním nastavením a nejlepším nastavením je více než značný.

Tyto pojmy by jste měli znát, před dalším pokračování ve čtení:

  1. tRP - Čas potřebný ke změně vnitřní buňky. (RAS Precharge)
  2. tRCD - Čas potřebný mezi  RAS (Row Address Select) a CAS (Column Address Select) přístupy do paměti.
  3. tAC - Objem času potřebný k "přípravě" pro další výstup dat při použití Burst mode.
  4. tCAC - Column Access Time.
  5. tCL - (známé také jako CL nebo CAS Latency), latency = odezva, je to tedy počet cyklů, které jsou potřebné k získání dat z paměťové buňky.
  6. tCLK - Délka cyklu.
  7. RAS - Row Address Select nebo Row Address Strobe.
  8. CAS - Column Address Select nebo Column Address Strobe.
  9. RCT - Read Cycle Time

Poznámka  #1: tRAC (Random Access Time) je vypočítán jako  tRCD + tCAC = tRAC
Poznámka  #2: o paměti musíte uvažovat jako o matici, kde jsou data zapisována do řádků a sloupců. K získání dat jsou proto vyslány informace, ve kterém řádku a ve kterém sloupci data v paměti leží. Mezi vysláním těchto příkazů pro získání dat je pak nutný čas, označovaný jako Trcd.
Poznámka  #3: CL získáme ze vzorce CL >= tCAC / tCLK, kde

  • CL je CAS Latency.
  • tCAC je čas potřebný pro přístup do datového sloupce
  • tCLK délka hodinového cyklu

Zde je schéma, které je používáno k získání dat z paměti:

Rozvaha: Sandra a nastavení pamětí

Metodika testování

Test se sice může zdát velmi jednoduchý, ale pokud si uvědomíte počet různých nastavení, můžete dojít až k číslu 4608. A opravdu není v silách nikoho takový test provést, znamenalo by to totiž 4608 restartů. Proto byl test trochu zjednodušen. nakonec byl proveden pouze s rychlostí pamětí (100, 133, 166); CAS (3, 2.5, 2); Bank Interleave (disabled, 2, 4) a s různým nastavením časování. Mezi "méně významné" nastavení se řadí (Trp, Tras, Trcd, DRAM Command Rate, DRAM Burst Length, Write Recovery Time, and DRAM Access Time). Test se tak skládá z kombinací těchto možností.

Testování začalo s nejhorším nastavením rychlosti, CAS, Bank Interleave a "méně významného nastavení". Jakmile byl tento test dokončen, zvedlo se první z "méně významných nastavení" na lepší hodnotu (Trp z 3T na 2T). Následně proběhl test se všemi kombinacemi CAS a Bank Interleave, což dává celkem 10 kombinací. Dalším krokem bylo zvednutí Tras. Ve výsledku toto testování dalo 216 kombinací, tedy neuvěřitelných 216 restartů.

Všechny nastavení byly otestovány pomocí programu Sisoftware Sandra 2003 v9.41 (SP1).  Tento program se zdá být nejlepší pro jeho jednoduchost a časté používání ve všech testech na internetových serverech i u nás na PCt.

Při používání toho programu jsem si ale všiml, že při prvních dvou testech s novým nastavením je výsledek nižší nebo vyšší, než by měl být. Proto každý test běžel vícekrát a byl brán výsledek až po ustálení hodnot. Rozdíl nebyl závratný, ale dostatečný, aby ovlivnil výsledek testu.

Paměti použité k testu:

K testu byli použity paměti firmy Crucial. Jednalo se o dva 128MB moduly PC2700 DDR.

Velikost 128MB
Provedení 184-pin DIMM
Typ DDR PC2700
Konfigurace 16Meg x 64
DIMM typ Unbuffered
ECC: bezparitní
Rychlost 6ns
Napájení 2.5V
SDRAM CAS CL=2.5

Testovací sestava

Procesor Intel P4 2.4 Ghz, 400Mhz FSB, 512K L2 Cache CPU
Základní deska Soyo SY-P4X400 Dragon Ultra Platinum
Grafická karta ATi Radeon 9100
Paměti Crucial 2x 128 MB PC2700 DDR RAM
HDD Maxtor DiamondMax Plus 60GB D740X
Operační systém Windows XP Professional SP 1
Testovací program Sisoftware Sandra 2003 v9.41 (SP1)

Jako testovací deska byla použita Soyo SY-P4X400, protože má velmi flexibilní bios a nabízí možnost změnit 10 hodnot nastavení pamětí.


  • Nárůst výkonu paměťového systému byl obrovský, téměř na 172%

Porovnání rychlostí pamětí

Rychlost pamětí je nejčastěji měřená na základě rychlosti interních hodin, jinak řečeno počet cyklů za sekundu.

Rychlost pamětí Výkonnostní rozdíl Rozdíl v % Teoreticky %
přechod ze 100 na 133 asi 500 MB/s 35-40% 33%
133 na 166MHz asi 200-300MB/s 10-15% 25%
100 na 166MHz asi 750-800MB/s 55-60% 66%

Výkonnostní rozdíl získaný zvýšením frekvence je všeobecně známý.

CAS

Obecně řečeno je CAS je počet cyklů mezi přijetím příkazu pro čtení a začátkem čtení dat. To znamená čím menší číslo, tím rychlejší odezva paměťového subsystému.

CAS Latency Výkonnostní rozdíl Rozdíl v %
přechod ze 3.0 na 2.5 asi 0-2MB/s 0%-0.01%
2.5 na 2.0 asi 0-3MB/s 0%-0.02%
2.0 na 1.5 asi 0-3MB/s 0%-0.02%

Výsledek je velmi zarážející, přes všechny mé předpoklady nedošlo k viditelnému nárůstu výkonu. Nárůst by se dal chápat pouze jako odchylka v měření.

Podle webové stránka firmy Corsair, lze získat pouze malý procentuální nárůst výkonu při přechodu z CAS3 na CAS2. Což se v našem testu potvrdilo. Při použití jiného typu pamětí, by rozdíl měl být trochu vyšší.

Ale pokud se rozhodnete pro nákup nových pamětí, určitě se vyplatí takové, jenž mají nižší CAS. Obecně jdou lépe přetaktovat na vyšší frekvenci.

Poznámka redakce: Vliv CAS na výkon paměťového subsystému je v praxi poněkud vyšší - hodně záleží na organizaci testovacích dat. To že se v tomto testu CAS více neprojevilo je dáno metodikou tohoto konkrétního testu.

Bank Interleave

Bank Interleave umožňuje zmenšení celkové zpoždění paměťového subsystému. Podstatou je vyslání příkazu na čtení/přístup do paměťové buňky v době, kdy se čeká na výsledek předchozího příkazu. Můžeme o tom také mluvit jako o přístupu do čtyř bank v jednom cyklu (4-Way interleave), tím se obejde zpoždění, které by vzniklo kvůli CAS při přístupu jednotlivě.

Všechny paměti větší než 64MB automaticky obsahuji 4-cestní Interleave (4-Way interleave).

Bank Interleave Výkonnostní rozdíl Rozdíl v %
Disabled na 2-Way 40-50MB/s 1%-4%
2-Way na 4-Way 40-50MB/s 1%-4%
Disabled na 4-Way 80-100MB/s 2%-8%

Nárůst se vždy pohyboval okolo 50MB/s. Toto nastavení a výsledek je absolutně nezávislý od jiného. Při vyšší rychlosti je nárůst menší (1% při 166MHz FSB a 4% při 100MHz FSB), to znamená, že nárůst není větší s větší rychlostí.

Precharge to Active (tRP)

Precharge to Active nastavení ovládá počet bitů, které jsou vloženy mezi příkazy precharge řádku a příkazem activate. Tzn. větší počet cyklů, větší zpoždění odezvy.

Pokud je čas pro tRP (někdy také označováno jako (Row precharge time) příliš malý, může se stát, že nejde ke kompletní obměně dat v buňce a následně je buňka neschopna přijmout data.

tRP Výkonnostní rozdíl Rozdíl v %
3T to 2T 10-20MB/s 1%

Rozdíl získaný při optimalizaci hodnoty tRP se zvyšuje v závislosti na rychlosti ((10MB/s při rychlosti 100MHz FSB, 20MB/s při 166MHz FSB). To dává nárůst okolo 1%. 

Active to Precharge (tRAS)

Toto nastavení je důležité, protože určuje jak brzo po aktivaci řádku může být znovu připraven pro další cyklus. pokud zvolíte příliš krátký čas, může se stát, že nedojde ke kompletnímu cyklu čtení/zápis a data budou poškozena.

tRAS Výkonnostní rozdíl Rozdíl v %
7T to 6T asi 0-3MB/s 0%-0.01%

Výsledek se dá započítat do chyby v měření. 

RAS to CAS delay (Trcd)

Mezi signálem Row Address Strobe (řádek) a signálem Column Address Strobe (sloupce) by měl proběhnout nějaký ten čas. Jinak nižší hodnota, tím rychlejší má přístup k paměti a tím však bude i větší nebezpečí chyb i zde bacha na stabilitu.

tRCD Výkonnostní rozdíl Rozdíl v %
3T to 2T 20-30MB/s 1.0%-1.5%

Toto nastavení umožňuje získání 20-30MB výkonu navíc.  

DRAM Command Rate

Čím nižší je hodnota, rychleji může paměťový řadič odesílat příkazy.

DRC Výkonnostní rozdíl Rozdíl v %
2T to 1T asi 30MB/s 1.1%-2.1%

Při rychlejším DRAM Command Rate je stálý nárůst 30MB za sekundu. 

DRAM Burst Length

Bursting je technika při které DRAM předpokládá adresu další paměťové buňky po té, co dojde k přístupu do první.

Přístup probíhá po blocích (Burst), protože je rychlejší než jednotlivé přístupy, přitom se nejdříve předává adresa řádku a pak se spolu s adresou sloupce čtou zároveň sousední sloupce v řádku. Z toho vyplývá, že blok je ve tvaru x-y-y-y. První přístup (Leadoff Timing) lze nastavit jako vlastní funkci.

DBL Výkonnostní rozdíl Rozdíl v %
4 to 8 0 MB/s 0%

V našich měření se neprokázal žádný výkonnostní nárůst, ať bylo nastavení jakékoliv. 

Write Recovery Time (tWR)

tWR udává minimální počet cyklů než může dojít k příkazu precharge, který následuje po úspěšně dokončeném zápisu do buňky.Jinými slovy jde o počet cyklů mezi zápisem a precharge stavem. Podle Adrian''''s Rojak Pot toto nastavení nejen zvyšuje výkon pamětí, ale  i zlepšuje možnosti přetaktování.

tWR Výkonnostní rozdíl Rozdíl v %
3T to 2T 0% 0%

Test však nepotvrdil ani jedno z tvrzení, které je na stránkách Adrian''''s Rojak Pot. Nedošlo ani k zvýšení výkonu ani k ovlivnění přetaktování.

Závěr

Z testů jasně vyplývá, že nejvýznamnějším faktorem, který určuje výkon pamětí je frekvence. Ale není vhodné zcela odsoudit nastavení časování na úkor frekvence. Z možností  nastavení časování asi nejvíce ovlivňuje výsledek Bank Interleave (dop. 4-Way) a DRAM command rate (dop. 1T) a tRCD (dop. 1T). Pokud si dáme s nastavením záležet, rozdíl je jasný, až 72% navíc.

Jen si prosím uvědomte, že výsledky se mohou lišit počítač od počítače. Při použití jiné desky by výsledky mohly být zcela jiné.

Použité informace: Techwarelabs, Sysopt a Adrian Rojak Pot



 
Komentáře k článku
RSS
Pouze registrovaní uživatelé mohou přidat komentář!
27.5.2003 06:10:29   0.0.0.xxx 43
A co tRAS 4 a 5? To mam i ja na svi ECS K7S5A :-D
27.5.2003 06:57:08   0.0.0.xxx 55
tak tam mas i kapanek zajimavejsi hodnoty
27.5.2003 06:58:56   0.0.0.xxx 46
bus
27.5.2003 08:12:53   0.0.0.xxx 65
Pekny test, dobre shrnuti, tak nejak by to melo vypadat.
27.5.2003 08:43:19   0.0.0.xxx 44
Když jsem z už tak nestandardního nastavení pamětí (předvolba "turbo") změnil vše na nejrychlejší (obojí při CAS2 a FSB166), dostal jsem ve všech běžně používaných benchmarcích o cca 10 procent vyšší výkon... Paměti to v pohodě ustojí (Kingston HyperX) a rozdíl je opravdu viditelný!
27.5.2003 09:12:32   0.0.0.xxx 55
Dobry test, ale skoda ze test neni take na platforme AMD tam je chovani vykonosti pametoveho systemu zcela specificke.
Taky by to chtelo otestovat v nejakem realnejsim testu treba v 3DM2001. Nemusi to byt ve vsech kombinacich stacilo by jen v par - pro orientaci.
Jinak O.K.
27.5.2003 09:54:55   0.0.0.xxx 44
Poznamka #2 sa mi nezda.
Maticove je adresovanie pamati.Najskor sa vyberie riadok, potom stlpec.
Tym mam presne urcene miesto, z ktoreho chcem citat alebo kde chcem
zapisovat.Potom citanie alebo zapisovanie prebieha po riadkoch,cize riadok
ostava rovnaky a meni sa stlpec (ked su potrebne data za sebou).
Preto veta"jsou nejdříve získána data z řádku a následně ze sloupce" sa mi
nezda spravna.
27.5.2003 09:58:37   0.0.0.xxx 54
Ano, samozdrejme mate pravdu. Ja jsem se spatne vyjadril. Uz je to opraveno.
Dekuji
27.5.2003 11:23:25   0.0.0.xxx 45
Precetl jsem si pozorne cely clanek a je v nem hodne chyb a nesmyslu. Evidentne tomu autor nerozumi.Jedine na cem by se dalo shodnout je, ze nejvetsi vyznam pro pametovou propustnost ma frekvence FSB. Ale v dalsich parametrech jako tRP,tRas,tRCD, CAS latency je to uplne jinak. Daleko dulezitejsi jsou nastaveni chipsetu - northbridge hlavne IOQ size, MWQ, DRAM 4K/8K page size. CAS Latency ma taky mnohem vyraznejsi vliv nez pise autor. To svedci o velice spatne nastavenem northbridge.

Kdyz ctu vety jako " Všechny paměti větší než 64MB automaticky obsahuji 4-cestní Interleave (4-Way interleave)." - To snad autor nemyslel vazne.
1)neni pravda, ze vsechny pameti > 64Mb podporuji 4Way interleaving, zalezi totiz na jejich architekture.
2)Memory interleaving neni vlastnosti pameti, ale northbridge a jen VIA chipsetu.
3)To ze se provede nastaveni casovani v BIOSu neznamena, ze je ve skutecnosti takove casovani nastavene.Autor evidentne nekontroloval jestli se nastaveni projevilo a veril biosu. A to je spatne, protoze hodne chipsetu s P4X400 chipsetem nereflektuje nastaveni, ktere se provadi v biosu.To se tyce predevsim nastaveni CAS latency.

Za dalsi je nutne rict, ze toto je konkretni nastaveni na VIA P4X400 chipsetu, u ostatnich chipsetu - Intel,SiS, Ali ma jednotlive nastaveni zcela odlisny vliv na celkovy vykon pocitace. Dalsi veci je nastaveni chipsetu pro AMD platformu, kde jsou zase jine dulezitejsi parametry, nez nastaveni casovani.
K vyberu Sisoft Sandra, nemyslim si, ze je to objektivni test, zvlaste pro benchmark pametoveho subsystemu. Z toho plyne, ze takovy clanek je k nicemu a jen mate lidi. Vase vysvetleni, ktere jste uvedl NENI spravne.
Ale co se taky da ocekavat od pctuningu, kdyz jsem videl nadpis, myslel jsem si, ze to pise jiny autor. Ale obsah me hned uvedl do reality, ze to psal naprosty amater.
27.5.2003 12:00:25   0.0.0.xxx 44
A vida, kdopak to přišel. Mohli bychom zase po cca. třech letech "pokecat", jenom nemám aktuální mail ani ICQ#. Dejte kdyžtak kontakt jedné osobě, kterou známe oba (určitě víte, o koho jde)... nebo ho pošlete na můj mail.
27.5.2003 15:49:10   0.0.0.xxx 45
Ja mam s Athlonem 11x168 1,86 s nForce2 Epox8rda+ 2605/2452.pameti jedou na: 7
3
3
2.5
Serazene podle poradi v biosu.DualDDR enabled.
Bez dualu o 100 bodu mene.
Ten Intel je celkem slaby podle tech tabulek.
27.5.2003 17:09:39   0.0.0.xxx 44
Zase nekdo neumí česky. Chtelo by si to zopakovat češtinu.
27.5.2003 18:24:02   0.0.0.xxx 55
Mno, chtelo by to i nejaky prakticky test, treba Q3A, o obektivnosti by se takto dalo pochybovat, ;) tebas CAS ma vliv na 3D grafiku a obecne hry znacny, napriklad v Q3A to muze jit az do desitek fps, atd. no aspon neco... ;)
27.5.2003 20:20:13   0.0.0.xxx 55
Vynikajuci clanok v 3 castiach o tom ako pamäte
v skutocnosti pracuju je na strankach:
http://www.arstechnica.com/paedia/r/ram_guide/ram_guide.part1-1.html
http://www.arstechnica.com/paedia/r/ram_guide/ram_guide.part2- 1.html
http://www.arstechnica.com/paedia/r/ram_guide/ram_guide.part3-1.html

Kazda cast (Part1,Part2,Part3)ma niekolko stranok.
28.5.2003 17:58:13   0.0.0.xxx 55
mam ram kingmax 2x512DDR400 v sestave 180Mhz 5-2-2-2.0 na soltek 75FRN2 (nforce2), jede to bez potizi a vysledky ze sandry jsou 2800/2700 bodu (priblizne - ted ji nemam nainstalovanou)
PS: na 190Mhz FSB zacina mit potize procesor s FSB (mam jej odemceny a pouzivam 180x9.5 pro xp2000)
28.5.2003 20:32:19   0.0.0.xxx 45
Vyměnil jsem starou paměť (256MB SDRAM 133MHz) za novou (512MB DDR 266MHz), ale přenosová rychlost mi stoupla z 680 MB/s pouze na 700MB/s, ale podle testovacího programu Sisoftware Sandra 2003 by měla být alespoň 1500MB/s. Zkoušel jsem v BIOSu změnit všechny možné hodnoty, ale ani po těchto úpravách rychlost nepřekračuje 715MB/s. Konfigurace: intel celeron 1200MHz, ECS P6S5AT - chipset 635/T, Hercules 3D Prophet 400(Geforce 2 MX400), 512MB DDR 266MHz, Seagate 40GB. Prosím pomozte někdo! Díky
28.5.2003 20:47:20   0.0.0.xxx 55
Rozdil mezi CL3 a CL2 byva podstatne vyssi. Rozhodne se neda oznacit za odchylku v mereni. A o tom bych se klidne hadal. Tohle vypada, ze k prepnuti doslo pouze "kosmeticky" v BIOSu.
Chapu, ze autor to pouze prevzal z jinych zdroju, ale napsat, ze tento test ukonci vsechny dohady bylo ponekud posetile :-)
29.5.2003 13:54:38   0.0.0.xxx 54
Uvedom si ze ta brzdi priepustnost zbernice, ktora je teoreticky len 800 MBps. Ide o to ze napr. uz aj duron ma 200FSB, ale ty mas len 100FSB.
Proste tie data sa nemaju ako dostat k procesoru, a cakaju v northbridge na procak. (pamate idu na 200, ale FSB na 100).

Jedine co dokaze pamate vyuzit je pokial by AGP priamo pristupovalo do pamate. V principe si zbytocne kupoval nove pamate, co uz, mal si sa s niekym poradit :-)))
9.6.2003 00:05:57   0.0.0.xxx 34
No ja bych rekl ze je to dost hw vybavenim... Deska s P4X400 - pekny exot, vykon nic extra, navic intel se muze chovat uplne jinak, taky dnes uz vybehova pomala 400 MHz FSB...
8.9.2003 21:48:08   0.0.0.xxx 44
kup si aspon asus A7V8X-X nebo tak neco, ECS není deskaje to tim ja ji mel taky
25.1.2004 22:56:12   0.0.0.xxx 43
jestli je prechod z cl3 na cl2 jen odchylka mereni, pak nechapu proc je 512mbddr400mhzcl2 o nekolik tisic drazsi...
(napr kingston: 3500kc cl3, 4500kc cl2 (vykon 0,03% mi za tech 1000kc nestoji...
a nejlevnejsi 400mhzcl3 jsou jeste o 1300kc levnejsi...
takze podle toho testu se muzu rozhodnout jestli budu mit za stejne prachy 512mb400mhzcl2 nebo 1024mb400mhzcl3
cetl jsem v jednom casopise o hardware, cituji:
"urcite chtejte cl2, je docela bezne ze cl2 na 266mhz se vyrovnaji cl2,5 na 333mhz"
nejsem zadny expert ale a cemu mam ted verit?
30.6.2004 20:16:29   0.0.0.xxx 34
ja taky nejsem odbornik, ale typuju:
z CL2 se dá vymáčknout větší frekvence než z CL3
a ze CL2/266MHz je stejne rychla jako CL2,5/333MHz to si teda nemyslim, ta 333MHz by mela bejt i tak rychlejsi
rozdil CL je fakt minimalni, aspon podle kamose co si koupil pamet s CL2 a ma kdyz to "nacasuje" hur tu pamet tak skoro neni poznat(v benmchmarku)

Redakce si vyhrazuje právo odstranit neslušné a nevhodné příspěvky. Případné vyhrady na diskuze(zavináč)pctuning.cz

0 čtenářů navrhlo autorovi prémii: 0Kč Prémie tohoto článku jsou již uzavřené, děkujeme za váš zájem.
Tento web používá k poskytování služeb soubory cookie.