武汉大学论坛|大汉武立

 找回密码
 注册[30秒完成]
搜索
查看: 26547|回复: 0
打印 上一主题 下一主题

[硬件知识] 内存优化完全手册

[复制链接]
跳转到指定楼层
1#
发表于 2008-9-9 01:01:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
同样的CPU,同样的频率设置,为什么别人的运行效率就比我的高呢?为什么高手能以较低CPU频率跑出更好的测试成绩呢?问题的关键就是内存参数的调校。在一般的超频中,只会调整一些基本参数,比如某超频报告中会说到内存运行状态为“520MHz、3-4-4-8 1T”,那么除频率外后5个数字就是基本参数。还有一系列参数被称之为“小参”,能起到辅助调节作用,当调节基参后仍无法提高频率,或者性能提升不明显后,调整“小参”往往会得到令人意外的惊喜。以下我们根据基本参数与小参分别介绍调校方法。
    目前的内存还是使用类电容原理来存储数据,需要有充放电的过程,这个过程所带来的延迟是不可避免的。在BIOS中,所有关于内存调节的参数其实都是在调整这个充放电的时序。受颗粒品质影响,每种内存的参数几乎都不完全一样。面对这些参数,我们必须先了解其原理才能在以后的调节中做到信手拈来。以下我们讲解一些重点参数的含义。
● CAS Latency
    CL全称CAS Latency,是数据从存储设备中输出内存颗粒的接口之间所使用的时间。一般而言是越短越好,但受于制造技术和内存控制器所限,目前的最佳值是2。
    从图中,我们能够直观的看到CL值变化,对数据处理的影响。虽说在单周期内的等待的时间并不长;但在实际使用时,内存每秒要400M次以上的周期循环,此时的性能影响就相当明显了。

● RAS、CAS与Tras
    内存内部的存储单元是按照行(RAS)和列(CAS)排成矩阵模式,一个地址访问指令会被解码成行和列两个信号,先是行地址信号,然后是列地址信号,只有行和列地址都准备好之后才可以确定要访问的内存单元。因此内存读写第一个延迟是RAS到CAS的延迟,从行地址访问允许到读、写数据还有一个准备时间,被称为RAS转换准备时间。这也就是为什么RAS to CAS参数对性能影响要大于RAS Precharge的原因。
    内存预充电和有效指令之间的时间差。对于DDR内存而言,一般是预充电命令至少要在行有效命令50000ns(BIOS中显示为5)之后发出,标准是在70000ns~80000ns,此数值不可过大或过小,否则就会影响到内存运行的稳定性。
    总结一下就是:CAS Latency 决定了接收寻址命令到数据进行真正被读取所花费的时间。RAS to CAS决定了行寻址至列寻址之间的延迟。RAS Precharge则决定了相同行寻址中不同工作的转换间隔。Tras控制了内存预充电和有效指令之间的时间差。而真正关系到内存性能的也就是CAS Latency、RAS toCAS和RAS Precharge三个延迟参数。在很多超频报告中,一般会说明内存参数为X-X-X-X,例如3-4-4-8,就是表明这个系统的内存参数设置为CL=3,RAS to CAS=4,RAS Precharge=4,Tras=8。
● Command Rate
    K8处理器的出现使得内存控制器第一次被整合进了CPU,其控制能力也得到了最大化加强。这就使得一些以前鲜为人知的延迟选项得以公开,最引人注目的就是“首命令延迟” Command Rate。DDR内存在寻址时,先要接收CPU的指令,然后才是行激活与列地址的选择。这个参数的含义就是指内存在接收CPU的指令之前的等待时间(此时间过后就是CL延迟),单位是时钟周期T。很显然,这个等待时间是越短越好。但当随着主板内存模组的增多,控制芯片组的负载也随之增加,过短的命令间隔可能会影响稳定性。至于Command Rate对系统性能能产生多大的影响,我们会在后面进行详细的对比测试。
测试平台介绍:
    为了帮助初涉超频的玩家尽快熟悉超频内存要用到的参数,我们以G.SKILL 1GB GH内存参数设置为例进行讲解,希望能给大家在超频过程中带来些许帮助。
    测试选用了NF4平台,主板为DFI Lanparty NF4-D。LanParty系列是DFI专为超频玩家打造的主板,可谓K8平台超频最强板。而Opteron146 采用90nm的工艺制程,大多在风冷状态下达到2.8G堪比AMD单核王者FX57。性能自不用说,DFI主板的品质也是十分有保证的,这种组合可以保证测试的稳定性。
    下面我们来看下这次测试的主角——G.SKILL 1GB GH 512MB×2双通道包装采用华邦UTT颗粒,在默认2.7V~2.9V的超低电压下有着默认DDR400 2-2-2-5的低延迟的时序。
启动进BIOS后,首先要调节HyperTransport(下文简称HT)频率,HT频率与CPU频率类似,分为倍频和外频两部分。HT总被很多人误解成系统总线FSB,所以不少人总是希望能够尽可能的把HT超至一个比较高的状态。HT超频对于性能的影响微不足道,而且HT频率的提高会影响整个超频的成败。事实上许多超频失败的情况,都是由于在超频时没有降低HT倍频造成的。
    为了超频的稳定,我们首先将HT倍频降为x3,C&Q关闭,CPU电压请根据体质设定为1.450v,内存电压加至3.3v,“DRAM+03V If it’s not 3.2V”设为Enabled。高压是BH5/UTT颗粒独有的特性,你不用担心3.3v会太高,这才是刚刚起步。电压对内存超频至关重要,很多时候并不是越高越好,有时候甚至是违反常理的。比如早期的BH5在2-2-2-5 4V可以稳定运行所有测试软件,而近期的UTT加到3.9v反而不能进系统,这些只有自己多试验才会发现。BH5/UTT推荐3.3v~3.6v电压,BH5上限可到4v,UTT略低为3.8v。超频过程中请做好内存散热,以烧毁硬件设备,而且不建议在高电压下长期超频运行。
    CPC Enable这个参数就是大家所说的Command Rate 1T。Tcl 2对于其他颗粒来说,放宽会达到更好的稳定性以求更高的频率,而BH5/UTT颗粒设为3会导致无法开机;Trcd 2、Tras 5、Trp 2、Tref Auto,上述为BH5/UTT的标准设置。如果这样可以稳定的话,我们还可以把Trfc进一步调低,BH5/UTT最低为12,设置为15会更加稳定,这个参数对SuperPI的影响很大。此外,没有提到的参数请不要擅自改动。
    DRAM Drive Strength跟DRAM Data Drive Strength这两个参数对稳定性至关重要,BH5/UTT的话用5或3是稳定的。接下来是Max Async Latency,这又是一个重要的参数,对稳定性跟性能影响比较大,放宽这个参数会比较稳定,但影响性能,一般保守用8,不稳定的话用9,最紧是7。Read Preamble Time也是个非常重要的参数,保守设5.5,最小是4(比较难跑),放宽这个参数会得到立杆见影的效果,不过性能下降也是相当可怕的。另外,不要盲目的把read premable和max async time调得太紧,反而会影响效能。IdleCycle Limit用256,稳定的话用16,以8和16为最佳。Dynamic Counter用Enable。两个Bypass使用16x 7x,最紧8x 4x。32 Byte Granulation这个参数对频率和性能的影响很明显,有时甚至会超过Command Rate,有些卖家在销售“保超”条的时候会将此值设为Enable,以牺牲性能换取频率的提升。
经过一番调校,内存性能可以提高多少呢?下面就是运行SuperPi超频后的性能表现。
    Opteron 146 OC 2.7G,如果内存异步运行DDR400默认设置,运行1M SuperPi用时为34s。如果优化内存参数到DDR540 2-2-2-2 Trc=7 Idle Cycle Limit=16,运行Super PI 1M位会30s。
    测试均未对系统做任何改动,对操作系统精通的老手经过进一步的系统优化会跑出更高的效能。上述参数为笔者多次调校总结,希望会给有BH5/UTT的玩家在超频带来帮助。
    可能有朋友会问了,这提升的4s能起到多大作用?对日常应用会有明显改善么?呵呵,刚才可能有一点忘了说,就是小参的调节主要用于极限超频,是玩家挑战记录时才会用的手法。如果时日常的超频,以追求稳定性、性价比为主的超频,那么小参可以根本不用理会,只要调节基参就好了。
    关于每个小参的选项意义,以上用表格来系统整理一下。
看到这里有些玩家会抱怨:我没有DFI主板,那该怎么调内存参数呀!没关系,由于A64的内存控制器是集成进CPU内部的,所以就可以使用通用软件对其进行调节。A64 Tweaker就是这样的一款软件,由世界最强超频网站XTREMESYSTEMS.ORG开发,能对内存延迟、时序及功能选项加以全面调节,有些功能甚至超过了DFI的BIOS。
    此款软件的选项命名与DFI主板BIOS十分相似,对于稍有经验的超频玩家来说。上手并不困难。此外,它还支持实时参数调试,这就省去了频繁重启保存BIOS的麻烦。但A64 Tweaker有时会出现假死的现象,为了弥补这个bug,XTREMESYSTEMS.ORG近期又推出了a64info软件。
    A64info在内存调试原理上与A64TWEAKER一样,但其加入的CPU信息检测和频率计算功能却是前代软件所不具备的。在项目上,TREF与DFI BIOS中的设定值相同,而且还能在系统中调整DATA DRIVE STRENGTH。针对Intel平台,也有专门的内存参数调节软件MemSet。
    MemSet软件可用在Intel支持双通道内存主板上,从865到975X均能使用。其中的参数虽没有K8平台全面,但也足够超频玩家使用。近期“酷睿”的SuperPI超频纪录就都是在MemSet软件的辅佐下达到的。
● RAS、CAS与Tras
    内存内部的存储单元是按照行(RAS)和列(CAS)排成矩阵模式,一个地址访问指令会被解码成行和列两个信号,先是行地址信号,然后是列地址信号,只有行和列地址都准备好之后才可以确定要访问的内存单元。因此内存读写第一个延迟是RAS到CAS的延迟,从行地址访问允许到读、写数据还有一个准备时间,被称为RAS转换准备时间。这也就是为什么RAS to CAS参数对性能影响要大于RAS Precharge的原因。
    内存预充电和有效指令之间的时间差。对于DDR内存而言,一般是预充电命令至少要在行有效命令50000ns(BIOS中显示为5)之后发出,标准是在70000ns~80000ns,此数值不可过大或过小,否则就会影响到内存运行的稳定性。
    总结一下就是:CAS Latency 决定了接收寻址命令到数据进行真正被读取所花费的时间。RAS to CAS决定了行寻址至列寻址之间的延迟。RAS Precharge则决定了相同行寻址中不同工作的转换间隔。Tras控制了内存预充电和有效指令之间的时间差。而真正关系到内存性能的也就是CAS Latency、RAS toCAS和RAS Precharge三个延迟参数。在很多超频报告中,一般会说明内存参数为X-X-X-X,例如3-4-4-8,就是表明这个系统的内存参数设置为CL=3,RAS to CAS=4,RAS Precharge=4,Tras=8。
● Command Rate
    K8处理器的出现使得内存控制器第一次被整合进了CPU,其控制能力也得到了最大化加强。这就使得一些以前鲜为人知的延迟选项得以公开,最引人注目的就是“首命令延迟” Command Rate。DDR内存在寻址时,先要接收CPU的指令,然后才是行激活与列地址的选择。这个参数的含义就是指内存在接收CPU的指令之前的等待时间(此时间过后就是CL延迟),单位是时钟周期T。很显然,这个等待时间是越短越好。但当随着主板内存模组的增多,控制芯片组的负载也随之增加,过短的命令间隔可能会影响稳定性。至于Command Rate对系统性能能产生多大的影响,我们会在后面进行详细的对比测试.
您需要登录后才可以回帖 登录 | 注册[30秒完成]

本版积分规则

手机访问本页请
扫描左边二维码
         本网站声明
本网站所有内容为网友上传,若存在版权问题或是相关责任请联系站长!
站长联系QQ:7123767   myubbs.com
         站长微信:7123767
请扫描右边二维码
www.myubbs.com

QQ|小黑屋|手机版|Archiver|武汉大学论坛|大汉武立 ( 琼ICP备10001196号-2 )

GMT+8, 2024-4-25 19:09 , Processed in 0.069770 second(s), 14 queries .

Powered by 高考信息网 X3.3

© 2001-2013 大学排名

快速回复 返回顶部 返回列表