您现在的位置: 济宁之窗 >> 网络学院 >> 硬件学堂 >> 服务器评测 >> 教程正文
困则思变:AMD 双核心 Opteron首测

来源:本站原创 点击: 更新:2007-6-5 04:27:53
  人们不断追求处理器的性能,但面对速度越快温度越高、制程越先进技术更困难的情况下,要再大幅提高处理器性能,Dual Core技术会否是灵丹妙药呢!?HKEPC独家找来AMD新一代Dual Core Opteron处理器,希望藉此为大家找出答案。



处理器频率提高出现困难

  1965年Intel公司的总裁Gordon Moore提出了Moore定律,他说电晶体会每24个月增长一倍,虽然这个定律或多或少有点吹件的性质,但Intel却是追随着这个定律足足40年可真恐布,不过要两年翻一翻可真不易呢,加上人类对性能的追求不断增加,但x86处理器的技术却渐渐走到尽头,相信要像过往数年由1GHz转眼变成3GHz的光景着实不易,令市场上处理器频率停滞不前,是无法短期内可以解决。



  处理器工作频率停滞不前的主因,主要是频率越高令工作温度也提高了,加上整合的功能越来越多令良率变低,与此同时制程进步令漏电的情况更见严重,更令处理器工作温度上升,结果令Intel原本的4GHz计划也要搁置,因此Intel和AMD都在追求频率以外的提高性能方案,例如增加系统总线的速度、提高Cache的容量和命中率、加强处理器的指令集如MMX、SSE、SSE2、SSE3、3D!Now、3D!Now Pro等以优化执行效率,当各种方法都用尽后而单颗处理器走到尽头,最后业界也只好搬出Dual Core/Multi技术来。


处理器技术结构再没进步


  
  其实x86处理器多年来除了频率外,在结构上并没有什么大进步,现时AMD和Intel的处理器,虽然x86是CISC的处理器,但却拥有不少RISC处理器的特性,例如SuperScalar(超纯量运算)、SuperPipeline(超级执行管线)及Dynamic Execution(动态执行),这些改革都早在Pentium Pro中已经出现,这颗94年发表的结构竟然用到今时今日,再也没有更令人震惊的处理器新技术出现了,就算是现时的Pentium 4或是Athlon 64,也只不过是Pentium Pro的加强版而已,例如频率、Cache及Pipeline方面的加强,但却走不出Pentium Pro结构的框框。



  为了令处理器频率可以大幅提高,各处理器厂商都增加了SuperPipeline的数目,而Intel的Pentium 4 Prescott核心更高达31层SuperPipeline,为什么增加Pipeline Stage可增加频率呢!?首先我们要浅谈Pipeline原理,Prescott 有31Stage的Pipeline, 代表CPU可以把一个指令分为31份进行,而每一个Mhz可以运作两个Stage,而CPU可以同一时间做十数个指令,但新的指令要等上一个指令的Stage完成后才能开始,故此如果Stage分得细一点的话,即每个频率所工作的份量就会较少亦能尽快完成,开始下一个指令,这样就会较易增加频率。但是这个理论是假设CPU的工作永不出错才能成立,但现时CPU都是利用预支结果(Branch Prediction)来增加效率,但预支结果是不能100%尽确,如果其中一个Stage出错的话,工作就需要重新进行,而其他需要得到这个相关这个工作的指令也很可能要重新进行,Stage越多预支结果出错时所做成的牵连及延误,比Stage较少的更大。故此增加Stage令频率及性能得以提高,关键在于Branch Prediction的准确度,但某CPU厂的工程师表示要令Branch Prediction做得好是十分困难的,这也反映了为何Pentium 4在同频率下反要比Pentium M还要差吧,因为Pentium M只有16个Stage。另外处理器厂商还提高处理器内部的Cache数目,只是当Cache已达一定数目,再增加性能增长也不明显了,所以业界一般都认为Dual Core/Multi-Core是唯一的出路。
CPU = 1 + 1 = <2



  中国人有句说话叫作"人多好办事",当单核心处理器走到尽头,何不采用多处理器技术把工作分给两颗处理器来办呢!?这技术就是Symmetric Multi-Processor平行运算,理论上把一件工作分给两颗处理器去办,就能缩短完成的时间。论理虽然如此,但实际上两颗处理器平行运算并不可能出现两倍单颗处理器的效率。因为工作分给两颗处理器不可能完全公平分工,当其中一颗做完后需要等另一颗处理器的结果,因而出现闲置的情况浪费频率。

  此外,两颗处理器通常都是采用相同的总线,当一颗处理器在占用时,另一颗需要等它释放才可以取得总线的控制权,同时两颗处理器必需要保持内容一致性,这令两颗处理器间必需不停同步更快,因而浪费了不少时间,故此1+1在SMP上并不等于2,但面对现时频率和性能出现提高困难的境况下,SMP平行运算却是唯一的出路。

什么是Dual Core/Multi Core !?

  如果多颗处理器一起工是称为SMP,那Dual Core/Multi Core就是指Symmetric Multi-Processor On a Chip,意思是同样两颗或以上的处理器平行运行,只是他们把两颗处理器直接做在同一颗处理器上,好处是SMP On a Chip其速度会比SMP快,因为传送的途径变短令推迟值缩短,而且整体成本也比两颗处理器较低,但却会大大考验处理器厂商的良率能力,因为要两颗核心也正常的或然率要普通Single Core的低。现时处理器厂商会三个方法达成SMP On a Chip,第一个方法是核心不作任何改良,把两个核心封装在一起。第二个是把两个核心放在同一个die上,不过两颗核心还是完全独立的。而第二个则是两颗核心是有联系的,而且Cache是共用令处理器不用经常作同步更新Cache的资料,而这个方法则是Dual Core/Multi Core最理想的设计。

Hyper-Threading VS Dual Core /Multi Core

  SMT (Simultaneous Multi Threading)其实就是一颗核心以模拟的方式扮作两颗处理器,以增加运算速度,其中最着名的当然就是老大哥Intel的Hyper-Threading吧,虽然它在windows下会被认出为Logical的两颗处理器。因此不少人被误导 ,认为Hyper-Threading和Dual Core一样能同时执行两个Threads,那么同双处理器和它又有什么分别呢?

  原来Hyper-Threading能同时执行两个Threads,但却不能像真正两颗Physical CPU,各处理器都有独立的资源,但Hyper-Threading的处理器的Logical处理器却是单颗处理共用资源。当两个Logical处理器同时需要处理器相同的资源时,其中一个要暂停并要让出资源,要待那资源闲置才能继续。假设程序在Single Thread时要6个Cycles,但Multi Processing就能以3个Cycle完成,而Hyper-Threading就由于某Cycles中,CPU的资源出现重叠,故某个Thread会出现推迟,因此可能需要4个Cycle才能完成,不过效果还是比没有Hyper-Threading的好。

  但以上的情况是十分理想,但不少测试却指出当两个Threads同时要求同一样资源时,就很有可能出现冲突(Conflict),解决这Conflict时会出现时改需推迟或需重新开始,当Conflict大量出现时,性能可能会减至比没有Hyper-Threading更差,因此SMT还是不能和SMP相提并论,不过如果当SMT配合SMP呢!?没错,Intel的Pentium XE 8xx系列就是Dual Core配合Hyper-Threading,令windows能认出为四个Logical处理器,很是夸张呢。
  

  AMD将会先于工作站/服务器级处理器市场上推出双核心技术,其采用Socket 940接口并用上90纳米IBM SOI制程,核心代号为Egypt,据AMD表示双核心处理器可以在更新BIOS下用于旧主板上,全因AMD的K8结构拥有System Request Interface及Crossbar,可让两内核于芯片内进行运算,而不需改变主机的结构,而对外还是拥有3条HyperTranpsort总线。

  相对于Intel来说,无疑AMD于Dual Core方面会比较有优势,Intel的Dual Core和SMP平行运算一样,两个核心都必需要通过总线作沟通,利用外频作沟通,以确保两个核心内部的Cache资料是同步更新的,否则可能会导致运算出错。但AMD核心内部有System Request Queue和Crossbar,它们能于处理器内部就能互相沟通以减低因要占用总线而产生的推迟,加上系统存储器内建于控制器内,也令AMD于Dual Core中,其结构比Intel更为优胜。



需更新BIOS才能正确认出



  我们收到了由AMD送测的AMD Opteron Dual Core工程样本型号为886,在处理器第一句最后两组字BS就是代表它是双内核的证明,它是04年第41周出品频率为2.2GHz,每个核心拥有64KB L1 Cache及1M L2 Cache,支持1GHz Hyper-Threading。虽然是Dual Core但其功耗只有95W,同时它亦已进入E0的Stepping,因此它将支持SSE3指令集,但要注意一点就是SSE3指令集有3个指令是优化Hyper-Threading的,因此AMD的SSE3并只有10条指令而已。由于现时并没有主板BIOS正式支持Dual Core,因此我们找来了好几片主板才能完成测试,包括了Tyan S2875、S2881及S2895,其中只有S2895能正确及稳定认出为Dual Core,但由于BIOS还未加入处理器识别码,因此在BIOS中只能认出为Unknow CPU,但在测试中我们可以看到两颗处理器是同一时间运作的。据Tyan向我们回覆指现时大部份Tyan主板都可以通过BIOS来支持Dual Core Opteron,但并不排除一些超旧的形号因设计上的原因而未能支持Dual Core Opteron。



正式版型号有所出入

  现时大部份厂商或媒体收到的Dual Core Opteron型号都是866,但原来正式推出的Opteron并不会有这样的形号。AMD已铁定2005年4月21日正式推出(约于四月尾)正式发布,包括了Opteron 265、270、275及865、870、875,频率为1.8GHz、2.0GHz及2.2GHz,它们的分别在于支持两路或是最高8路。而较后的时间将会推出只支持单路的Opteron 165、170及175。那究竟家用版Dual Core又何时推出呢,据和AMD关系密切的厂商表示他们打算于台湾Computex发布,看来AMD将会于今年二季度完全进入Dual Core时代。

  为Tyan Thunder K8WE S2895工作站主板,其支持两路Opteron处理器,主板上各有两组合共8个DIMM存储器插槽 ,支持Dual Channel技术容量最高16GB,对工作绘图来说存贮器高容量的支持是十分重要的。可能是工程样本的关系,主板上焊了空了原有的SCSI RAID芯片,因此并没有支持SCSI的硬盘。由于工作站较多采用PCI-X接口,因此主板上除了两组PCI-Express x16及一组PCI 32Bit外,就只有PCI-X接口了。

  主板上有三颗芯片被散热器覆盖着,而其中两颗分别就是主角nForce Pro 2200及nForce Pro 2050,因此主板上两个PCI-E x16接口速度真正达至x16速度,比桌面级nForce 4 SLi只有x8高出一倍,大家可能会认为需要那么高的频宽吗,可能在3D游戏上会不太明显,但在专业的绘图软件上,它们是利用大量的数据上处理一个3D效果 ,加上他们将会用到十分高分辨率来工作,因此对频宽要求绝对是多多益善。

当Dual Opteron主板碰上Dual Core

  虽然是只支持2路的Opteron主板,但这片Tyan S2895接上两颗Opteron 866,BIOS的Post画面还是能认出有四个处理器核心,处理器Stepping为E0,频率为2.2GHz,但实体处理器数目则只有两个,证明是以Dual Core的方式在运作,在测试中我们没有插上CPU1的存贮器,因此其存储器频率显示出现错误!?

Dual Core Opteron x 2 @ XP Pro

  Dual Core在软件方面其实拥有一个大问题,就是操作系统的授权,原来现时大部份Microsoft的操作系统都是以CPU数目来授权,我们在Microsoft的网站上找到操作系统支持的处理器数目如下:


  从图表中我们可以看到Windows XP Pro理论上是不能支持两颗Dual Core的,因为它只支持两颗Physical CPU或四颗Logical CPU,虽然微软已经诚诺当Dual Core推出时,Physical CPU是以Per Socket计算,但笔者在没有更新至SP2下,也能看到四颗Physical CPU被支持,而且测试中亦证实四颗Core是同时运作的。
  
测试平台:

   AMD Opteron 248 x 2
   AMD Opteron 866 x 2
   Tyan K8WE S2895
   Kingston DDR 333 512MB x 2 (CL 2.5-3-3-7)
   Inno3D Geforce 6600GT PCI-E x 2
   Gigabyte 3D Rocket Cooler x 2
   Maxtor DiamondMax 9 120GB 7200rpm 8MB
   Delta ServerPower 460W

Opteron 248 VS Opteron 866

  


  测试前我们找来了两颗Opteron 248作对比测试,Opteron 248速度为2.2GHz,同样拥有64KB L1 Cache及1MB L2 Cache,虽然不支援SSE3但对结果的影响并不太大,我们会拿一颗及两颗同时运作的成绩Opteron 248,当然我们还会拿1 x Opteron 866 Vs 2 x Opteron 866。 

平台一览:
  
  
Opteron 248 x 1 VS Opteron 866 x 1




  测试中我们可以看到在同频率,Dual Core的确能提高系统运算的效能,不过却并不是一倍的增长,但这也是意料之中的事,而在绘图软件方面,由于主要是靠显示卡的运算能力,因此Single Core和Dual Core在效能上分别并不太大。而部份软件例如Super PI等却没有因Dual Core而受惠,证明Dual Core的威力也是要靠软件本身的设计上支持才能发挥。
Opteron 248 x 2 VS Opteron 866 x 1





  虽然两者都是拥有两颗实体核心,但明显地Opteron 866的性能比两颗Opteron 248优秀,主要原因相信是Dual Core是内部通过CrossBase及System Request Unit作数据上的交流,比采用外部Hyper-Threading作传输的Dual Opteron 248更有效率,不过两者相距并不太远
发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
 
  • 上一条教程:
  •  
  • 下一条教程: 没有了

  •  焦点推荐
     [用系统][NextPage]
     [用系统]合伙托管服务器全程体验(中)
     [用系统]合伙托管服务器全程体验(下)
     [软件评测]“按键精灵” 轻松解放你的双手
     [软件评测]轻松享受音乐新生活——酷听在线
     [软件评测]在“群英会”里会群英(组图)
     [软件评测]让任务栏随叫随到,还原完美壁纸
     [软件评测]玩新奇 网页版QQ、MSN、POPO简评
     [软件评测]网址收藏随身带 一键收藏详细评测
     [软件评测]系统守护神—360安全卫士新版测试
     [软件评测]我用所以我喜欢 绝靓Vista侧边栏
     [软件评测]眉目传情,我用《魔术情书7.59》
     [软件评测]教你使用iSee打造我的图片王国
     [软件评测]WMP 11播放器汉化版入手使用手记
    最新热门评论
    热 门 话 题

    没有任何图片教程
    招 商 信 息
    热 门 推 荐
  • 此栏目下没有推荐教程
  • 此栏目下没有热点推荐教程
  • 校 园 周 刊
    推荐教程 性感意大利 丰满女郎甜
    推荐教程 浪漫的法国女郎 丰满裸
    推荐教程 有趣好用的MSN动态个性
    推荐教程 QQ小技巧新发现,为传
    推荐教程 DW MX实例:制作产品展
    推荐教程 DW MX实例:实现电子商
    推荐教程 DW MX实例:给产品下订
    推荐教程 DW MX实例:实现产品搜
    热 门 信 息
     2006两岸祭孔大典
     济宁市市中区首届邻居
     第二期--009
     转让正在经营的儿童摄
     全市商业贿赂典型案例…
     济宁市治理商业贿赂领…
     夏天来临前的20个防晒
     周总理珍藏彩色画册 有
     性感而随意的诱惑 流行
     泗水文化历史
     泗水地方风情
     泗水乡情

    本站部分内容由用户或网友提供 济宁之窗不承担由于内容的合法性所引起的一切争议和法律责任
    如果您认为侵犯了您的权益 请来电或来函告知 本站将立刻停止使用
    Copyright © 2002-2006 济宁之窗 All Rights Reserved.
    Tell:2283611 2283612 服务 web@jnzc.net 24小时值班电话:3321199
    经营许可证:鲁B2-20031025号