当前位置:首页 >> 最新技术 >> IT产业 >> 深入剖析Coppermine CPU的新技术
深入剖析Coppermine CPU的新技术
chinacir.com.cn   2009-4-16      文字大小:[ ]  收藏本页
      如果您仔细研究一下Coppermine的核心,我想您一定会失望的,它采用的仍是P6核心架构,也就是说Coppermine CPU仍然是X86体系的第六代CPU! 
      早在1995年Intel就在Pentium Pro上采用这个P6架构了,从这以后Intel的处理器,都没有摆脱这个架构的羁拌,而真正的第七代X86处理器Willamette的研发似乎陷入了困境!
      从架构说来,Coppermine CPU与Athlon相比只能算是个老古董,那么它是如何与Athlon这个目前最优秀的32位处理器核心相抗衡的呢?这要得益于它0。18微米的制造工艺和它的优化了的ON-DIE(芯片内建) 256K L2 cache!

      剖析Cache On-Die技术
      现在说起Cache On-Die技术已不是什么新鲜事了,让我们回想一下,在第二代Celeron处理器中,Intel首次采用了这项技术---L2 Cache直接集成在CPU芯片中,这样做有什么好处呢?其奥秘在于这可以使L2 cache 以与CPU核心频率相同的速度运行,而不像PII和早期的PIII那样cache必须以处理器一半的速度运行!同时这种设计方式带来的其他好处也显而易见,它拥有良好的散热性,从而使得Celeron立即成为Intel 处理器家族中超频能力最强的CPU!但是其不足的方面也很明显, Celeron的L2 Cache只有PII/PIII大小的四分之一,为128KB,使Celeron在大量的商业应用程序中表现出来的性能大打折扣!从传统意义上来说,游戏对CPU的Cache依赖性不是很大,但是对于像Photoshop这样对处理器的二级缓存依赖较高的商业应用程序来讲,在相同的CPU时钟频率下,拥有大容量二级缓存的PII/PIII会立即显示出自己的优越性!因此从一开始Intel就将Celeron处理器定位于低端市场!与Celeron处理器不同的是,Inel在设计Coppermine CPU时,将它的On-Die L2 Cache提升到了256KB。大大弥补了Coppermine处理器二级缓存不足的弊病。下面是Coppermine 与传统PIII Katmai在架构上的区别!
      由于采用了Cache On-die技术,所以原来在Katmai中的Tag RAM设计,在Coppermine中看不见了!
       Intel 将 L2 Cache 设计成on Die 之后,他们将这 256K Cache取了个新名字,叫做高级传输(Advanced Transfer Cache简称为A.T )L2 Cache,这种传输机制下Cache的时钟频率与处理器核心的时钟频率完全相同,而且为了增强 L2 Cache的性能,原来的缓冲区也做了相应的修改,以配合" A.T.C. ",而这新的缓冲区设计,就叫做"高级系统缓冲"( Advanced System Buffering 简称为A.S.B )。可不要小看了Intel的工程师们在On-Die Cache的这两个改进,正是正样,才使得相同的频率下Coppermine CPU能够击败采用了512KB L2 Cache的Katmai。
  
      高级传输缓存机制
      先来说说这ATC,从上图可看出,您可以看出ATC的主要作用是优化L2 Cache到CPU核心的通道。目前Comppermine拥有一条256位的数据通道直接连到CPU核心部分,是Katmai 64位带宽的4倍。此外,Coppermine在L2 Cache上采用了8路联合控制的工作方式,还拥有比Katmai少四分之三的Cache 等待潜伏期时间!正是这是优异的设计方案,才使得Coppermine处理器性能如此优秀!以下总结了ATC的主要特征:
     通道带宽 : 288-Bit ( 256 Data,32 for ECC )基本架构: 8路联合控制。Cache运行方式 : 写回式 ( 2 个周期时间 ) Cache数据带宽 : 以它32B的长度来说,当核心速度为733MHz时,每两个时钟的时间 ,相当于 11.7 GB/sec 的传输量。(?)物理地址空间 : 36位Cache的延迟时间,为原先 Katmai P3 处理器的 1/4。Cache的频率和处理器核心运算单元相同。

     看完了上面的分析,您可能会问,为什么不把L2 Cache全部集成为L1 Cache,这样不是还要快得多?而且还用得着采用P6架构上的复杂的双总线机制吗?这个想法是很不错,实际上我们想到了,Intel的工程师早已想到了,但是具体实施起来却相当的困难,要知道L1 Cache是核心结构中指令预取&解码单元和总线接口单元的的桥梁!它在核心架构中起着举足轻重的地位,如果贸然改变的大小的话,整个微结构要重新设计,这可能将是Intel的第七代CPU了。

     高级系统缓冲机制
     Katmai中采用的缓冲系统(未优化)
     Data Cache:数据Cache 
     Bus Queue: 总线队列
     Writeback buffer:写回式缓冲
     Data Request: 数据请求
     Data Response: 数据响应
     Dead Time : 等待时间
 
     Coppermine中采用的ASB缓冲技术 
     为了让Coppermine的整个Cache机制更优秀,同时也更合理,除了采用A.T.C外,Intel的工程师们把L2 Cache整个系统总线部分也做了个优化。对比上面两个图,您会发现与Katma的缓冲技术相比,它具有:
      6个填充型数据缓冲区 ( Fill Buffers ) : 由原先的Katmai中的4个,增加至6个,当Cache不阻塞时 ( NonBlocking Data Cache),凭借增加的缓冲区,可提升约50%的效益。
      8个总线队列: 由原先的Katmai的4个,增加至8个
      4个写回式缓冲区 : 从原先的Katmai的1个,增加至4个,以降低Cache在进行替换运算时阻塞的情形通过对总线队列和数据缓冲区的优化,Coppermine能够在无等待的情况下进行数据的传送,有效的避免写入较慢的内存或读入多重内存区域数据时,主存储瓶颈给CPU造成的延迟,在133MHz总线上预读取带宽更能扩充至680~1000MB/秒
0. 18μm ?造工艺我们来看看在Coppermine采用了0.18微米的制造工艺后,是如何提升速度的?
       可以从下面两面个方面来分析:
      1. 减小晶圆的尺寸,可能得到更快的速度,这是因为晶体管的门电路若能被缩小,代表在有效的面积下可集成更多的晶体管,而且晶体管越小,其驱动电流可以更小,更省电!要知道Coppermine在106平方毫米的芯片上集成了2800万只之多晶体管。
      2. 现代的集成电路的面积越来越小,但晶体管却集成得越来越多,在水平方向无法继续发展下去,只能往垂直的方向企发展,所以才会有多层的金属技术,这多层金属技术的核心是要用绝缘材料隔绝各层IC。早先采用的是Sio2(二氧化硅);而在Coppermine为了降低电流容量,以离子植入法,植入氟化物 ( SiOF ),以提升整个芯片的传导速度。
      总之,虽然Coppermine CPU仍采用5年前的老式的Pentium Pro架构,但是通过Intel的工程师们在整个L2 Cache方面的良苦用心以及采用先进的制造工艺,才使得Intel可以用它对抗AMD的第七代X86处理Athlon!而且目前中国台湾芯片大厂VIA电子推出了Joshua,微处理器大战已经打响,究意在这场微处理器大战中,谁会成为真正的赢家呢?我们拭目以待!

更多>>相关技术