|
奔腾IV性能综述
2000-09-11 10:21:12
1.介绍篇
英特尔的奔腾IV,一直以它的品牌而闻名于世。Willamette,IA-32英特尔CPU家族中最新的成员,也是英特尔P6家族中的第一位继承者。英特尔P6几年前发展于英特尔奔腾处理器,并且为整个英特尔CPU新家族开创了更大的发展空间。
随着外部L2缓存满时钟速度的运转,奔腾处理器也进入了一个空前的多样期:时钟速度和L2缓存配置的多样性。作为它的一个出色的继承者,奔腾II,是一种在P6 CPU核心和CPU半时钟速度运行时的外部L2缓存中增加了MMX技术的逻辑后继者。奔腾III增加了一系列的性能,例如:面向浮点的提高、3D的运用表现和英特尔处理器的系列号的流动SIMD延伸功能(SSE),这是一种能使CPU得到识别的重要特征。
英特尔奔腾III的Coppermine传达了L2--缓存在满时钟速度运行时的反馈,就像最初的奔腾处理器那样。然 而英特尔奔腾处理器的L2--缓存位于CPU包中,随着新的能够降低损耗和改进缓存潜伏与吞吐量的奔腾III处理器的出现,L2--缓存实际上是名存实亡了。
英特尔奔腾IV CPU基于新的32位微结构,其SSE2在许多方面超过了奔腾II/III等上两代的IA-32 CPU,它允许奔腾IV很好的处理更高的时钟速度,并且任务递交的程度也明显高于上两代产品。
2.SSE2,流动SIMD延伸,以及其他……
这里将要更进一步介绍奔腾IV的一些新特征,例如:SSE2、CPU核心、一种强大的指令管道以及他们对全面行为的影响。
奔腾IV加在P6 CPU核心上的SSE2(流动SIMD延伸 2)由76新SIMD指令和68整SIMD指令的提高版组成。所以加起来,我们共有144SIMD指令来管理浮点、应用程序和进行多媒体演示。
从程序设计员观点来看,这种新型奔腾IV CPU的编程模式与MMX技术和我们以前在奔腾II/III中的SSE模式并没有什么不同。但是,随着新的SSE2指令集的出现,就要求程序设计员具有更高的灵活性和兼容性,他们要使SIMD计算能运行于双浮点、整形数据输出以及MMX注册表中的全整形数据输出等种种情况下。
在英特尔奔腾IV中介绍的新的SIMD指令集包括了双浮点和整数。它们的目标是要驱除当今x86 CPU中的几个瓶颈问题:x87 FPU或者是双浮点单位等等。
x87 CPU的表现严重受限于x87 CPU标准的衰老。如果我们还是坚持这种老式的标准设计,那么要提高x87 CPU的表现将不是件容易的事情。所以,使用SSE2来完全绕过它是一种很好的解决瓶颈问题的办法。更令人兴奋的是,如果英特尔能从软件开发商中得到更多的支持,并且刺激他们使用SSE2去做双浮点运算,那么奔腾IV的SSE2 FPU将以近乎十倍于x87 FPU的速度运行!
3.管线、轨迹缓存,等等:
随着这个在曾经于x86 CPU中贯彻得最长的20字段管线在奔腾IV中的引进,英特尔已经发现了即使是在超转1.5GHz的情况下也能将CPU运行到一个很高时钟速度的方法。通过在持续的时钟循环中交换掉一些字段号的方法,使用一个更长的管线来增加CPU的时钟速度。当要在一些字段中执行一个指令时,一个十字段管道线把这个指令分成十个步骤,并且采用十个时钟循环来执行整个指令,一个时钟循环完成一个步骤。因此一个20字段管线的奔腾IV要采用20个时钟循环来完成一个指令,而这一切都发生在一个个很小很小的时钟循环内。
处理一个指令需要很多个时钟循环。换句话说,一条指令执行所需要的全部时间就是指令的潜伏时间;拥有一条越长的管线就意味着越长的指令潜伏期。为了减少从主存中读取每条新指令时的漫长等待,所有现代的x86 CPU都使用了指令缓冲器。随着管线的增长和潜伏期的增加,每一个指令都要因为上一条指令处理时间的增加而不得不等候在指令缓冲器里,因此指令缓冲器必须要比存在于一个较少管线的CPU中的缓冲器大得多。
很明显,整数操作在ALU这个算术逻辑单元中进行。奔腾IV采用了新一种的方法去减少某种整数指令的潜伏期以补偿长管线带来的不便。通常ALU只在一个时钟循环的上升边处理一个指令,但是它也在下降边处理指令,而奔腾IV有效地为一定的整数指令提供了双倍的处理时间。
另一个有力支柱是轨迹缓存,轨迹缓存按照指令的执行顺序将他们储存起来。例如,指令A从100号地址跳到指令B所在的200号地址,轨迹缓存就把指令B储存在紧挨在指令A后的地址中。这就使得确保指令在缓存中的正确顺序变得容易了许多。
4.结束语:
英特尔奔腾IV CPU由许多令人兴奋的特征使得它成为下一代CPU.为了概括这些新的特征,现在总结为NETBRURST特征:
管线化Hyper技术。20字段管线完美的提高了处理行为和频率能力。
快速处理机能。处理器的算术逻辑单元以两倍于核心的频率运转并且允许它在1/2核心时钟记号中执行一定的指令。整数指令以两倍于剩余处理器的进行执行。这些引起了更高的执行吞吐量并且减少了执行潜伏期。
400 MHz系统Bus.这种高级的、分隔处理的、深度管线化的系统Bus提供了比英特尔奔腾III处理器系统Bus宽三倍的带宽。它含有带着64字节入口的128字节线。它提供了处于奔腾IV处理器与内存管理器之间的3.2gigabyte转移速度。并且它也是一种高带宽的可靠的台式电脑系统Bus.
执行轨道缓存。这是一种高层次的一破解指令缓存。因而就能把译码器潜伏期转移到主执行循环期。这项革命性的技术就像高效利用缓存体存量一样提供了更高的指令性能。另外,奔腾IV先进的256kb转移缓存也为核心频率比例增长划分了分界面。
流动SIMD延伸2(SSE2).SSE2凭借144新指令集扩展了MMX和SSE技术,包括由大范围应用而使性能上升的128位SIMD整数算术和128位SIMD双精度浮点指令集。
综上所述,为了获得超额的1.5GHz时钟速度,英特尔在奔腾IV中依然贯彻了那种极有创造力的路子。如果得到彻底的贯彻与支持,新的SSE2指令集,长管线,轨迹缓存将有助于促成一个披着羊皮的狼的霸主CPU.
(网友投稿 文/lukal) |
|
404 Not Found
404 Not Found
nginx
|