中华网通行证
用户名 密码
  科技动态 硬件广场 下载基地 网络教室 网络冲浪 科学博览 移动时代 手机上网 桌面壁纸 科技商情  

Pentium 4 评测报告(3)
LazyCat/太平洋评测室 2000-11-20 15:34:59

  CPU性能的第二个方面是提高IPC值,即CPU在一个周期内执行的指令数目。

  Pentium4和之前的P6级CPU一样引入了乱序随机执行的机制以提高IPC。要实现乱序随机执行就需要对指令进行分支预测,可以说分之预测是超长流水管线能够有效工作的关键。分支预测虽然能够引入乱序随机执行以提高指令的执行效率,但并非百分之百的预测成功。一旦预测失败,CPU将耗费更多的指令周期以重新安排指令的执行顺序。这就将大大的降低IPC值,从而降低CPU的性能。为了减少预测失败,INTEL在Pentium4具有超深流水管线的NetBurst微核心中改进了指令预测机制,采用了高级动态执行引擎(Advanced Dynamic Execution engine)和指令执行跟踪缓存(Execution Trace Cache)。指令跟踪缓存加速了从L2 Cache送来的经过解码的指令,并能够跟踪指令的执行情况来更好的利用宝贵的L2 Cache空间,这就能够传递更多的指令到执行单元,并减少由于预测失败而带来的指令恢复时间。高级动态执行引擎的功能是动态的为执行单元提供执行指令,以防止执行单元的执行停顿。例如在Cache没有命中的情况下,必须从系统内存中重新读取数据而造成的执行停顿。这时候动态执行引擎就能将那些不需要等待数据的指令先送到执行单元执行,从而提高执行单元的效率。NetBurst微结构具有提供126个指令之多的超大指令窗口,相比之下P6级的CPU只具有42个指令窗口。同时,高级动态执行引擎具有增强的分支预测功能,具有4K的分支目标缓存,这是使得NetBurst微核心能够最大可能的避免分支预测失败的关键设计。其直接的性是能比P6级CPU减少约33%的分支预测失败。

  提高IPC的另一个途径是直接减小单个指令的执行周期。这部分功能是由NetBurst微核心的快速执行引擎实现。INTEL发明了一种时钟缓冲器(clock buffering)电路,使得NetBurst的ALU(Arithmetic Logic Units,算术逻辑单元)能够在CPU主频的2倍速度下工作,从而使ALU在执行某些指令的时候只需要原本所需时间的一半!一颗1GHz的PIII CPU,其算术逻辑单元执行一次加法指令需要一个纳秒,但P4执行一次加法指令只需要小于0.35纳秒的时间。这种技术被一些专家称作是“骇人听闻”,也就是说,一颗主频工作在1.4GHz的Pentium4 CPU,它的核心计算部分其实是工作在2.8GHz的!如此高的执行速度,需要更快速的L1缓存与之相配合,NetBurst微内核采用了比PIII更高速的8K容量的L1缓存,使得数据和指令进出L1缓存的速度几乎提高了一倍:



  下 一 页

相关报道
Pentium 4 评测报告(1) (2000-11-20 15:41:06)
Pentium 4 评测报告(2) (2000-11-20 15:40:07)
Pentium 4 评测报告(3) (2000-11-20 15:35:07)
Pentium 4 评测报告(4) (2000-11-20 15:31:44)
Pentium 4 评测报告(5) (2000-11-20 15:45:02)




本站检索


中华网推荐

·国家级治脑病新药思维源
·中藏药治疗脑病新突破
·治类风湿,强直性脊柱炎
·养肾·痛风·长寿
·肝病泌尿脑萎缩新药介绍
·强直性脊柱炎康复乐园
·让中医辩证不孕不育
·国医治股骨头坏死一绝
·乙肝为何久治不愈?
·二千元垄断批发做老板
·中医中药专治前列腺
·治牛皮癣白癜风已成现实
·专治痛风病的白衣天使
·不孕不育的杏林奇葩
·专卖店零售管理系统




   

科技主编信箱