CPU主要有哪些类型?
K6:K6 CPU的设计指数相当高,MMX技术,片内一级缓存更多(32K指令和32K数据),流水线更深,可以并行处理更多指令,运行时钟频率更高。AMD在整数运算上无疑是非常成功的。由于K6拥有更大的L1缓存,随着频率的增加,它可以实现比奔腾MMX更显著的性能提升。K6在运行需要使用MMX或FP(浮点指令)的应用时略显落后。与同频率的奔腾MMX相比,即使是没有MMX的奔腾也差很多,这使得K6在一些3D游戏中的表现远不如英特尔。此外,AMD的MMX单元一次只能处理一条指令,而英特尔的MMX单元可以处理两条指令。因此,K6在执行MMX指令和浮点指令时性能很差。
AMD的K6在处理一些MMX运算时,处理周期比Intel的CPU短,但是单次运算的吞吐量是一样的,更短的处理周期并不能弥补K6不能同时处理两条MMX指令的不足。虽然英特尔的MMX CPU可以同时处理两条MMX指令,但其MMX单元只包含一个乘法单元和一个移位单元,因此无法同时执行这些关键操作。同时,只有一个MMX指令运算存储器和整数寄存器才能在浮点处理中发挥作用,所以K6在某些运算上的处理周期还是比Intel短,但是每两个时钟周期只能启动一个运算,Intel芯片每一个周期都可以启动一个。最终的结果是,对于很多浮点运算,AMD芯片的吞吐量只能达到Intel芯片的一半。
K6系列CPU I * * *有五个频率,分别是:166 MHz/200 MHz/233 MHz/266 MHz/300 MHz。五款机型均采用66mhz外接频率,但后期的233mhz/266mhz/300mhz通过升级主板的BIOS可以支持100 MHz外接频率。倍频方面,K6系列从2.5到4.5,核心电压分别为2.9V、3.2V、2.2V,特别值得一提的是他们的一级缓存提高到了64KB,是MMX的两倍,这也是K6的整数性能优于MMX的原因。
1998年中期,AMD最新的K6-2处理器正式上市。这是第一个采用3Dnow的!基于微软Windows操作系统兼容的X86微处理器技术。它采用了全新的硅晶体制造技术(C4倒装芯片),这是由IBM开发的。它将硅晶体的精度提高到0.25微米,并将K6的原始管芯尺寸从168mm2减小到68mm2。同时晶体数量增加了50万(达到930万),其他结构基本和K6一样,L65,438+0。此外,它的工作电压从2.9V/3.2V降至2.2V..AMD在推出K6-2 CPU的时候率先加入了3Dnow!浮点/3D加速技术,64位双通道浮点缓冲区,21全新3Dnow!指令集,添加SIMD(单指令,多数据)。还有AMD的3Dnow!技术,随着K6-2的推出,立刻获得了游戏厂商、软件厂商、显卡驱动的支持,成为重要的工业标准。
K6-3处理器使用0.25微米线程,由2130万个晶体管组成。K6-3处理器采用三层结构设计。K6-3处理器核心有64K一级缓存(1级)和256K二级缓存(2级),主板配有三级缓存(3级)。K6-3处理器的一层和二层缓存一共***320K,都内置在处理器芯片的核心,和处理器的时钟频率相同,这个缓存的执行速度和处理器是全速的。K6-3的三级结构设计可以支持主板上的1024K三级缓存。在Super 7结构的主板上,三级缓存的时钟频率为100MHz。相比奔腾II只有32K一级缓存和512K半速二级缓存,AMD的三级缓存结构可以增加系统的缓存容量,提高系统的整体性能。
K6-3处理器现在支持3D了!指令集3D现在!该指令集类似于英特尔的KNI(Katmai New Instruction)指令集,使用增加指令的方法来加速多媒体处理,如3D绘图和需要大量浮点运算的应用程序。
由于成本和良率的问题,K6-3处理器在台式机市场并不是很成功,所以会逐渐从台式机市场消失,会逐渐进入笔记本市场。AMD将推出专门用于笔记本电脑的K6-3+处理器版本。K6-3+采用0.18微米线程,芯片内置二级缓存。此外,笔记本K6-3+将具有自动升降压的双模功能(AMD代号为Gemini),类似于英特尔接下来将推出的笔记本处理器。使用室内交流电源时,K6-3+处理器时钟频率高;如果使用电池供电,K6-3+处理器会自动降速以延长电池寿命。
真正让AMD骄傲的是最初代号为K7的速龙处理器。Athlon有一个超标量Risc内核,具有超标量、超级流水线和多流水线。采用0.25μ m工艺,集成2200万晶体管,芯片面积184 mm,目前已经推出了更先进的0.18μ m做工的速龙。下一步是采用铜线技术。AMD在制造技术上从未落后于英特尔。(athlon.jpg摄)
Athlon包括三个解码器、三个整数执行单元(IEU)、三个地址生成单元(AGU)和三个多媒体单元(浮点运算单元)。Athlon可以在同一个时钟周期执行三条浮点指令,每个浮点单元就是一个完整的流水线。K7包括三个解码器,将解码后的宏操作指令(K7将X86指令解码为宏操作指令,并将不同长度的X86指令转换为相同长度的宏操作指令,可以充分发挥RISC内核的威力)送到指令控制单元,指令控制单元可以同时控制(保存)72条指令。然后将指令发送到整数单元或多媒体单元。整数单元可以同时调度18条指令。每个整数单元是一个独立的流水线,调度单元可以预测指令的分支,并无序执行。K7的多媒体单元(也称为浮点单元)有一个可以重命名的堆栈寄存器。浮点调度单元可以同时调度36条指令,浮点寄存器可以存储88条指令。在三个浮点单元中,有一个加法器和一个乘法器,这两个单元可以执行MMX指令和3DNow指令。还有一个浮点单元负责加载和保存数据。由于K7强大的浮点单元,AMD处理器第一次在浮点方面超过了英特尔处理器。
速龙内置128KB全速缓存(L1缓存),外置1/2频率、512KB容量的L2缓存,最高可支持8MB L2缓存。大型缓存可以进一步提高服务器系统所需的巨大数据吞吐量。
速龙的封装和外观与奔腾II的SECC卡带相似,但速龙采用的是Slot A接口规范。Slot A接口源于Alpha EV6Bus,时钟频率高达200MHz,使得峰值带宽达到1.6gb/s,在内存总线上仍然兼容传统的100MHz总线,目前的PC-100 SDRAM仍然可以使用,保护了用户的投资,降低了成本。未来还可以使用性能更高的DDRSDRAM,类似于Intel推的800MHz RAMBUS的数据吞吐量。EV6总线最高可支持400MHz,可以完美支持多处理器。都有天然的优势。要知道Slot1只支持双处理器,SlotA可以支持4处理器。SlotA看起来和传统242pin的Slot1很像,就像Slot1反过来是180度,但是它们在电气规范和总线协议上完全不兼容。插槽1/Socket 370的CPU无法安装在插槽A插槽的速龙主板上,反之亦然。
AMD为了进一步拓展3Dnow!软件平台的支持范围,同时关闭原3Dnow!与SSE相比,Athlon处理器提供了增强的3Dnow!技术,增加了24条新指令。其中,19控制指令完全兼容英特尔针对现有64位MMX缓冲区在奔腾III的SSE指令中增加的视频操作和快速内存预读指令。因此,为奔腾III的SSE指令集开发的软件,只需稍加修改,就可以成功转移到速龙上,发挥强大的MMX缓冲的SIMD加速性能。另一方面,Athlon增加了五条新指令,可以使CPU像DSP芯片一样直接处理模拟/数字信号的转换。它可用于软调制解调器、ADSL网络转换和传输以及杜比AC-3解码。到目前为止,英特尔的CPU还没有提供类似功能的指令。显然,在新一代处理器指令集的开发上,AMD再次发挥了创新精神。
说了这么多,Athlon处理器的实际性能如何?对比同样是600MHz的速龙和600 MHz的奔腾III(至强目前只达到550MHz),速龙(CPUMark99,WinStone99)的整数性能比同频率的奔腾III快10%左右。对于Athlon来说,浮点性能更令人印象深刻。虽然WinBench99的FPUmark测试值只快了8%左右,但是跨平台的工业评测标准SPECfp_base95的测试结果却快了38%左右。3D性能方面,3D WinBench的软件如3D Winmark、3DMark 99 Max都领先36 ~ 38%。运行3D Studio Max R3.0时,速龙平台的渲染速度比奔腾ⅲⅲ快33%左右。因为奔腾ⅲ和奔腾ⅲ至强的区别在于L2缓存(至强是全速L2缓存)的容量和速度,如果我们对比只有512KB L2缓存的入门级至强处理器,在运行大部分软件时,至强只有整数性能比奔腾ⅲ快,浮点性能完全一样。所以,在速龙vs奔腾ⅲ&;L2缓存设计的至强Athlon以1/2频率的实测结果,在任何软件性能上都全速击败了L2缓存设计的至强处理器。
最近AMD推出了Athlon带800MHz速龙800MHz处理器仍然是SlotA结构,但所有新的速龙处理器都是K75核心。800MHz速龙处理器采用了0.18微米铝工艺,晶圆面积为102平方厘米。与采用0.25微米线程制造的旧Athlon处理器相比,800MHz处理器的发热量更低。
根据AMD公布的速龙处理器和奔腾ⅲ处理器的性能测试数据,在Business Winstone 99(Windows NT 4.0)中,速龙800MHz的测试值为42.5,速龙750MHz为465,438+0.4,奔腾733MHz为465,438+0.3。在WinBench 99CPUmark 99中,速龙800MHz的测试值为71.9,速龙750MHz为67.9,奔腾III 733 MHz为65.8;在WinBench 99 FPU WinMark部分,速龙800MHz的测试值为4370,速龙750MHz为4103.3,奔腾III 733 MHz为3890。
所以AMD把速龙处理器定位在至强级别,价格定位在至强和奔腾ⅲⅲ之间,希望进入商业、高端工作站和服务器的市场,这应该是一个非常有竞争力的市场策略。
奔腾:就是著名的“奔腾”处理器。是Intel在1993推出的新一代高性能处理器。它的内部代号是P54C。奔腾包含多达365,438+百万个晶体管,内置16K一级缓存。时钟频率最初是60MHz和66MHz,最后达到200MHz。由于奔腾出色的制造工艺,超频非常好,就是它的时钟频率可以提高1~2,使得超频逐渐普及。同时,其浮点性能一举超越竞争对手Cyrix和AMD。从此,英特尔保住了浮点的桂冠,直到AMD推出Athlon芯片。由于以上原因,奔腾拿下了586级CPU的大部分市场份额。从奔腾75开始,CPU的socket技术正式从之前的Socket4转变为同时支持Socket5和Socket7,其中Socket7沿用至今,AMD后来发展为Super7,这就是后话了。
奔腾Pro:1996年英特尔推出的第6代X86 CPU。Pentimu Pro包含多达550万个晶体管,奔腾Pro的一级(片内)缓存是8KB指令和8KB数据。值得注意的是,Pentimu Pro的一个封装除了奔腾Pro芯片之外,还包括一个256KB的二级缓存芯片,运行频率与处理器相同。两个芯片通过高带宽内部通信总线互连,与系统总线无关。Pentimu Pro最引人注目的是它拥有一项名为“动态执行”的创新技术,这是奔腾突破超标量架构后的又一次飞跃。Pentimu Pro主要用于服务器。
奔腾MMX:1996年底推出了奔腾系列的改进版,内部代号P55C,也就是我们通常所说的奔腾MMX。MMX技术是英特尔新发明的多媒体增强指令集技术,英文全称可翻译为“多媒体扩展指令集”。奔腾MMX可以说是1999年初之前电脑市场占有率最高的CPU产品。奔腾MMX系列只有三个频率:166MHz/200MHz/233MHz。一级缓存由奔腾的16KB提升至32KB,核心电压2.8v,倍频分别为2.5、3、3.5。插槽都是Socket 7。
pnt iumⅱ:1997 5月,英特尔推出了与奔腾Pro同级别的产品奔腾ⅱ。奔腾CPU有很多分支和系列产品,其中第一代产品是芯片代号Klamath。它运行在66MHz总线上,有四个主频:233MHz、266MHz、300MHz和333MHz。PentiumII采用了与Pentium Pro相同的32位内核结构,加速了段寄存器的写操作,增加了MMX指令集。英特尔采用CMOS技术,将750万个晶体管集成到203平方毫米的硅片上。总线方面,奔腾ⅱII处理器采用双独立总线结构,即后端总线技术。一条总线连接到L2高速缓存,另一条总线连接到内存。为了降低成本,奔腾ⅱII采用了片外的外部缓存,运行速度可以达到CPU自带时钟的一半。在接口技术方面,为了打败竞争对手,获得更大的内部总线带宽,奔腾ⅱ第一次采用了专利的Slot1接口标准。它没有采用陶瓷封装,而是在印刷电路板上制作了CPU和二级缓存。封装就是所谓的SEC(单边接触盒式)卡盒。奔腾CPU有一个32KB的片内L1高速缓存(16K指令/16K数据)。57 MMX指令;八个64位MMX寄存器。L2缓存是片外同步突发SRAM缓存,512K四路级联。
赛扬:赛扬是英特尔为奔腾II提出的廉价版本。其核心技术与PentiumII相同。这是占领低价个人电脑市场的一次尝试。可以说是英特尔为了抢占低端市场而特别推出的。当然,英特尔也不愿意被AMD和Cyrix抢走低端市场的肥肉。赛扬处理器就像没有L2缓存的奔腾ⅱII。赛扬最初采用0.35微米工艺制造,外部频率为66MHz,包括266MHz和300MHz。然后来了333MHz,从此采用0.25微米的制造工艺。原来的赛扬犯了一个错误,就是去掉了赛扬的二级缓存。所以它的表现并不理想,成了玩家手中的鸡肋。唯一的好处就是非常抗超频。随后,英特尔纠正了这一错误,在赛扬中集成了128KB全速缓存,并且全部采用0.25微米制造工艺。为了区别于最初的赛扬300,它把300MHz集成了128KB缓存的赛扬300A称为赛扬300 a,后来推出的所有赛扬都内置了128KB二级缓存。
为了进一步降低成本,英特尔又回到了废弃的插座结构,因为赛扬的二级缓存是内置的,也就是没有外置的后端总线,所以把赛扬安装在一块PCB上纯粹是多余的。于是英特尔把赛扬做成插座结构,但不再是Socket7而是全新的Socket370。370意味着它有370个管脚,比Socket7 CPU的321管脚多49个,所以两个插座不兼容。为了让原Slot1的用户能够使用Socket370结构的CPU,出现了Socket370到Slot1的转换卡。Socket370结构的赛扬,除了接口以外,内核都是一样的。赛扬不支持英特尔最新的SSE指令集,但其结构优于奔腾III。赛扬的L2缓存只有奔腾II和奔腾III的四分之一,但速度与处理器相同。这样一来,赛扬的处理器在运行一般计算负载的应用时,比同级别的奔腾II略差。赛扬和奔腾II/III的另一个区别是总线速度:赛扬的总线速度目前还是66MHz,总线速度为100MHz的赛扬会在后面出现。
Xeon: Xeon处理器,主要用于高端NT服务器,说明Intel对服务器CPU市场的高额利润垂涎已久,希望从中分一杯羹。至强系列处理器拥有x86时代从未有过的强大功能。它与前几代英特尔微处理器结构兼容;PentiumII处理器在P6微结构中采用双独立总线结构和动态指令执行技术。至强处理器内置512KB甚至2MB字节的L2缓存,运行的总线速度与CPU相同。我们看到至强的SEC box是PII的两倍高,因为它有一个内置的全速L2缓存。至强最多支持8个处理器,接口不再是Slot1,而是Slot2接口。支持至强的芯片组是英特尔的440GX。
Intel Pentium III:Pentium III的时钟速度从Pentium II的顶级450MHz跃升,但这并不是Intel这款最新处理器被看重的原因。之所以引起人们的关注,是因为它在多媒体性能上的增强,可以加快需要密集处理和运行的程序。PentiumIII增加了70个其他处理器没有的指令集:SSE新指令——专为提高3D图形性能、3D音效和语音识别而设计。此外,奔腾III兼容MMX指令、SSE指令和同步浮点运算,因此为游戏制造商和其他程序开发者提供了更多更新的多媒体应用。
最新的奔腾ⅲ处理器是一款代号为Coppermine的CPU,采用0.18微米工艺,包括Slot 1(图片copperpic.jpg)和new FC-PGA(图片fcpga1.jpg)两个型号,外部频率分别为100MHz和133MHz。为了有效降低处理器成本,英特尔在改用0.18微米工艺后,可以将L2缓存集成到芯片中,其L2缓存容量将提升至256K;类似内置128K的赛扬,可以采用插座结构。铜矿可以封装在插座槽FC-PGA(倒装芯片-PGA)中,以降低制造成本。根据英特尔的产品规划时间表,2000年3月,所有奔腾III处理器将转换为FC-PGA封装,即奔腾III处理器将采用与赛扬处理器相同的Socket 370架构,现有的插槽为1架构的奔腾III处理器将成为历史。在Pentium III处理器从Slot 1架构过渡到Socket 370架构的过程中,Intel仍然会供应Slot 1架构的新Pentium III处理器,而Slot 1架构的新Pentium III处理器的处理器电路板上已经消失了二层缓存,全部集成到Coppermine core中。