cpu的发展历史
随后,Intel开发了8080处理器和8085处理器,与摩托罗拉的MC6800微处理器和Zilog的Z80微处理器一起,它们形成了八位微处理器家族。
16位微处理器的典型产品是Intel的8086微处理器,同时产生的数学协处理器,即8087。这两种芯片使用兼容的指令集,但在8087指令集中加入了一些专门用于对数、指数、三角函数等数学计算的指令。因为这些指令应用于8086和8087,所以统称为X86指令集。自此,英特尔推出的新一代CPU产品全部兼容原有的X86指令。
1979年,Intel推出了8088芯片,仍然是16位微处理器,包含29000个晶体管,时钟频率4.77MHz,地址总线20位,可以使用1MB内存。8088内部数据总线为16位,外部数据总线为8位。1981年,8088芯片首次用于IBM PC。如果说8080处理器不太为人熟知,那么8088可以说是家喻户晓,个人电脑的第一代CPU——PC就是从它开始的。1982的80286芯片虽然是16位芯片,但已经包含了13.4千个晶体管,时钟频率达到了前所未有的20MHz。其内部和外部数据总线是16位,其地址总线是24位。可使用16MB内存,可用的工作模式有实模式和保护模式。
32位微处理器的代表产品是1985年Intel公司推出的80386,这是一款全32位微处理器芯片,也是X86家族中的第一款32位芯片。它包含275000个晶体管,时钟频率为12.5MHz,之后逐渐提高到33MHz。80386的内外数据总线都是32位,地址总线也是32位,可以寻址4GB内存。除了实模式和保护模式之外,它还增加了一个虚拟86工作模式,可以通过同时模拟多个8086处理器来提供多任务能力。1989年,Intel推出准32位处理器芯片80386SX。其内部数据总线为32位,与80386相同,外部数据总线为16位。也就是说80386SX的内部处理速度接近80386,而且还支持真正的多任务操作,可以接受为80286开发输入/输出接口芯片。80386SX的性能比80286好,价格只有80386的三分之一。386处理器没有内置协处理器,所以不能执行浮点运算指令。如果需要进行浮点运算,就必须购买价格昂贵的80387协处理器芯片。
80年代末90年代初,80486处理器问世,集成了1.2万个晶体管,时钟频率从25MHz逐渐提高到50MHz。80486将80386、数学协处理器80387和一个8KB缓存集成在一个芯片中,并且在X86系列中首次使用RISC(精简指令集)技术,可以在一个时钟周期内执行一条指令。它还采用了突发总线模式,大大提高了与内存的数据交换速度。由于这些改进,80486的性能比带有80387协处理器的80386高4倍。早期的486分为带协处理器的486DX和不带协处理器的486SX两种,它们的价格也相差很大。随着芯片技术的不断发展,CPU的主频越来越快,而PC的外部设备受到技术的限制,阻碍了CPU主频的进一步提升。在这种情况下,出现了CPU倍频技术,使得CPU内部工作频率是处理器外部频率的2-3倍,因此得名486DX2和486DX4。
90年代中期,新一代586处理器问世,全面超越486处理器。为了摆脱486时代处理器名称的混乱,最大的CPU制造商英特尔公司将其新一代产品命名为奔腾,以区别AMD和Cyrix产品。AMD和Cyrix也推出了K5和6x86处理器来对付英特尔,但由于奔腾处理器性能最好,英特尔逐渐占据了大部分市场。
从此不用我说大家都很了解CPU的发展了。1997年初,奔腾MMX上市,奔腾II和AMD K6年中上市,Cyrix6x8MX年底上市。1998年更是“三足鼎立”,PII、赛扬、K6-2、MII互相厮杀。从奔腾二代推出开始,英特尔就放弃了老化的Socket 7市场,力推先进的Slot 1架构,但这次英特尔犯了一个错误。随着全球对1000美元以下低价PC的需求不断增加,AMD的K6-2处理器填补了这一低端领域的空白。原本只在1槽位上实现的AGP总线技术和100MHz外频,在AMD开创的速7时代也实现了。虽然K6-2和Super 7的性能仍然远远落后于同频率的PII,但低廉的价格仍然让AMD攫取了近30%的CPU零售市场份额。AMD以一种不畏强敌的姿态赢得了众多消费者的青睐。
可惜的是,1999年,面对英特尔的猛烈反击,AMD开始走下坡路,市场销量非常糟糕。Cyrix在这场处理器大战中落败。它本想依靠NS(美国国家半导体公司)东山再起,但为时已晚,最终在6月被芯片组厂商威盛收购。
随后,IDT和瑞思这两家新进入处理器市场的公司,在技术创新和市场定位上各有特色。IDT的Winchip C6和Winchip C6-2主要针对低端家用市场,而Rise的处理器主要进入移动电脑领域。可惜,在英特尔产品的压力下,他们的生活也很坚定。1999年年中,就在Cyrix被收购一个月后,威盛收购了IDT公司,与此同时,Rise也被另一家芯片组厂商SIS(硅系统技术)收购。随后有消息称,Rise退出了PC处理器市场,专注于家电处理芯片市场。这样,经过重新调整,PC处理器市场呈现出新的三足鼎立之势。AMD凭借8月份发布的Athlon-K7打了一个漂亮的翻身仗,K7有史以来第一次成为整体性能超越英特尔同类产品的最快处理器,市场份额有进一步扩大的趋势。收购Cyrix和IDT后,威盛整合了两家公司的最新技术,计划在2000年初推出兼容Socket370的Joshua-Joshua处理器,主攻低端市场。总之,随着竞争的激烈,各公司都在竭尽全力为消费者开发最新、最快、最好的处理器产品。
世纪末的辉煌——奔腾III
1999年初,英特尔发布了第三代奔腾III处理器。第一批奔腾III处理器采用了Katmai内核,主频450 MHz和500Mhz。这个内核最大的特点是更新了名为SSE的多媒体指令集,它在MMX的基础上增加了70条新指令,以增强三维和浮点应用,并兼容以前所有的MMX程序。
不过平心而论,除了上面提到的SSE指令集,Katmai内核的Pentium III也没什么吸引人的地方。它仍然基本保留了奔腾II的架构,采用0.25微米工艺,100Mhz外频,Slot1架构,512KB二级缓存(运行速度是CPU的一半),所以性能提升不大。然而奔腾III刚上市的时候,就掀起了一股热潮。曾经有人以一万多元的高价买了第一批奔腾三。
第一代奔腾III处理器(Katmai)
可以大幅提升,从500Mhz提升到1.13Ghz,超频性能大幅提升,幅度可以达到50%以上。此外,其二级缓存也与CPU主频同步,但容量降为256KB。
第二代奔腾III处理器(铜矿)
除了制造工艺带来的提升,部分Coppermine Pentium III还有133Mhz的总线频率和Socket370。为了区分它们,Intel在133Mhz总线的奔腾III型号后面加了一个“B”,在Socket370插座后面加了一个“E”,比如频率为550EBMhz,外部频率为133Mhz。
看到采用Coppermine内核的奔腾III大受欢迎,英特尔开始将赛扬处理器换成这种内核。2000年年中,推出了Coppermine128内核的赛扬处理器,俗称Celeron2。由于切换到0.18工艺,赛扬的超频性能又有了一个飞跃,超频范围可以达到1000。
第二代赛扬(Coppermine128核)处理器
AMD的绝地反击——速龙
至于AMD,当初为了对抗奔腾III,推出了K6-3处理器。K6-3处理器为三级结构设计,内置64K一级缓存(Level 1)和256K二级缓存(Level 2),主板上配置三级缓存(Level 3)。K6-3处理器现在也支持增强的3D!指令集由于成本和良率的问题,K6-3处理器在台式机市场并不是很成功,所以逐渐从台式机市场消失,进入笔记本市场。
真正让AMD骄傲的是最初代号为K7的速龙处理器。Athlon有一个超标量Risc内核,具有超标量、超级流水线和多流水线。它采用0.25微米工艺,集成了2200万个晶体管。Athlon包括三个解码器、三个整数执行单元(IEU)、三个地址生成单元(AGU)和三个多媒体单元(浮点运算单元)。Athlon可以在同一时钟周期执行三个晶体管。K7包括三个解码器,将解码后的宏操作指令(K7将X86指令解码为宏操作指令,并将不同长度的X86指令转换为相同长度的宏操作指令,可以充分发挥RISC内核的威力)送到指令控制单元,指令控制单元可以同时控制(保存)72条指令。然后将指令发送到整数单元或多媒体单元。整数单元可以同时调度18条指令。每个整数单元是一个独立的流水线,调度单元可以预测指令的分支,并无序执行。K7的多媒体单元(也称为浮点单元)有一个可以重命名的堆栈寄存器。浮点调度单元可以同时调度36条指令,浮点寄存器可以存储88条指令。在三个浮点单元中,有一个加法器和一个乘法器,这两个单元可以执行MMX指令和3DNow指令。还有一个浮点单元负责加载和保存数据。由于K7强大的浮点单元,AMD处理器第一次超过了当时的英特尔处理器。
速龙内置128KB全速缓存(L1缓存),外置1/2频率、512KB容量的L2缓存,最高可支持8MB L2缓存。大型缓存可以进一步提高服务器系统所需的巨大数据吞吐量。
速龙的封装和外观与奔腾II相似,但速龙采用的是Slot A接口规范。Slot A接口源于Alpha EV6总线,时钟频率高达200MHz,使得峰值带宽达到1.6GB/S,在内存总线上仍然兼容传统的100MHz总线,保护了用户的投资,降低了成本。后来采用了性能更高的DDR SDRAM,和Intel推的800MHz RAMBUS的数据吞吐量差不多。EV6总线最高可支持400MHz,可以完美支持多处理器。所以有天然的优势。要知道Slot1只支持双处理器,SlotA可以支持4处理器。SlotA看起来和传统的Slot1很像,就像Slot1反过来是180度,但是它们在电气规范和总线协议上完全不兼容。插槽1/Socket 370的CPU无法安装在插槽A插槽的速龙主板上,反之亦然。
三、新世纪的CPU
进入新世纪以来,CPU进入了更快发展的时代,之前高不可攀的1Ghz大关被轻松打破。在市场分布上,Intel和AMD依然争霸,分别推出了Pentium4、Tualatin Pentium II和Celeron、Tunderbird Athlon、AthlonXP和Duron,竞争日趋激烈。
1.至于英特尔,上个世纪末,2000年6月,11,英特尔发布了自己的第四代奔腾处理器,也就是我们每天都能接触到的奔腾4。奔腾4没有沿用PIII架构,而是采用了全新的设计,包括等效400MHz前端总线(100 x 4)、SSE2指令集、256K-512KB二级缓存、全新的流水线技术和NetBurst架构,起始频率为1.3GHz
第一个Pentium4内核是Willamette,具有全新的Socket 423,集成了256KB L2缓存,支持更强大的SSE2指令集,多达20个超标量流水线,并与i850/i845芯片组相匹配。随后,英特尔陆续推出了1.4GHz-2.0GHz的威拉米特P4处理器,后期的P4处理器都换成了管脚更多的Socket 478插座。
第一代奔腾4(Socket423)处理器
和奔腾III一样,第一个奔腾4核心并没有得到太多好评,主要是因为新的CPU架构无法得到程序软件的完全支持,所以奔腾4往往远远落后于同频率的Athlon,甚至像英特尔自己的奔腾III。然而,一年后,英特尔发布了第二个Pentium4内核,代号为Northwood,改为更精细的0.13微米工艺,集成了更大的512KB L2缓存,性能大幅提升。再加上英特尔孜孜不倦的推广和主板芯片厂商的支持,奔腾4已经成为最受欢迎的中高端处理器。
第二代奔腾4(Socket478)处理器
在低端CPU上,英特尔发布了代号为Tualatin的第三代赛扬核心,也改为0.13微米工艺。同时二级缓存容量提升到256KB,外接频率也提升到100Mhz。目前图拉丁赛扬的主频是1.0和1.655。英特尔也推出了采用Tualatin core的奔腾III,集成了更大的512KB L2缓存,但它们只用于服务器和笔记本电脑市场,在台式机市场很少见到。
采用第三代Tualatin内核的赛扬处理器
2.在AMD,第二个Athlon核心Tunderbird于2000年中期发布。这款核心的Athlon有以下改进:一是制造工艺改进到0.18微米,二是安装接口改为Socket,类似Socket370,但引脚数为462。最后二级缓存改为256KB,但速度与CPU同步,与带铜矿核的奔腾III相同。
采用Tunderbird内核的Athlon不仅在性能上略领先于奔腾III,而且最高频率始终高于奔腾III。1Ghz主频的里程碑就是由这款CPU率先实现的。然而,随着Pentium4的发布,Tunderbird在频率上开始落后于竞争对手。为此AMD发布了第三个Athlon核心Palomino,并采用了新的频率命名系统。从此,Athlon机型上的数字并不代表实际频率,而是按照一个公式换算成相当于竞争对手(也就是Intel)产品性能的频率,名字也就改成了AthlonXP。比如AthlonXP1500+处理器的实际频率不是1.5Ghz,而是1.33GHz,最后,AthlonXP还兼容Intel的SSE指令集,在专门针对SSE指令集优化的软件中也能充分发挥性能。
采用第三代Tunderbird内核的Athlon处理器
在低端CPU上,AMD推出了Duron CPU,除了二级缓存只有64KB之外,基本架构和Athlon一样。自发布以来,毒龙一直远离同样主打低端市场的赛扬,价格更低。毒龙一时间成为低价DIY兼容机的首选,但毒龙也有其致命弱点。一是继承了速龙发热量大的特点,二是其核心非常脆弱,安装CPU散热器时容易损坏。所以虽然在兼容机市场很受欢迎,却始终无法进入最赚钱的品牌机市场。
毒龙处理器
四、CPU的未来发展方向
纵观上述CPU发展史,不难得出CPU的以下发展方向:一是更高的主频,二是更小的制造工艺,三是更大的缓存。除了这三点,PC处理器也会慢慢从32位数据带宽发展到64位数据带宽。
1,英特尔的未来规划,在本书截稿前,最高频率的CPU已经达到2.4Ghz,英特尔的目标是今年达到3Ghz,两年后达到10Ghz。为此,英特尔将在2002年中期发布总线频率为533Mhz的Northwood内核。根据计划,2003年,英特尔还将推出一款0.09微米工艺的Prescott core,它将工作在3.5GHz(甚至更高)以上的频率,并将使用更高效的667MHz(166MHz x 4)或800MHz FSB(200MHz x 4),但目前Prescott还只是书面形式。毕竟2003年才正式发布,所以目前没有更多关于它的信息。
此外,英特尔还透露,2005年将推出太赫兹晶体管架构的处理器新产品,采用了SOI技术、高k绝缘体等多项先进技术。简单来说就是可以最大限度的降低芯片的发热和功耗,大幅提高处理器的工作频率。理论上,利用太赫兹晶体管架构可以制造出10GHz-20GHz的加工产品。
当然,要达到这么高的工作频率,只有太赫兹晶体管是不够的。还需要新型BBUL(无凸点积层)封装技术的支持,可以制造出厚度仅为1mm,集成1亿个晶体管的芯片。BBUL技术和现在的封装技术没什么区别,但是核心技术完全不同。BBUL采用内置方式,直接在裸片(Die)上。由于BBUL缩短了数据传输通道,整个芯片的时钟频率速度会大大提高,功耗自然更低。
2)AMD的未来规划。这本书上市的时候,第三个速龙核心《纯种马》应该已经发布了。纯种马沿用了帕洛米诺的核心,但改用了更高效的166MHz FSB和0.13微米工艺。由于制造工艺的改进,它的发热量和芯片尺寸都比Palomino的小很多,而且还采用了Socket A接口和OPGA封装,现有的Athlon XP主板都兼容纯种马(AMD在展会上公布的纯种马演示机使用的是AMD-760芯片组);不过,还没有宣布纯种马是否会增加缓存容量。
AthlonXP在彻底的核心
新一代的毒龙(Appaloosa)采用的是简化的纯种核心。根据AMD最新的处理器发展蓝图,第一款纯种马core 1.73GHz Athlon XP处理器预计将于明年第一季度发布。桌面版Athlon XP和工作站/服务器版Athlon MP都将在明年第一季度全面导入0.13微米纯种马核心,第二季度将推出采用巴顿核心的产品,但AMD并未公布巴顿核心的具体规格。至于移动处理器,最后一个基于Palomino核心的会是明年发布的1.4GHz Athlon 4,之后会采用全新的纯种马/巴顿核心。
至于AMD的首款64位处理器K8锤子,将分为两个不同的版本,分别是SledgeHammer的高端服务器版(最高8 SMP)和ClawHammer的工作站/桌面版(2 SMP),其中ClawHammer已经集成了DDR33内存控制器。所以ClawHammer对应的芯片组不需要包含内存控制器,而SledgeHammer拥有更大的二级缓存。两款锤子处理器都将支持SSE2指令集,兼容32位指令。虽然目前还没有更多的信息发布,但可以确定的是锤子将会在明年发布,而AMD此前也曾宣称锤子的性能将会超越所有同类处理器。