辉煌10年——从K6到K8

魔之左手 白狼 《电脑爱好者》2017年第16期 2018-01-18 15:23专题 标签:Ryzen

● 初阵——K6系列

1997年推出的K6处理器对如日中天的Intel Pentium系列来说,还没有形成很大的威胁,但对AMD来说却意义非凡,作为第一款自行设计,同时能够与Intel高端处理器并驾齐驱的AMD处理器,K6标志着AMD第一次拥有了正面对抗Intel资本。从K6到现在的Ryzen,20年间,AMD与Intel的恩怨情仇,一直左右着处理器市场。

K6处理器的技术来源有两个,分别来自AMD首款自行设计处理器K5和收购的半导体设计公司NexGen。AMD在1994年的微处理器技术论坛年会上展示出了自研发的K5处理器(图5),并宣称性能高于奔腾30%。不过1995年K5正式推出时,Pentium架构已经比较成熟,频率达到了100MHz以上,同时K5的性能也并没有其宣传的那么出色,只能以较高的性价比,与Pentium中低端型号竞争。K5采用和75MHz以上Pentium处理器一样的Socket 7接口,但架构已经有所不同,因此引入了PR值标称,但因为并没有表现出明显高于同频Pentium的能力,所以PR值与实际频率没有太大差别。

05

05-1

1995年,AMD收购了NexGen公司,以K5为基础,结合NexGen的第六代处理器技术(Nx686),在1997年推出了K6处理器(图6)。这款处理器仍然采用了兼容Intel Socket 7平台的策略,可安装在Intel芯片组或ALI、VIA、SIS等厂商芯片组主板上,但在技术、规格、工艺等方面都有了自己的鲜明特色,并且有着可以与最新Pentium处理器抗衡的性能。

06

K6采用32KB数据L1缓存和32KB指令L1缓存,均达到了Intel Pentium MMX(多能奔腾)的两倍,可以同时处理更多指令,并且可以支持最新的MMX指令。K6的频率也可以紧追最高端Pentium MMX,迅速达到了200MHz以上。在具体性能表现上,K6的整数性能已经与同频Pentium MMX类似,只是在浮点性能和MMX指令集效率上略逊一筹,因此这款处理器在办公等应用中表现出色,但在图形图像处理、3D游戏等应用中的表现要差一些。

英特尔MMX(MultiMedia Extensions,多媒体扩展)指令集的成功,以及自身相对落后的浮点性能决定了AMD对K6的改进方向,最终产品就是加入了3D扩展指令集——3D Now!,以加强3D处理,特别是3D游戏能力的K6-2处理器(图07)。K6-2处理器在1998年上市,主要架构并没有大的变化,内部主要是加入了3D Now!指令集并使用更新的制造工艺,在外部则采用266/300MHz起跳的高频率,并可支持100MHz外频,相应芯片组和接口平台又被称为“Super 7”。K6-2在市场上获得了相当不错的成绩,除了自身性能的进一步提升和用户对AMD的逐渐认可之外,Intel新一代处理器Pentuim Ⅱ的不佳表现,也从另一个方面推动了K6-2的销售。除了市场上的成功之外,笔者认为K6-2对未来AMD处理器的影响力也超过了K6处理器。在K6-2处理器上,AMD首次尝试了独有的扩展指令集3D Mow!和Super 7主板平台,并获得了很多软硬件厂商的支持,说明除了用户之外,各个相关厂商也认可了AMD处理器并准备对其进行更好的支持,其意义远超过这些技术对性能的实际提升。

07

1997年推出的Pentium Ⅱ是Intel用来一举甩开所有竞争对手,让处理器实现跨越式进步的利器,它是纯32位专业级处理器Pentium Pro的小幅度升级版,在运行32位程序时有着巨大的性能优势,同时采用了Intel专利技术的SLOT 1插槽接口。很遗憾的是,Intel在Pentuim Ⅱ上的架构壁垒——纯32位架构,因为只能以模拟方式,相当缓慢地运行16位程序,对当时仍大量混用16位程序的主流用户来说难以接受;而硬件壁垒——SLOT 1插槽及SECC(Single Edge Contact Connector,单边接触插槽)封装(图08),则存在成本高昂、安装难度大、占用空间大、散热困难、外置缓存速度受限等诸多问题。Pentium Ⅱ的诸多问题造成大量用户放弃了选购Intel新一代产品,其中很多人转而使用K6-2处理器,特别是K6-2虽然更适合100MHz外频的Super 7平台,但也仍然可以正常使用Socket 7平台,更让原有的Pentium用户可以用最小的成本进行升级。

08

AMD K6、K6-2对Intel的压力相当剧大,可以说是赛扬(Celeron )处理器这一全新品牌推出的动力之一。第一批赛扬处理器为赛扬266MHz和赛扬300MHz,它们可以看作是不配备板载L2缓存和外壳的奔腾2,外频也降低到66Mhz,因此成本大幅下降,可以用来和K6-2进行竞争。不过当时市场上支持SLOT 1接口的440LX和440BX芯片组价格仍然很高,且取消了L2缓存的赛扬浮点性能虽然仍相当出色,也因为没有缓存的限制而拥有了让人惊讶的超频能力,但运行16位程序时的低能和没有缓存造成的整数性能下降,使其办公等性能大幅落后于K6-2,甚至超频后都难以让人满意,所以只有一些游戏爱好者和超频发烧友才会选择。而后Intel推出了带有将小容量二级缓存集成在核心内的新赛扬(图09),其中的300MHz产品凭借优异的性能和超频能力获得了发烧友的热爱,和K6-2 300MHz一起成为了两款当时深受欢迎,并且在历史上留下深刻印记的经典产品。

09

1999年,Intel推出了采用0.18微米工艺,增加SSE(Streaming SIMD extensions,数据流单指令序列扩展)指令集的新一代处理器——Pentium Ⅲ(图10),解决了大量Pentuim Ⅱ上存在的问题。相对应的,AMD也推出增加了512KB大容量二级缓存的K6-Ⅲ(图11)及其精简版K6-2+处理器,大容量缓存为新处理器带来了更强大的性能,特别是整数性能,AMD甚至特意将命名规则更改,采用了K6-Ⅲ而非K6-3的命名,以表示这是一款不同以往的产品,以及挑战Pentium Ⅲ的决心。不过K6-Ⅲ在市场上的影响实际很小,除了延期、较大的发热量、高成本、浮点性能较差等因素之外,最重要的原因是更加强大的K7几乎接踵而至。K7炫目的光彩完全遮掩了K6-Ⅲ的身影,让它从高端产品迅速沦落为暂时填补低端市场空白的陪衬,并且开启了世纪之交的新一轮处理器大战。

10

11

● 世纪大战——K7

1999年6月,AMD推出的K7架构处理器比K6更加强势,其主要技术来自DEC公司强大的服务器处理器Alpha 21264,并使用了Alpha架构的EV6总线。与之前的绝大部分非Intel处理器不同,K7架构拥有超越Intel处理器的浮点能力和频率潜力。

首款K7处理器被命名为Athlon,它和Intel的Pentium一样,成为了AMD的保留商标,至今仍是中低端处理器的名称,当然在初创之时,它还是一款高端产品,价格与同频Pentium Ⅲ比肩。首批推出的Athlon处理器拥有500MHz主频,200MHz外频,用后128KB一级缓存,采用0.25微米制造工艺。比较有趣的是,不知道是Intel在技术和宣传上的强势,还是为了与其他配件厂商进行更好的匹配,AMD也选择了SECC封装(图12)、外置低速512KB二级缓存、采用SLOT A插槽接口,早期用户发现它其实就是反向使用的SLOT 1接口。

12

Athlon的综合性能超越同主频Intel Pentium Ⅲ,让当时所有DIY用户和Intel都震惊不已。而其后Athlon更是开始在Intel最骄傲的频率方面不断进行挑战。从700MHz到突破1GHz,双方轮番夺取频率的制高点,产品发布的频率和相互之间的间隔都变得很小,以至于1GHz这一具有里程碑意义的频率,双方几乎是同时达到的,如果考虑到发布、出货的时间间隔,甚至难以确定到底是谁第一个突破了GHz大关。不过在1GHz的处理器方面,有一点可以肯定的是,冲击1GHz大关的Pentium Ⅲ产品都出现了这样那样的问题,有些型号甚至全面回收,所以最终戴稳了这一桂冠的,应该是AMD和Athlon处理器。

在争夺1GHz高峰的同时,Intel也发现了SECC封装的弱点,重新返回Socket接口,推出了Socket 370接口的Coppermine(铜矿)核心Pentium Ⅲ(图13)。这一核心对早期架构进行了修改,内置同频L2缓存,但容量降至256KB,使得产品体积、制造成本、发热量等都大幅降低,性能大幅上升。AMD应该是在推出K7后,很快也意识到了SECC封装的不足,引起紧接着推出了Socket A接口以及相应的Thunderbird(雷鸟)核心Athlon处理器(图14),同样采用了同频内置L2缓存,容量也降至256KB。

13

14

图14:Athlon和Pentium Ⅲ的封装方式是直接将覆晶芯片打在散热基板上,所以我们可以看到每一代处理器的芯片面积和形状变化

在更换为Socket A接口的同时,AMD还推出了面向低端的Duron(钻龙,内地俗称毒龙)系列CPU(图15),将二级缓存砍到了64KB。虽然较小的二级缓存对高端应用有一定的影响,但在日常应用中,Duron的表现还是很出色的,基本做到了压制Intel新一代赛扬处理器的目标。

15

2000年底,Intel推出了采用NetBurst(网络突发)架构的新一代处理器——Pentium 4,其超长管线设计使其可以很容易地提升频率,而且理论上拥有更高效的计算能力。虽然事实证明最终Pentium 4也没能达到真正的高效率,且频率提升并没有预想中的顺利,不过在当时,1.4GHz起步(图16),迅速达到2GHz以上频率的Pentium 4,还是给了AMD K7架构很大的压力。

16

图16:最早的两款Pentium 4也出现了很多问题,因此和接口,以及“原配”内存RAMBUS一起被迅速淘汰

由于早期的Pentium 4性能表现欠佳,且陷入了内存搭配、更换接口等很多自身的麻烦之中,所以Athlon仍然勉强可以应对,但2002年初推出的Northwood核心Pentium 4(图17)已经比较完善,它使用0.13微米工艺制造,将二级缓存提升到了512KB,最高频率达到3GHz以上。更重要的是,其配套芯片组i865系列开始支持双通道DDR400内存,终于补足了Pentium 4在内存带宽方面的短板,最后更实现了大大提升效率的超线程技术。

17

2001年底,AMD在压力下也推出了新版本的K7处理器进行应对,即Athlon XP,其主要变化是加入了对SSE指令集的支持,以及更高的频率,另外相应的芯片组也开始支持更高带宽的DDR内存,封装基板也从厚重的陶瓷改为了更轻巧、类似Pentium Ⅲ的树脂材质。由于对手的高频率可能对市场造成误导,因此AMD又一次祭出了PR值标定法,以体现处理器相对于Pentium 4的实际效率。Athlon XP进行了数个版本的快速迭代,其终极核心,2003年推出的Barton(图18)采用了最新的0.13微米工艺、L2缓存翻倍,达到512KB,加上新的双通道DDR内存支持,尽管实际性能已经无法和高端Pentium 4对抗,但出色的性价比仍然使其成为A粉心中的一代经典。

18

在K7时代,AMD处理器的出色表现也吸引了大量周边芯片组厂商,无论是老搭档VIA、ALI,还是新晋的NVIDIA等厂商,都提供了稳定、出色的芯片组。因此尽管不再能兼容Intel平台,但K7平台攒机的可选性不降反升。到Athlon XP时代,NVIDIA的nForce 2芯片组(图19)非常强势,以双通道DDR2内存、AGP 8×、SATA等一系列新技术、新接口,以及内置强力显示单元等独特功能,受到了用户的青睐,形成了延续数年,直到K8时代的NVIDIA芯片组+AMD处理器的最佳组合模式。

19

比较有趣的是,在K7时代末期,一批特殊的Duron处理器曾经轰动市场,这批产品据称全部是由Athlon XP修改而来,通过连接封装基板上的一些触点,就能恢复全部二级缓存。这批处理器的面世说明AMD正在试图快速消化Athlon XP库存,原因就是新一代王者,K8即将登场。

● 开创时代——K8

2003年8月,AMD推出的K8处理器可以说是一款划时代的产品。虽然总体上说,K8是基于K7架构的产品,但有三项大的改变,而这三个改变中的任何一个,都足以成就“一代名U”。而这三项技术实际上也代表着处理器发展的方向,实际上也被Intel全部或部分吸收使用。

首先,K8最重要的改变就是加入了64位指令集,通过64位指令集不但让处理更高效,而且管理超过4GB容量的内存。64位处理器本身并不是AMD最先提出和推出的,但Intel等厂商只把64位指令集及相关处理器用在了服务器市场上,例如其Intel的IA64架构安腾(Itanium)处理器(图20),这些处理器不仅本身不适合消费级市场,而且其指令集也是高度专一和优化的,并不能兼容消费级市场的应用软件,这给AMD留下了一个很好的突破口。AMD提出的64位指令集是一种基于X86架构的扩展指令集,因此K8不仅可以高效运行64位程序,也能出色地执行32位X86程序。AMD的64位指令集在实际使用中的表现相当优秀,获得了微软等业界领导者的支持,也使得Intel不得不对其进行支持。

20

其次,在K8中首次集成了内存控制器,最初支持DDR内存,可以大幅度降低内存与处理器的通信延迟,提升系统整体性能,这一技术目前已经成为所有主流处理器的标配,其意义不言自明。当然处理器内集成内存控制器减少了内存可选的种类,还会使内存的工作频率与CPU频率直接挂钩,让超频多了一些限制。

最后,K8放弃了原有的FSB前端总线而采用了HyperTransport总线技术,它采用点对点串行设计,让内存、磁盘、PCI总线控制器之间有了更高的数据带宽和更大的弹性空间。这项技术对Opteron(皓龙)系统上面影响很大,帮助AMD拓展服务器市场,并一直沿用到Ryzen架构之前。

除此之外,K8还在K7架构的基础上还加长了整数与浮点流水线,增加了缓存容量,加入温控电路和节能技术,以及增加了对SSE2指令集的支持。第一代K8处理器架构内置单/双通道DDR400内存控制器,一级缓存为128KB,二级缓存为512KB~1024KB。K8处理器的封装也有了大幅改变,与Pentium 4类似,带有一个金属保护壳,以前因手滑或者操作不当而压碎CPU的问题终于成了历史。

K8处理器有面向主流市场的Athlon 64、顶级的Athlon 64 FX(图21)以及专业级产品Opteron,接口也分为Socket 754和Socket 940两种(图22),前者针对中低端,不支持双通道内存,早期的Athlon 64和Sempron(闪龙)采用这一接口,后者针对高端,支持双通道内存,主要用于早期的Athlon 64 FX和Opteron。

21

22

前面已经提到,Pentium 4采用了特别适合高频,但效率不佳的架构,因此Athlon 64也采用了PR值标定方式,以确定对位的竞争产品。在Athlon 64处理器中,不乏Athlon 64 3000+/3200+等经典型号,而Athlon 64 FX则在性能上全面超过奔腾4系列,价格也是水涨船高,Athlon 64 FX-60价格曾超过万元。另外在K8产品中开始出现面向高端消费者的专门产品——FX系列处理器,它们不仅性能出众,而且拥有组建多路CPU的能力,以HyperTransport总线连接的多路CPU系统,充分体现着K8架构独特的服务器处理器血统。2004年7月,AMD还推出了K8架构的新Sempron(闪龙),主要变化就是L2缓存容量降至128KB,性价比和功耗表现都很出色,其中闪龙2500+可以轻松从1.5Ghz超频到2Ghz以上,其便宜的价格与功耗非常实惠,笔者家中还留有一块藏品。

2005年,AMD的K8架构进入了双核和DDR2时代,双通道内存的Socket 939成为主流接口,除了Sempron之外,K8全部消费级处理器都逐渐转向这一接口,直至全部统一到Socket AM2接口,使得用户的选购与升级都更加方便。不过由于Intel在Pentium 4平台逐渐排挤兼容芯片组,使得大量厂商集中在K8芯片组市场中,这使得K8主板市场空前繁杂,VIA、ALI、NVIDIA、ATI等厂商的芯片各有特色,不过其中功能最全面,也最受欢迎的仍然是NVIDIA的nForce系列芯片组,它最早提供了规格最高,表现也最好的SATA、USB接口,以及PCI-E等新兴接口。

与K8对应的Pentium 4处理器已经是后期的Northwood核心与Prescott核心。其实Northwood核心的拎一个重要变化是支持超线程技术,可以动态分配计算量,尽量填满整个计算管线,充分利用NetBurst架构的长管线设计。超线程技术让一个核心能同时运行两个计算,成为虚拟双核心,这一技术一直延续到了当前的智能酷睿处理器和Ryzen处理器中,但在Northwood核心处理器中,仅有最高端的3.06GHz型号实际开放了这一功能。在Northwood核心的基础上,还推出了Pentium 4极致版(Pentium 4 Extreme Edition,P4EE)处理器,增加了2MB的三级缓存,提升了在多媒体等专业领域的性能。

2005年Intel推出了Prescott核心,使用90纳米(0.9微米)制造工艺,L1数据缓存升至16KB、二级缓存达到1MB。Prescott核心的Pentium 4开始使用延续至今的LGA(Land Grid Array栅格阵列)封装,即LGA775接口(图23,24),取消了处理器上的易折断的针脚,使其运输、安装都更安全,与主板连接更紧密,也更方便进行散热等设计,这一接口类型一直延续到了今天的所有Intel消费级处理器上。在Prescott核心的基础上,Intel通过一些小改款逐步引入了64位指令集、双核双线程、1066MHz外频,以及更新的65纳米制造工艺等技术,其配套的915芯片组也提供了对双通道DDR2内存、PCI-E×16插槽等高带宽接口的支持。

23

24

在AMD的攻势面前,Pentium 4处理器的抵抗混乱而低效,例如为了抢先发布双核处理器,Intel推出砍掉超线程技术直接封装两颗核心的Pentium D(图25)。这款“胶水双核”自然没法摆脱高热量高功耗的悲剧,而且价格还够贵。没过几天,AMD就推出了Athlon 64 X2双核处理器(图26),还搞了一次真假双核的商业宣传对决,让情况更加被动。

25

图25:被暴力揭盖的Pentium D,可以看基板上的两块处理器芯片

26

图26:同样被暴力揭盖的Athlon 64 X2双核处理器,可以看到内部只有一块芯片(揭盖时被导热胶粘到了顶盖一侧)

Intel在2006年还准备了一款Cedar Mill核心的Pentium 4,应该是Pentium 4最接近完美形态的产品,它采用65nm制造工艺,将TDP降至86W,引入Prescott核心尝试的所有最新技术。不过这款处理器也难以扭转Pentium 4失败的命运,几乎没有出现在市场上就被淘汰了。

2006年第一季度,AMD处理器10年的繁荣期达到顶峰,在X86市场的份额几乎达到了50%,Intel Pentium 4最终完败。不过此时,笔记本平台上的Intel Pentium M处理器却大获成功,为下一阶段的竞争埋下了伏笔。