在前不久的一次高性能计算会议上,amd展示了一张有关opteron服务器cpu的路线圈,只不过这张路线圈上的主图部位什么也没有,让人有一种“无字天书”之感。同期,英特尔发布了第一季度财报,显示在全球pc市场陷入雪崩式暴跌的背景中,英特尔的业绩并未出现重挫,原因就是英特尔的处理器在x86服务器市场仍然占有不可动摇的地位。目前服务器cpu的市场状况如何?未来会有哪些改变呢?
英特尔称雄x86服务器cpu市场
前不久,据idc的报告显示,全球pc市场第一季度暴跌了14%,代工厂统计的跌幅更是高达18%,英特尔的财报则提到,2013年第一季度其pc芯片交付量下跌了7%,而x86服务器芯片却增长了6%,服务器cpu成为英特尔应对去pc化危机的“良药”。
●至强处理器依旧强悍
至强(xeon)e3、e5、e7系列处理器是英特尔在x86服务器领域的主力军。其中,至强e5系列处理器是主力部队,主要面向互联网、云计算和高性能计算等环境中的两路和四路服务器。最新的至强e5包含双核、四核、六核、八核等产品,大多数产品都支持第二代睿频技术,能够通过分析当前处理器的负载情况,智能地完全关闭一些用不到的核心,进一步降低功耗,符合当代处理器的发展趋势,是目前x86服务器市场的主流之选。
要想了解英特尔服务器cpu,就不得不提至强e7。至强e7是至强系列处理器中更高端的产品,主要面向双路、四路和八路服务器,最高可以扩展至256路并行,企业可以用一台xeon e7服务器取代以前的18台双路服务器。目前主流的至强e7-8800╱4800╱2800产品家族以英特尔上一代服务器处理器为基础,全部采用32nm工艺制造,lga1567封装接口,最多10个核心、30mb三级缓存,每个处理器四条qpi总线,并在数据库、虚拟化、高性能计算、中间件、通用服务器、企业资源规划等方面创下了14个新的世界纪录。至强e7可提供高级安全特性,确保更好的数据完整性,以巩固数据中心的安全防线。
而至强e3-1200 v2系列则是更具普及性的产品,它基于ivy bridge架构,面向单路服务器市场设计,和上一代产品一样拥有四个内核,低功耗版本的至强e3-1200 v2设计功耗仅为17w,市场定位介于酷睿和至强e5之间,能够满足数据中心运营商对单路服务器节点实现密集运算的业务负载需求。对于大量使用工作站的公司来说;由于具有更高的主频和更强的图形处理能力,集成有英特尔hd图形处理器的至强e3-1200 v2更具有吸引力。对于日渐兴盛的微型服务器市场,至强e3-1200 v2也是绝佳的选择,在传统的至强e3-1200环境下,一个机柜可容纳41个服务器 1个千兆以太网交换机;而在至强e3-1200 v2环境下,同样的机柜可容纳,119个微服务器节点 3个千兆以太网交换机,可以实现高达3.6倍的性能提升。
这些处理器产品共同为英特尔的利润支撑起半壁江山,让英特尔在传统pc市场不景气的情况下,仍能保持一丝淡定。
●融核协处理器显威
为了将cuda(gpu计算)推向民用市场,nvidia举行了一系列的编程比赛,要求参赛者开发程序以充分利用cuda的计算潜能。而在高端服务器领域,在cuda的助阵下,nvidia的tesla gpu成为gpu计算、通用并行计算架构应用的最强辅助者,全球最强的hpc纷纷用tesla gpu构造,cpu gpu的异构混合计算模式成为高性能计算领域的新宠,这让一向在gpu计算领域有所欠缺的英特尔情何以堪?
为此,在2012年11月12日,英特尔也推出了多年研究的结晶,即首款60核处理器一至强融核协处理器(xeon phi)。基于22nm 3-d三栅极晶体管制程工艺的“众核技术(英特尔mic)”的xeon phi虽然以至强命名,但实际上它更像是与英特尔cpu协同工作的gpu,相比通用的多核至强处理器,处理复杂的并行应用是众核架构的优势,它们能像显卡一样,插到xeon处理器支持的各种系统中。英特尔推出这款融核协处理器的目的很明确,就是要从nvidia那里“虎口夺食”,旨在像tesla gpu一样,进一步为制造、生命科学、能源和其他领域的创新性研究提供无与伦比的并行计算性能。
对比nvidia的tesla gpu,英特尔一再强调其至强融核协处理器的优势:基于gpu的并行计算也存在着编程难、算法难、应用可移植性差等明显弊端,而“至强e5 至强融核协处理器”模式则没有该弊端,因为至强融核协处理器使用了与英特尔至强处理器架构一样的编程语言、并行模式、技术和开发人员工具,应用移植起来十分简便,从而确保软件公司和企业的it部门加大对并行代码的利用,且不需要为与加速器相关的专有的、针对硬件的特定编程模式重新培训开发人员。
xeon phi这种利用cpu融核协处理进行gpu计算的剑走偏锋之举,开拓了高端服务器和hpc领域的一种新的计算模式。英特尔为此预言,该融核协处理器“将改变高度并行化应用所能达到的范围和规模,利用该技术作为高性能计算的全新基石,将使诸如提前21天精确预测天气模式,以及找到治愈疾病的新方法等现实世界挑战的破解变得更具可能性”。
xeon phi包含3100和5110系列产品。对于那些希望运行计算密集型工作负载(如生命科学应用和金融模拟)的客户,英特尔至强融核协处理器3100产品家族将能够为他们提供出色的价值。英特尔至强融核3100产品家族将能够提供超过1000 gflops(即每秒1万亿次)的双精度浮点计算性能,并支持容量最高达6gb、带宽高达240gb╱s的内存,以及ecg校验等一系列可靠特性。其建议销售价格将在2000美元以下,该产品家族工作时的功耗范围在300w以内,和tesla gpu在性价比和效能上有一比。
英特尔至强融核协处理器5110则能以更低的功耗提供额外的性能。它能够实现1011 gflops(即每秒1.01万亿次)的双精度浮点计算性能。它可用于处理诸如数字内容创建和能源研究等内存密集型工作负载,主要面向于一些内存带宽型和容量密集型的应用,包括流媒体、动漫渲染、多媒体创建、地震资料处理等,这款产品已出现在了最新发布的第40届全球高性能计算机500强排行榜的上榜系统中。“它将推动英特尔在研究和探索领域再创新高,并重申‘我们’在实现百亿亿级计算方面的承诺。”
至强融核协处理器(xeon phi)的出现,开创了x86处理器在高性能计算的新纪元,再度为英特尔在高端服务器和hpc领域杀出一条“血路”,让英特尔有了对抗nvidia╱amd gpu的并行计算利器,这让英特尔在服务器cpu领域的前景变得更光明,也让英特尔有了更多的生财之道。这也就不难理解在传统pc市场不景气的情况下,英特尔的业绩仍能保持一丝“淡定”的原因了。
●haswell架构,至强处理器的新未来
处理器的技术发展永无止境。在2013年4月举行的idf信息技术峰会上,英特尔推出了基于新一代22nm制程技术的haswell架构的至强e3产品家族。与由32nm sandy bridge升级的22nm ivy bridge有所不同,haswell为新微处理器架构,由于在此架构上出现了较多的改进,成为英特尔处理器产品的又一次大跨越。
据报道,来自haswell架构的至强e3-1200 v3家族规格也已经正式敲定,至强e3-1200 v3主要用来替代sandy bridge e3-1200 v2。和前任相比,基于haswell核心架构的至强e3-1200 v3的整体功耗普遍下降,处理器插槽升级为lga1150,包含四核心八线程、四核心四线程、双核心四线程的产品,其最低端的产品设计功耗仅有13w,顶级型号还将标配更强大的英特尔gt2(hd4600)集成显卡。
随着这些产品的全面上市,将对数据中心的英特尔产品线产生一次大规模的换代,由于这些产品具备更高的性能功耗比以及更多的特色设计,也将为新一代数据中心及各种服务器产品带来更好的效能。
此外,在未来英特尔的服务器cpu产品线中,值得关注的还有凌动家族。下一代atom(凌动)处理器型号为atoms12x9家族,全部采用soc设计,分为面向微服务器的avoton和面向网络基础架构的rangeley,皆为64位处理器,并且采用了先进的22nm制程工艺,在性能和功耗控制方面都有不错的表现。其核心架构也会从atom目前的saltwell升级到slivel mont,抛弃了atom一直使用的顺序指令体系(in order),改用性能更高的乱序指令(out of order),据称性能可提升35%。这些处理器全部集成了以太网控制器,内置多达40条pcie 2.0通道,集成存储控制器,具备raid加速、异步dram刷新以及非透明桥接等特性。有望为微型服务器提供更佳的能效、更高的性能功耗比,为微型服务器提供更强大的扩展能力和负荷承载能力,成为同样瞄准微型服务器市场的arm cortex a57╱a53的最强悍对手。
全面开花,amd雄心勃勃
虽然在x86服务器领域英特尔拥有绝对的优势,但amd从没轻言放弃。当前的hpc环境需要卓越的性能、扩展能力和效率,amd的opteron系列处理器同样能提供,amd作为hpc技术的领导者之一,已为全球100套最强大的超级计算机中的24套提供动力。
●“打桩机”撑起amd的2013
amd在2013年服务器cpu领域的路线图之所以一片空白,是因为在2012年底,amd公司才推出了基于“打桩机”核心架构的全新皓龙6300╱4300╱3300系列服务器处理器。
amd皓龙6300处理器基于amd的“打桩机(piledriver)”架构,在制程上仍采用上一代的32nm工艺,每个处理器最多16个核心,基本频率可达3.5ghz。它具备amd-p电源管理功能,可最大限度地提高各工作负载的每瓦性能,同时让数据中心电源配置控制更加方便,在热门的虚拟化应,用环境中,amd虚拟化(amd-v)技术可为虚拟化环境带来近乎完美的性能和最低的虚拟机单机成本。每瓦性能比上一代pg电子娱乐试玩的解决方案提升高达40%,这意味着企业能以较低的总体拥有成本获得更高的性能。
并且皓龙6300处理器和上一代的皓龙6200在接口、能耗、软件认证等方面完全一致,使用皓龙6200的用户不需要升级平台,只需要更新bios,就能够升级到最新的皓龙6300,从而大大提升了皓龙6300服务器新品在2013年的期望值,也保护了用户的投资。
amd皓龙4300和3300系列处理器都采用了“打桩机”核心架构,根据specint基准测试结果,amd皓龙4300系列处理器的性能比上一代产品提升多达15%,每瓦性能提高则为24%,处理器管脚同样与上一代处理器相同,可以让客户轻松升级。其中,皓龙4300系列处理器每瓦性能比上一代产品更出众,将为电力受限的数据中心带来最大化的计算性能,并向云服务提供商和网站托管商提供更大的价值。皓龙3300系列处理器在提供企业级性能的同时功耗更低,价格仅相当于台式机处理器,是那些想解决空间和功耗问题的云服务供应商、网站托管商和中小企业的理想选择。可以为当今的客户提供最优的性能、价格和功耗控制。
总之,amd不可能轻言放弃利润相对丰厚的服务器cpu市场,继“打桩机(piledriver)”之后,第三代模块化架构的“压路机(steamroller)”处理器完全有可能在2013年末发布,而第四代“挖掘机(excavator)”架构也在酝酿中。amd cto表示,通过使用加倍解码单元、改进执行管线、增大l1缓存等方式克服第一代“推土机”的缺点后,“压路机(steamroller)”的性能将会提升30%-45%,将成为haswell最有力的竞争产品之一。
●amd进军arm处理器领域
“无字天书”不仅是一种噱头,更展示了amd潜心前行的决心。随着amd宣布进军arm服务器领域,amd成为横跨x86、arm、gpu三大领域的全能选手——除了在x86处理器方面进一步提升性能,在功耗控制方面,amd也看到在超大型的数据中心,高密度的云服务器对绿色节能的要求非常高,这是amd决定进入arm架构cpu领域的原因。
低功耗和高效能长期以来都是处理器制造商关注的焦点。“为了进入超低电压处理器市场,amd将把x86处理器的耗电量降低到2w以下,未来我们将看到配置windows 8的平板电脑采用了,amd的处理器,而采用这种处理器的windows 8平板电脑的电池使用时间将持续30天时间。”在2013年,amd第三代低功耗apu产品将会陆续推出,包括kaveri、kabini、temash等型号,主打低功耗最值得关注的是temash,其tdp为3.6w-5.9w,最多具备4个jaguar核心,主要应用在平板电脑等智能终端上。
在ces2013展会上,amd全球业务部门营销主管已展示了采用新的temash核心的四核产品,据称该芯片是第一款基于x86架构的四核soc,配置了hd radeon 8000系列gpu和amd graphics core next架构,最大功耗为8w,其性能超过amd hondo核心50%以上,可以和平板电脑上的下一代凌动芯片媲美且性能更强,甚至在性能上可以和笔记本酷睿i3相提并论,temash会在2013年中推出,与当前基于arm(soc)的众多处理器芯片展开竞争。
据报道,amd还将设计基于64位arm架构的处理器,amd的首批arm处理器预计于2014年问世,仍将披挂opteron皓龙品牌。这种64位的多核心soc会针对数据中心份额最大的密集型高能效服务器进行优化,提供现代计算体验,并整合收购而来的seamicro freedom超级计算光纤互联技术。amd认为,“云计算是杀手级的应用,数据中心则是云服务的基石,密集型计算又是数据中心里发展最快的服务器领域,而遍布其中的小型高度并行工作负载在传统的服务器架构上并不理想,更适合交给arm架构来处理。”
amd在x86、arm、apu领域的全面布局,将为amd在越来越强调效能的服务器、数据中心、hpc的竞争中赢得更多机会。
小结:通过本文的介绍,广大读者肯定对当前的x86服务器cpu市场有所了解。“哪里有计算,我们就在哪里竞争。”随着竞争的加剧,在服务器cpu领域,提升性能、降低功耗、保持价格的竞争力也成为三大关键点,无论是现在采用英特尔sandy bridge架构的至强、基于“打桩机”的皓龙,还是未来更新的haswell至强和“压路机╱挖掘机”皓龙,提升性能、降低功耗,更注重效能都是其发展的方向。
而随着arm处理器在智能手机、平板电脑领域的崛起,arm处理器在低功耗,高密度服务器和并行计算领域开始初露锋芒,让传统x86服务器厂商看到了发展的新希望,英特尔和amd都不约而同地将目光转向了它。总之,随着并行计算、异构混合计算的流行,以及云计算应用的普及、大数据的爆发、绿色数据中心的不断兴建和微型服务器的崛起,未来低功耗服务器cpu领域的竞争将更激烈,谁能笑傲江湖,让我们拭目以待。