人工智能和深度学习的热潮推动了数据中心、云计算和边缘计算市场的蓬勃发展,这些领域正成为FPGA(现场可编程门阵列)大显身手的地方。秉承独特的应用价值,FPGA不仅全面进军各大数据中心,而且在IoT和自动驾驶等终端领域稳步扩充地盘。
过去一年,在FPGA领域角逐的两家巨头英特尔和赛灵思动作频频、你追我赶:这边厢赛灵思换帅,那边厢英特尔晋升FPGA负责人;这边厢赛灵思主攻AI市场,那边厢英特尔挣得5G市场的第一桶金,首个10nm FPGA产品率先出炉……
以不同玩法迎接未来市场新机遇的英赛两家,猛火急攻之下,有望把FPGA带成燎原之势。
01 最大之争
FPGA芯片比CPU更快,比GPU功耗更低、延时更短,且比ASIC(专用芯片)更加便宜、周期更短,因此在目前人工智能芯片领域备受青睐。作为FPGA的发明者,赛灵思本在FPGA硬件领域独霸天下,稳立鳌头,但随着2015年英特尔收购了FPGA“老二”Altera之后,局势发生了改变。
英特尔在Altera技术的助力下,抢夺赛灵思的奶酪以期在人工智能领域占据更大市场空间,最近一段时间对于“世界最大FPGA”的争夺让双方的较量更上了一个台阶。
2019年8月下旬,赛灵思发布了当时“世界上最大”的FPGA芯片Virtex UltraScale+ VU19P。这款基于台积电16nm工艺制造,集成了350亿个晶体管的器件,拥有当时单器件最高的逻辑密度和I/O数量,包括超过2000个用户可编程引脚、900万可编程逻辑单元、224Mb片上内存以及3800个DSP单元,比它的前一代产品——基于20nm工艺的Virtex UltraScale 440 FPGA要大60%。
然而,仅两个月后,赛灵思“世界最大FPGA”的宝座就被英特尔给抢走了。11月上旬,英特尔宣布推出Stratix10 GX 10M FPGA,成为新的“世界上最大”的FPGA芯片。与赛灵思VU19P的配置相比,英特尔Stratix10 GX 10M基于自家14nm工艺制造,有着433亿晶体管、1020万可编程逻辑单元,以及2304个可编程I/O,几个方面都完胜VU19P。
眼瞅着风头被抢走,赛灵思方不得不一再强调,赛灵思才是一直拥有最大容量FPGA产品的一方,三代产品都是如此,“英特尔说它们有着最先进的科技或者最大容量的FPGA产品,但是我们还需要看到它真正交付的货物是什么样的,是否能给客户按期交货”,赛灵思总裁兼首席执行官Victor Peng说。
为什么“世界最大FPGA”受到如此重视呢?这一方面是因为超大型FPGA在硬件仿真和原型验证领域有着不可或缺的作用;另一方面,“世界最大”的名头是芯片厂商的“肌肉”,谁能制造出这种超大型芯片,就代表谁拥有更复杂的系统集成和封装技术。
赛灵思一直采用的是堆叠硅片互联技术(SSI),这种技术的主要缺点是多个硅片之间存在硬边界,它们只能通过硅中间层进行互联和通信,从而导致明显的性能瓶颈。在最新的ACAP器件中,赛灵思针对性地进行了优化。
相比之下,英特尔使用的是以嵌入式多管芯互联桥接(EMIB)为核心的3D系统级封装技术,EMIB没有引入额外的硅中介层,而是只在两枚硅片边缘连接处加入了一条硅桥接层(Silicon Bridge),并重新定制化硅片边缘的I/O引脚以配合桥接标准。
与SSI相比,EMIB系统制造复杂度大幅降低,且硅片间传输延时大幅减少。EMIB在Stratix 10 FPGA上早有应用,例如,在MX系列中,就通过EMIB集成了所谓的“3D堆栈式高带宽内存”(HBM)。此外,EMIB还可以用来连接各类收发器单元,这种基于EMIB的异构集成方式非常灵活,通过芯片集的方式使得相同的FPGA硅片可以搭配不同的收发器、HBM、CPU等单元,进行快速的系统级芯片集成。
最新发布的Stratix10 GX 10M是英特尔首次将两个拥有510万可编程逻辑单元的大型FPGA硅片,通过EMIB相连,由此形成一个超大FPGA。这两个FPGA硅片通过25920个EMIB数据接口进行互联,其中每个数据连接可以提供2Gbps的吞吐量,因此系统整体的通信吞吐量高达6.5TBps。
发布这样的产品,实际上是英特尔在宣布EMIB技术完全可以处理超高带宽的吞吐量需求。另外,英特尔FPGA采用的3D系统级封装技术对芯片的良率也有较高的要求,因为它虽然是异构集成技术,但依赖于每个组成部分的同构性。
也就是说,FPGA的可编程逻辑阵列本身是一整片硅片,但通过Stratix10 GX 10M可以看到,EMIB也可以用来作为同构芯片的互联技术,这样就大幅扩展了这种3D封装技术的适用程度。此外,单个FPGA硅片已经可以做到510万个逻辑单元,这也说明英特尔14nm工艺已经非常成熟。
而且EMIB并不是英特尔唯一的3D互联和集成技术。2019年初,英特尔就公布了一项名为Foveros的“真”3D封装技术,它可以将诸如CPU、GPU、DRAM、Cache等功能单元的裸片堆叠在一起,然后再封装成为一枚完整的芯片。Foveros将在英特尔基于10纳米工艺的Lakefiled上采用。
虽然很多人将FPGA比作积木,可以用来实现各种应用,但制造FPGA本身并不像搭积木那样简单。“世界最大FPGA”之争需要的是竞争各方的科技实力,英赛两强相争必然会研制更大、更复杂的FPGA器件,从而驱动更新更好技术的出现,促进行业更快地进步。
2 “软”化平台
英特尔带来的威胁,赛灵思早有感知。最近两年,赛灵思就在进行平台化转型以适应当下的市场需求。2019年10月初,在XDF美国站首次发布的Vitis软硬一体的开发工具平台则标志着赛灵思突破了硬件与FPGA的框架,正逐渐转型为覆盖硬件与软件的全方位平台公司。
Victor Peng表示:“随着计算需求呈指数级增长,工程师与科学家常常受到固定芯片性能的局限。赛灵思打造了一个卓越的设计环境,使各学科领域的编程人员与工程师能够使用他们已熟知并掌握的工具和框架,共同开发与优化他们的软硬件。这意味着他们可以不需要新型芯片就能根据自己的应用调整硬件架构。”
Vitis并非是赛灵思在软件开发领域的第一次行动。早在2015年,SDAccel开发环境就开始在软件领域试水,这次Vitis的架构更是耗时5年,有超过1000名工程师参与。从软件架构看,最底部是Vitis目标平台,中间是核心开发套件、加速库等,最上层是Vitis AI开发工具。Vitis本身提供的开发工具套件包含视觉与图像、金融在内的8大库和400项功能,另外,还支持软件开发者普遍使用的C++等语言。
平台重要组件Vitis AI也开放下载,更多人工智能和机器学习开发者将可以拥有赛灵思高性能自适应计算平台的加速度。Vitis AI专门用来帮助AI开发者,它不止支持主流ML开发框架,像TensorFlow、PyTorch、Caffe等等,还整合多种AI开发套件,支持深度学习这一类DSA应用架构的DNN处理器。
“Vitis可以把所有的功能全都集中起来,就像是AI的集成器一样。”赛灵思方面表示,“Vitis主要针对软件,它把云、边缘、端点全部集合在一起,从量化、编译到硬件集成,只需要几分钟的时间”。据介绍,Vitis包括的模型涵盖了多种应用,比如ADAS/AD(高级驾驶辅助系统/自动驾驶)、视频监控、机器人和数据中心等。
用户只要具备一定程度的基本概念和硬件知识,无需深入掌握,就可以根据软件或算法代码自动适配和使用赛灵思硬件架构。比如,使用TensorFlow框架设计训练神经网络时,开发者可以通过Vitis AI对TensorFlow进行模型优化,再将优化完的AI模型经过编译之后,放进一个可程式化的DNN处理器上,在FPGA上操作。
“数据中心优先”的核心战略使得赛灵思希望在硬件和软件开发之间搭建渠道并在软件领域打开知名度。Vitis可以将用户从繁杂的硬件专业知识中解放出来,同时降低了FPGA的门槛,软件工程师、人工智能科学家等开发人员都能受益于赛灵思灵活应变硬件加速的优势,硬件开发者也可以利用该平台更好地与软件工程师协同工作,提升效率。
另外,赛灵思还成立了开发者网站提供各种实操教学、最新技术文章等等,开发者也可以通过网站向专家求助。凭借从器件到平台的成功转型以及对打造异构计算加速平台驱动行业所做的贡献,赛灵思保持着自己的行业地位:FPGA市场占有率世界第一。
同样把数据中心作为重中之重的英特尔也不甘示弱,推出高性能FPGA芯片的同时,还加紧把FPGA芯片集成到自己的CPU内,强化与GPU在计算领域的竞争力。2018年,英特尔数据中心实现约330亿美元营收,与传统PC业务约370亿美元的营收比例接近,标志着其向数据中心业务为主的转型开始进入下半场。
03 模式差异
FPGA和GPU一样具有并行处理的能力,在硬件固定的情况下,允许用户根据需要的逻辑功能对电路进行快速烧录,并通过升级软件来实现自定义硬件功能,最终实现灵活的、可再配置的、低延迟的加速。研究报告显示,全球FPGA市场规模预计将在2025年达到约125.21亿美元。
未来FPGA的市场增量点将会集中在自动驾驶、数据中心和工业智能自动化方面,汽车有望在2025年成为最大的应用领域,达到29%的占比,数据中心及工业的占比分别被预计攀升至13%和19%。
在人工智能有望一统数据中心江湖之际,赛灵思和英特尔显然都不打算错过这一东风。过去一年,两大巨头不仅均确立了以数据中心为重的相似战略布局,而且对FPGA的规划都走上了更加多元化的道路,以差异化转型的玩法各自积累实力。
作为FPGA的开山鼻祖,尽管长期占据着FPGA业界龙头的位置,赛灵思却没有故步自封,而是早在几年前就开始试图脱下FPGA供应商的帽子,转型成为一家完全可编程(All Programmable)的公司。基于这一战略方向的指引,赛灵思的市场总体份额从2011财年的53%增长到了2015财年的56%,高端市占率保持在60%,终端市占率从1%飞增至54%,低端市占率从40%增至51%,实现了高中低端全线无短板。
2018年初,赛灵思宣布启动“数据中心优先、加速核心市场发展以及驱动灵活应变的计算”三大战略,同时发布了革命性产品Versal ACAP和Alveo加速器卡,开始向平台化公司转型。ACAP具有高度模块化和可扩展化的特点,可实现CPU和GPU无法企及的性能和功耗比,可谓是赛灵思的颠覆式新招牌。
在这一全新框架下,赛灵思发布采用台积电7nm工艺的业界首款ACAP加速平台Versal系列和Alveo系列AI加速卡,加速了赛灵思的转型。
当然,看到FPGA在数据中心广阔市场的公司不止赛灵思一家,早有觊觎的英特尔迅速横插入局,双管齐下,独立芯片与加速器齐飞,自研与收购并下,以快速求取市场地位。2015年,英特尔以迄今为止最大金额的167亿美元高价收购了FPGA领域的“老二”Altera,成立了FPGA业务部门PSG事业部。
收购Altera后,英特尔将领先的FPGA技术与自己的CPU、GPU等技术和资产集成在一起,从而开拓新的高增长细分市场。从2016年到2017年,受益于工业、军事及汽车等细分市场的增长,以及数据中心市场和其28nm、20nm和14nm工艺产品的增长,英特尔PSG营收持续走高,2018年全年收入21.23亿美元,同比增长11.6%。
与赛灵思长期专注于FPGA不同,英特尔打的是一套组合拳。其FPGA器件主要有两类用途:一是将FPGA作为一种独立的在线加速器,预处理大量非结构化数据;二是将FPGA放在CPU旁边作为离线加速器,用以助力英特尔至强处理器和加速软件堆栈无缝协作。通过这两种策略,英特尔扩展了FPGA加速平台产品组合,并与自己的其它产品协作来解决从边缘到云端以及网络转型和企业级应用中的复杂问题。
2018年7月,英特尔将其可编程解决方案事业部总经理Daniel(Dan)McNamara从副总裁晋升为高级副总裁,12月在中国重庆设立FPGA创新中心,以对FPGA业务加码,之后又发布了其多重创新实力的集大成者Agilex FPGA,用以超快速度和超高灵活性创造解决方案。
为了稳固实力和扩大市场占比,赛灵思和英特尔除了升级自身技术和产品阵列外,还均在并购和构建生态系统方面加大了火力。2018年7月,两家公司几乎同时宣布了新的收购案。
2018年7月13日,英特尔宣布将拥有约120名员工的美国结构化ASIC供应商eASIC收入麾下,并将其并入PSG事业部。eASIC探索了一条在FPGA可编程和ASIC高性能优势之间的折中路径——结构化ASIC产品,据称性能功耗都更接近ASIC,同时成本仅是标准单元约1/2。
通过收购eASIC,英特尔扩展了其PSG的芯片组合,进一步优化性能和功耗,并通过实现从FPGA到结构化ASIC的低成本转换等方式,有效缩短产品上市时间并降低开发成本。在英特尔收购eASIC相隔不过5天的2018年7月18日,赛灵思收购深鉴科技的消息流出。
2016年成立的深鉴科技是中国AI芯片领域最受瞩目的独角兽之一,其一开始选择的芯片方案就是赛灵思的FPGA,赛灵思还是其早期投资者和重要合作伙伴。收购深鉴将进一步增强赛灵思的工程技术研发力量,以及帮助其在广阔的中国市场深耕。
除了eASIC和深鉴两起并购案外,以色列创企服务器和存储连接方案的网络设备供应商Mellanox也成为巨头争抢的“香饽饽”,从2018年11月到2019年1月底,先后传言被赛灵思、微软、英特尔竞标,但最终在3月被“半路杀出来的程咬金”英伟达豪掷69亿美元截胡。
生态系统方面,英赛竞争也是如火如荼。根据Gartner报告,过去一年全球云服务市场高速发展,服务商向巨头汇聚,云计算领域被亚马逊AWS、微软Azure、谷歌云、阿里云、IBM、华为云、百度云、腾讯云等揽走绝大多数市场份额。
这几大超级云计算数据中心成为英赛必争的合作对象。目前,赛灵思在AI生态布局上已有亚马逊AWS、阿里、百度、华为等大客户,并与这些合作伙伴共同推出FaaS(FPGA as a Service)云服务等新业务。英特尔也不落下风,比如在数据中心已经部署了约25万台FPGA的微软,就在其定制硬件加速器Project Brainwave项目中选择了英特尔的Stratix 10 FPGA。
04 未来展望
目前,赛灵思和英特尔的FPGA市场竞逐角力,一来一往、有输有赢。鉴于双方都有不俗的实力,可以预计,未来很长一段时间二者都将处于激烈的竞争之中。
以通讯市场来看,下一波大幅增长动能应该来自5G建置,预期从2019~2020年开始,在2023年达到尖峰。英特尔已经陆续推出5G数据机芯片,赛灵思也发布了旗下All Programmable射频系统单芯片来迎接5G时代。双方各有优势。
英特尔以99%的市占率,支配了全球伺服器芯片市场,形成规模优势,其可将Altera的FPGA芯片整合进入旗下的伺服器处理器中,进一步在资料中心终端市场帮FPGA取得市占率。赛灵思则在制程技术方面优于英特尔1年以上,这也是其拿下大型云端客户包括亚马逊和百度等订单的原因。
目前看,英特尔除了具有行销和规模优势之外,相较于赛灵思这样一个IC设计业者,其未来还可以从价格战出手,运用来自伺服器芯片的丰厚利润投资FPGA业务,以低价抛售的策略扩张市占率。
除了双方的相互竞争外,它们还要共同面对正在慢慢崛起的ASIC的威胁。相较于FPGA,专用芯片(ASIC)在效能与量产价格上更具优势,全球前五大数据中心中,超过半数皆自行研发ASIC,此趋势将对英特尔与赛灵思数据中心业务造成威胁,对此,赛灵思与英特尔发展出截然不同的产品策略。
赛灵思持续朝大型系统单芯片方向发展,同时布局以太网络智能网卡(Smart NIC),通过并购以太网络网卡厂Solarflare涉足下游,专攻FPGA在计算、网络与储存等三大硬件加速领域的优势,强调产品在数据中心多元场景的应用性。
英特尔则着眼于如何利用FPGA补强CPU的不足。通过补齐CPU、FPGA、Mobileye的EyeQ芯片以及5G和网络的大部分关键技术,英特尔在自动驾驶领域形成了一套端到端的完整解决方案。手持FPGA、eASIC、ASIC三大利器,以CPU-FPGA混合器件和打造可编程加速卡等产品的双轮驱动方式,英特尔在数据中心、网络及物联网推动其以数据为中心的业务。
05 结语
FPGA以可重构性、高效、低延迟、低成本等优点迎合了多种新兴市场对更灵活的硬件资源的需求。从一个独立的单一硬件个体,到与其它硬件协同作用的系统化整体解决方案,FPGA的应用边界不断扩展,它逐渐在半导体市场扮演更加重要的角色。
作为FPGA领域最核心的两大玩家,赛灵思和英特尔从技术到应用均在引领着FPGA的未来走向,通过步步为营、你追我赶的相互竞争,它们将带领FPGA迎来自己的黄金时代。