计算类IC——硬核科技的代表分析
计算类芯片也称逻辑电路,是一种离散信号的传递和处理,以二进制为原理、实现数字信号逻辑运算和操作的电路,它们在计算机、数字控制、通信、自动化和仪表等方面中被大量运用。逻辑电路可以分为标准化和非标准化两大类。
纵观全球半导体,作为资金与技术高度密集行业,半导体目前形成深化的专业分工、细分领域高度集中的特点,逻辑IC作为半导体行业的核心,自上世纪末开始,近20年来持续保持增长态势,CAGR达到8.51%,2018年逻辑IC市场规模达到新高1093亿美金,约占全球半导体市场总值的四分之一。
目前世界范围内主流标准化逻辑电路有四种:CPU、GPU、ASIC、FPGA。由于西方国家电子信息化拥有先发优势,形成了对革命性产品的垄断,逻辑IC行业形成了较高市场准入门槛,四个主流领域多被欧美发达国家的电子巨头所控制。
CPU从1971年发展至今已经有四十七年的历史了,提起CPU不得不说Intel公司的发展史就是CPU的发展简史。英特尔公司最早有三位创始人:罗伯特·诺宜斯、高登·摩尔、安迪·葛洛夫。集成电路技术的发展一直遵循摩尔定律,高登·摩尔就是摩尔定律创始人。
CPU是一块超大规模的集成电路,是计算机的运算核心和控制核心。它的功能主要是解释计算机指令以及处理计算机软件中的数据。CPU的结构主要包括控制单元、运算器、高速缓存器、动态随机存取存储器四个部分,分别对应控制、运算、高速数据交换存储、短暂存储四个用途。
多年来,随着电子信息技术发展,CPU在集成电路领域仍保持强大的竞争优势,源于CPU诸多优势,其一CPU是通用类计算芯片,能适应不同应用场景,包括手机、汽车、工业制造、计算机等。其二性能上稳定性好、运算能力突出、功耗适中、开发周期相对较短、成本较低。
CPU可分为桌面CPU和移动CPU两大类。桌面CPU行业目前形成传统霸主英特尔与后起之秀AMD两强争霸的局面。
资料来源:公开资料整理
从营收规模来看,2018年Intel公司营收658.62亿美金,位列2018年全球十大芯片厂第二位,AMD公司营收64.75亿美金,因公司定位于IC设计、销售,自身没有晶圆代工业务,营收能力明显弱于Intel。利润方面,Intel多年来保持15%以上的净利率,2016年以前AMD产品在市场上始终被Intel的7代酷春核心型号压制,导致公司多年亏损,自2017年开始,AMD的Ryzen 72700X、Ryzen 52400G、Ryzen51600三款型号的市场接受度有所提升,公司开始盈利。
从市场占比上看,Intel一直是CPU领域的领导者,AMD一直是追赶者的角色,2017年,两大公司在PC处理器领域的市占率为79.3对20.6%。
图表:Intel及AMD全球营业收入(亿美元)
工艺制程方面,目前CPU顶级的工艺制程为14mm,正在向10nm推进。AMD通过多年研发投入,从不同等级产品的核心数、基频、主频、缓存、工艺制程等多项技术参数上看已经不落后于Intel,但缺陷也是明显的,AMD产品工作主频往往产生较高发热量,功耗过大,反映了AMD追求低成本工艺制作与Intel追求极致工艺制作的较大差距。
应用领域上,CPU作为任何电子终端产品的核心部件,被大规模应用在个人PC、平板电脑、大型服务器、商用无人机、移动设备上。
图表:CPU主要应用领域
资料来源:公开资料整理
移动CPU领域呈现一超多强的局面,美国高通公司一直在高端移动处理器市场中占据垄统治地位,至今这种优势依旧难以打破。其竞争对手主要包括美国苹果电脑、台湾联发科和韩国三星电子。
图表:主要移动CPU公司介绍
资料来源:公开资料整理
高通在研发上持续保持着巨额投入,作为移动CPU和通信领域领先的技术开发者,在开展技术创新的同时,对专利技术的应用也非常重视。高通多年来将大约20%的年营业收入投入创新,被用以技术再研发,这在科技公司中是一个相当高的比例。强劲的研发投入为高通带来了多项技术专利,2017年高通共获得了2628项专利,同时成为2017年获得中国专利权最多的外国企业。大量专利支撑起了高通在高端芯片领域领先者地位。
从产品上来看,高通凭借三大优势引领移动CPU领域:
一是集成度以及先进的制造工艺,目前最高制造工艺达到14纳米级别的集成度。
二是高通给出的是一整套的手机芯片解决方案,形成了行业标准,手机生产商完全不用去考虑维护和技术问题,只要按照高通的标准来都可以做手机。
三是产品覆盖面较广,在主攻高端芯片的同时,保持入门级芯片稳定投放。
图表:高通主要移动CPU平台
由于CPU的架构中需要大量的空间去放置存储单元和控制单元,相比之下计算单元只占据了很小的一部分,所以它在大规模并行计算能力上极受限制,而更擅长于逻辑控制。但是随着人们对更大规模与更快处理速度的需求增加,CPU无法满足,因此诞生了GPU。
GPU是图形处理器,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器,拥有很强的浮点运算能力。它与CPU有明显区别:一是相比于CPU串行计算,GPU是并行计算,同时使用大量运算器解决计算问题的过程,有效提高计算机系统计算速度和处理能力,它的基本思想是用多个处理器来共同求解同一问题,即将被求解的问题分解成若干个部分,各部分均由一个独立的处理机来并行计算。二是GPU的结构中没有控制器,所以GPU无法单独工作,必须由CPU进行控制调用才能工作,GPU更适合简单大量的处理类型统一的数据。
虽然GPU是为了图像处理而生的,但是我们通过对GPU微架构示意图观察,认为GPU在结构上并没有专门为图像服务的部件,只是对CPU的结构进行了优化与调整,所以GPU也可以称为专用CPU。
谈到GPU,可能首先想到的是NVIDIA,这是一颗GPU领域的璀璨明星,NVIDIA成立于1993年,由黄仁勋等三人创办,从1995年开始推出自己的显卡NV1和NV2,但并不成功,真正让NVIDIA崭露头角的是1997年推出的RIVA128,这款显卡像素填充率为100Mpiexl/s,支持微软的Direct3D标准,在能效上超越了3Dfx的Voodoo和ATI的Rage Pro,加上价格低廉获得了很多整机厂的青睐,随后NVIDIA乘胜推出了RIVATNT及GeForce256,彻底将3Dfx和S3这些昔日的霸主抛在身后,此时唯一能与之相争的只有ATI的Radeon,ATI的Radeon系列与NVIDIA的GeForce系列的对抗直到2006年才罢场,AMCa不再显示成功收购ATI,独立GPU市场形成NVIDIA和AMD两大巨头的格局。
从营业收入上来看,NVIDIA公司2018年全年收入117亿美元,在与AMD显卡领域的对抗中处于绝对优势,以70.5%的市场占有率遥遥领先AMD的29.5%,原因有三点:一是NVIDIA一直专注于GPU芯片领域,在产品性能上一骑绝尘。对于芯片等高科技领域,技术水平是硬实力。二是敢于做减法,NVIDIA早在2008年,就推出了基于ARM和GeForce的移动处理器Tegra。但是在智能手机市场上,与其他竞争者一样,由于缺乏基带这个最核心的部件技术,导致难以与Qualcomm、Samsung等抗衡,所以其非常明智地退出了该市场。三是近些年来人工智能的崛起,下游应用领域全面扩展。由于GPU强大的数据处理能力等特点使得其在人工智能领域具有独特的优势,再加上NVIDIA在该领域布局较早,竞争相对较少一举奠定了在人工智能领域的地位。利润方面,英伟达受益于过去两年矿机市场对GPU需求强劲,显卡价格持续上涨,2018年净利率达到历史最高的35.34%。
从产品上来看,两家公司GPU特点和优势完全不同,这缘于研发思路存在差异:
NVIDIA产品特点主要有四点:一是设计思路归于高性能、低功耗;二是性能强大,经常垄断高端旗舰级市场,高端N卡占据优势比较明显;三是支持PhysX、TXAA、FXAA等多个技术;四是驱动程序完善。
AMD的产品特点在于:一是芯片单一性能突出,功耗普遍较大;二是主打入门级的产品,性价比高,覆盖中低端市场;三是支持AMDEyefinity宽屏技术;四是挖矿性能相当突出。
总之,N卡主要有低功耗、驱动成熟、追求极致性能,产品线完善等优势,A卡则主要是性价比相对更高,计算能力强,绘图、挖矿更有优势,画质较好,但高端产品线较少。
近年随着以比特币为代表的虚拟货币市场的火爆,催生了一大批生产“挖掘”虚拟货币设备的矿机厂商,相较于我们常见的CPU、GPU等通用型芯片来说,ASIC芯片的计算能力和计算效率都直接根据特定的需要进行定制,所以其可以实现体积小、功耗低、高可靠性、保密性强、计算性能高、计算效率高等优势,特别适合矿机这种对芯片算力要求高、功耗要求小的特定应用领域。缺点是ASIC不同于GPU和FPGA的灵活性,定制化的ASIC一旦制造完成将不能更改设计要求高、初期成本高、开发周期长。
由于挖矿属于边缘应用领域,AI仍是ASIC的主要应用领域,随着人工智能时代到来,传统的神经网络算法在通用芯片(CPU、GPU)上效率不高,功耗比较大,因此从芯片的设计角度来说,通用型往往意味着更高的成本。为了提升效率,降低功耗,ASIC应运而生。目前从全球范围来看,基于人工智能方向的ASIC领域并未出现“一家独大”的局面,反而呈现出国内外电子科技巨头、科研院所和国内初创型公司互相竞争的格局,国外以Google、IBM、Intel、斯坦福大学为首,国内有中星微电子、寒武纪科技、启英泰伦。
通用处理器的摩尔定律已入暮年,而机器学习和Web服务的规模却在指数级增长。人们使用定制硬件来加速常见的计算任务,然而日新月异的行业又要求这些定制的硬件可被重新编程来执行新类型的计算任务。FPGA正是一种硬件可重构的体系结构,常年来被用作高计算领域专用芯片(ASIC)的小批量替代品。
FPGA指现场可编程门阵列,它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。
FPGA能部分替代ASIC是有原因的,一是FPGA并行运算,二是硬件结构可变,三是运行中可更修改。
图表:FPGA可小批量替代ASIC的原因
资料来源:公开资料整理
FPGA的核心优势,主要有五个方面:可编程灵活度高、并行运算效率高、开发周期较短、稳定性好、长期维护。
可编程灵活度高:理论上,如果FPGA提供的门电路规模足够大,通过编程可以实现任意ASIC和DSP的逻辑功能。不像ASIC设计后固化不能修改。所以,FPGA的灵活性也较高。实际应用中FPGA的现场可重复编程性使开发人员能够用软件升级包通过在片上运行程序来修改芯片,而不是替换和设计芯片(设计和时间成本巨大),甚至FPGA可通过因特网进行远程升级。
并行运算效率高:FPGA打破了顺序执行的模式,在每个时钟周期内完成更多的处理任务,例如处理一个数据包有10个步骤,FPGA可以搭建一个10级流水线,流水线的不同级在处理不同的数据包,每个数据包流经10级之后处理完成。每处理完成一个数据包,就能马上输出。
图表:计算密集型任务时CPU、GPU、FPGA、ASIC的数量级比较
资料来源:公开资料整理
开发周期短:FPGA技术提供了灵活性和快速原型的能力。一般用户可以测试一个想法或概念,并在硬件中完成验证,而无需经过自定制ASIC设计漫长的制造过程。由此用户就可在数小时内完成逐步的修改并进行FPGA设计迭代,省去了几周的时间。
稳定性好:软件工具提供了编程环境,FPGA电路是真正的编程“硬”执行过程。基于处理器的系统往往包含了多个抽象层,可在多个进程之间计划任务、共享资源。驱动层控制着硬件资源,而操作系统管理内存和处理器的带宽。对于任何给定的处理器内核,一次只能执行一个指令,且基于处理器的系统时刻面临着严格限时的任务相互取占的风险。而FPGA不使用操作系统,拥有真正的并行执行和专注于每一项任务的确定性硬件,可减少稳定性方面出现问题的可能。
长期维护:FPGA芯片是现场可升级的,无需重新设计ASIC所涉及的时间与费用投入。举例来说,数字通信协议包含了可随时间改变的规范,而基于ASIC的接口可能会造成维护和向前兼容方面的困难。可重新配置的FPGA芯片能够适应未来需要作出的修改。随着产品或系统成熟起来,用户无需花费时间重新设计硬件或修改电路板布局就能增强功能。
FPGA也存在限制因素:一是随着半导体制程提升,芯片设计和流片成本大幅增加,摊销到每块芯片上的成本非常高,这也是摩尔定律推进放缓的一个原因。10nm芯片的开发成本已经超过了1.7亿美元,7nm接近3亿美元,5nm超过5亿美元。如果要基于3nm开发出NVIDIAGPU那样复杂的芯片,设计成本就将高达15亿美元。代工厂为此每月要拿出4万片晶圆,成本在150亿到200亿美元。在14nm之前,每18个月进步一代制程,性价是有30%提升的,然而迈入14nm之后,这一趋势快见不到了。
按照测算,FPGA流片临界点是5万片,低于5万片,对于雷达、宇航、汽车电子等高价值专用设备采用FPGA较合算,而超过5万片甚至更大规模流片采用ASIC更有优势。
二是FPGA功耗比ASIC大,由于FPGA制造厂商设计过程中不清楚芯片的应用领域,会过于追求门电路的规模,而实际应用中多数门没有被用到,导致FPGA的单位芯片面积大于ASIC,存在功耗过大的问题。
三是FPGA设计技术门槛非常高,编程时需要采用专用工具进行编译,再烧录至FPGA中,还要考虑应用场景多样性、复杂性和效率等多种问题。
全球FPGA市场被国外四大巨头Xilinx(赛灵思),Altera(阿尔特拉已被英特尔收购)、Lattice(莱迪思)、Microsemi(美高森美)垄断。
图表:FPGA主要公司介绍
资料来源:公开资料整理
从营业收入上看,2018年赛灵思营收达到25.39亿美元,市占率54%,Xilinx与Altera两家公司共占有近90%的市场份额,专利达到6000余项,四家公司合计专利9000余项,技术壁垒高不可攀。而Xilinx始终保持着全球FPGA的霸主地位,难以撼动。从利润上看,由于Xilinx对FPGA市场巨大的统治力,多年来净利率始终保持稳定,2017年净利率20.18%。反观Lattice和Microsemi仍处于微利或亏损状态。
除了以上四种主要标准化电路,非标准化逻辑电路也在各种应用领域被大量应用,DSP是应用领域比较广泛的一种。
区别于FPGA适用于系统高速取样速率、高数据率、框图方式编程、处理任务固定或重复、使用定点。适合于高速采样频率下,特别是任务比较固定或重复的情况以及试制样机、系统开发的场合。DSP,也称数字信号处理器,适用于系统较低取样速率、低数据率、多条件操作、处理复杂的多算法任务、使用C语言编程、系统使用浮点。适合于较低采样速率下多条件进程、特别是复杂的多算法任务。DSP是由通用计算机中的CPU演变而来的,和工业控制计算机相比,DSP这种单片机具有多重优势:一是系统结构简单,使用方便,实现模块化;二是可靠性高,可保持长时间无故障工作;三是处理功能强,速度快;四是控制功能强;五是环境适应能力强。
DSP凭借卓越的性能,在图形图像处理,语音处理,信号处理等通信领域起到越来越重要的作用,被广泛应用于移动通信、电机控制、汽车毫米波雷达图像处理、测量仪表等领域。
图表:DSP重要应用领域
资料来源:公开资料整理
目前,全球范围内上生产DSP的大型厂商包括德州仪器、亚德诺半导体、恩智浦半导体。
图表:DSP主要公司介绍
资料来源:公开资料整理
从营业收入上看,全球DSP芯片主要供应商有TI、ADI、NXP,其中TI占有最大的市场份额。2018年TI全球营收157.84亿美元,。ADI公司在DSP芯片市场上也占有一定的份额,2018年营收62.01亿美元。飞思卡尔的前身为摩托罗拉半导体部门,后独立,2015年,恩智浦完成对飞思卡尔的收购,2018年恩智浦半导体全球营收94.07亿美金。从利润上来看,除了德州仪器保持稳定增长外,其余厂商均因市场竞争加剧利润率出现较大波动,2018年德州仪器净利率35.35%,亚德诺半导体24.12%,恩智浦半导体24.00%。
从产品上看,德州仪器的产品相比于其他公司拥有较大优势,一是德州仪器的DSP兼具价格低廉、简单易用、功能强大等特点。二是公司占据高端市场,产品种类齐全,包括用于数字控制系统的C2000系列;用于低功耗、手持设备、无线终端应用的C5000系列;还有面向高性能、多功能、复杂应用领域的C6000系列。三是覆盖应用领域广泛,既可以应用于国防军工领域,也应用于点钞机、生物识别、移动无线电等民用领域。亚德诺半导体公司的产品覆盖面没有德州仪器广泛,但是产品性能较为独特,公司追求极佳的功耗性能,Blackfin系列处理器包含动态功耗管理(DPM)功能,让开发者能实现根据程序的运行需要对所需的处理能力实现灵活的功耗配比。恩智浦半导体的DSP起步较晚,但目前的568xx系列兼具处理能力和多控制功能,广泛应用于直流无刷电机中。
依据DSP主流厂商产品的特点,可以预计未来DSP技术将向以下几个方面继续发展与更新:一是DSP芯核集成度越来越高,通过缩小DSP芯片尺寸,实现了DSP系统级的集成电路;二是为了面向复杂应用领域,可编程DSP芯片将成为未来主导;三是定点DSP仍占据主流,随着DSP定点运算器件成本的不断低,能耗越来越小的优势日渐明显,未来定点DSP芯片仍将是市场的主角。
总体上来看,通过对多种计算类芯片全方位对比,计算类芯片经过几十年的发展,CPU不再一枝独秀,多种新应用领域对复杂计算产生强大需求,由此产生专注于图像处理的芯片GPU;可以灵活编程,大幅缩短开发周期的芯片FPGA;进行了定制设计优化,在特定应用场景下功耗及量产成本较低的ASIC芯片;以及融合数字信号处理算法,专用于数字信号处理领域的DSP芯片等都得到了广泛的应用与快速的发展。
目前,计算类芯片已经形成了以CPU、GPU、FPGA、ASIC、DSP并行发展的新趋势,可以预见,随着未来5G通讯、传感器(MEMS)、可穿戴设备、物联网、工业机器人、VR/AR以及人工智能等新兴领域市场的发展扩大,对计算类芯片性能、技术、能耗等方面的需求将继续驱动各种计算类芯片在技术上得到更加快速的发展。
公司方面,计算类芯片细分行业普遍呈现高度集中化、头部企业垄断市场的格局。除ASIC领域传统电子巨头和电子初创新势力角力外,桌面CPU行业传统霸主英特尔与后起之秀AMD两强争霸,移动CPU领域高通地位短期内不可撼动,但长期来看,随着苹果、华为海思半导体等芯片研发能力较强、资本实力雄厚的公司逐步由内部销售转向外部销售,移动CPU市场格局将发生根本变化;GPU领域英伟达凭借先发优势持续压制AMD,趋势仍将延续。FPGA领域赛灵思依靠庞大的技术专利数量领先于全球其他公司;DSP领域德州仪器依靠产品价格低廉、简单易用、功能强大的优势领跑细分行业。
图表:多种计算类芯片的对比
资料来源:公开资料整理