半导体行业专题报告:云计算开启国产CPU和AI芯片的腾飞之路

就业难遇上用工荒,32万芯片人才缺口的“治愈良方”来了……

“每年大量的学生毕业于高校芯片设计专业,但直接上岗的人才却不多,主要是因为院校课程与技术应用存在脱节,无法直接将所学知识转化为实践。”大唐微电子软件与应用开发中心张同谈及企业端用工荒时直言。目前,大唐微电子为建立可持续的技术人才体系,只能通

获取报告请登录未来智库www.vzkoo.com。

看好服务器处理器市场增长及相关处理器国产化进程

算力成为新的生产力

信息技术革命以来,计算机产业和性能飞速提升,人类生产力发展已经进入算力时期,计 算能力成为这个时期的新型生产力。随着社会经济的发展,人均算力随之水涨船高,我们 看到算力与人均 GDP 之间具有高度相关性。算力是数字经济发展的核心动力,但即便是美 国等高算力国家,仍处于智能社会的起步阶段。算力提升是全球未来多年发展的重点之一, 而处理器核心技术的发展是提升算力的关键。

算力基础设施是“新基建”重要组成部分。2020 年 4 月 20 日,国家发改委在新闻发布会上首次明确新型基础设施的范围,把以数据中心、 智能计算中心为代表的算力基础设施明确纳入新型基础设施范围。随着政策的稳步推进和 数据中心等算力基础设施的建设,我们预计国内对服务器处理器芯片需求快速增长,为国 产处理器带来广阔的市场机遇。

服务器用处理器芯片是未来主要增长点

处理器及控制器为集成电路的重要组成部分,主要分为 MPU(Microprocessor,微处理器) 和 MCU(Microcontroller,微控制器),2019 年全球市场规模约 1,280 亿美元,占半导体行 业终端 4,100 亿美元销售额比重达到 31%。处理器芯片在电子产品中应用广泛,且主要分 为四类:

► 桌面 CPU+GPU:主要应用在台式机/笔记本中,2019 年全球市场规模约 380 亿美元;

► 服务器处理器芯片:主要应用于云服务器和数据中心,2019 年全球市场规模约 250 亿 美元;

► 移动端 SoC:主要应用于智能手机和基站等无线通信设备,2019 年全球市场规模约 450 亿美元;

► 嵌入式 MCU:主要应用于嵌入式场景,2019 年全球市场规模约 200 亿美元。

服务器和数据中心用处理器芯片以 CPU 为主,GPU 和 AI 专用芯片快速增长。根据我们的 测算,受益于全球范围内云计算和数据中心服务的快速增长,2019 年全球服务器级处理器 市场规模约 247 亿美元,预计 2024 年达到 577 亿美元,年复合增长率达到 18%。其中,服 务器 CPU 是市场主要需求,目前占据 85%市场份额,在未来五年预计保持 14%的年复合增 长率。而在 AI、HPC 等新兴需求的推动下,异构计算需求不断增长,我们认为数据中心对 并行、专用的计算能力需求增长将更为快速。据我们测算,目前服务器 GPU 占据服务器级 处理器市场 13%的市场份额,预期未来五年 CAGR 为 27%,2024 年市占率上升至 19%;云 端 AI 专用芯片将迎来爆发期,预计未来五年 CAGR 为 66%,从目前的 2%的市占率提高至 2024 年的 10%。

我们认为,受益于数据中心业务的发展,计算芯片的传统厂商 Intel、NVIDIA、AMD 的服务 器芯片业务收入预计迎来增长。随着数据中心的硬件需求向并行计算的倾斜,GPU 市场增 长率将超过 CPU 市场,拥有 GPU 业务的 NVIDIA 和 AMD 增长速度将超过 Intel。

看好服务器 CPU 及 AI 芯片的进口替代机会

根据我们的测算,2019 年,中国服务器市场规模达到 204 亿美元,预计未来五年 CAGR 为 17%;服务器市场中约 30%为服务器计算芯片,服务器芯片市场 2019 年规模达到 60 亿美 元,预计未来五年 CAGR 为 20%;其中云端 AI 芯片市场规模 12 亿美元,受益于数据中心的 建设,云端 AI 芯片市场加速增长,预计未来五年 CAGR 为 35%;除传统 CPU、GPU 外的云 端 AI 专用芯片市场规模 1.4 亿美元,由于数据中心厂商对芯片的定制化需求,云端 AI 专用 芯片是云端芯片的主要增长动力之一,预计未来五年 CAGR 为 59%。

目前消费级 CPU 和服务器 CPU 的国产化率均不足 1%。服务器软硬件架构呈“正金字塔” 结构,单机 CPU 个数多,并可配备加速卡,上层软件数量少,单一软件用户数多;而消费 级终端(PC 及笔记本)则呈“倒金字塔结构”,单机 CPU 个数少,不配备加速卡,更需要 单一 CPU 适配上层多个软件。我们更加看好国产 CPU 及 AI 芯片在服务器市场的替代机会, 原因如下:

► 由于需要更通用的处理能力,单一 CPU 需要支持海量软件。由于历史原因,过去几十 年的发展过程中,所有的消费级软件几乎都基于 Windows 平台研发,因此消费市场被 “X86+Windows+Intel”生态垄断,除 Intel 和 AMD 外厂商几乎没有出货量。在现有生 态已经充分建立的情况下,国产 CPU 获得 X86 授权不易,绕过 X86 生态又较困难,除 兆芯 CPU 落地比较顺利外,采用其余架构的 CPU 在 PC 侧突破之路仍然艰辛。

► 而对于服务器处理器来讲,第一,存在仅运行少量专用软件的政企服务器等场景,X86 以外架构对于软件数少、而单一用户数相对较多的应用做适配性价比高,我们认为国 产 CPU 易于从该场景切入市场,获得用户数和软件生态的原始积累,并在未来持续巩 固这一过程;第二,在云计算蓬勃发展的同时,异构计算市场也乘风得到了长足的发 展。对芯片设计企业而言,过去进入服务器计算芯片市场只有通过有竞争力的 X86 CPU, 而现在 GPU/FPGA/AI 芯片/各类架构 CPU 等多种计算芯片均在服务器中得到广泛应用, 服务器计算芯片市场进入壁垒大幅降低,为创业企业提供了发展机遇。

国产 CPU 生态链

国产 CPU 的发展是一个系统工程,由于涉及了 CPU 架构的变化,因此需要产业链生态的全 面支持。目前各类 CPU 均已经实现了一定批量的发货,形成了初步生态。我们总结产业链 核心公司如下。

► 服务器

浪潮信息(000977.SZ)是全球领先的服务器供应商。根据 Gartner,2019 年浪潮 x86 服务器市占率超 10%,蝉联全球第三,成为全球前五排名中增速最高的服务器厂商, 且在全球市场收缩的背景下依然实现增长。在中国市场,浪潮 x86服务器市占率超 34%。 浪潮信息拥有 2000 余人的研发团队,是国内主流云计算厂商的最重要的服务器合作伙 伴。同时其兄弟公司浪潮云支持国产 CPU 的发展,不断推出各类基于国产 CPU 的云服 务。

中科曙光(603019.SH)主要经营高性能计算系统,根据 2009-2019 年《中国高性能计 算机性能 TOP100 排行榜》,曙光十次蝉联数量份额第一名。曙光积极投入国产 CPU 研 发和应用:参股子公司天津海光与 AMD 合作推出 x86 架构的海光系列 CPU,并成功应 用到曙光服务器中;曙光从龙芯中科采购龙芯 CPU 及其主板配件,2020 年预计采购额 达到 3 亿元。曙光在国产 CPU 服务器将保持出货量的快速增长,增强公司高性能计算 的龙头地位。

华为成立了 Cloud&AI BG,推出华为云服务,自推出以来份额快速提升至国内前三。公 司自 2004 年起不断构建自身的多样计算能力,推出鲲鹏生态 ARM 计算芯片和 ARM 平 台的泰山服务器、AI 平台的 Atlas 产品系列和 X86 平台的 FusionServer。2019 年计算产 品发货量达到 96.3 万套,同比增长 8%。未来公司将持续投入 ARM 架构的鲲鹏系列服 务器芯片研发与迭代升级,与下游厂商合作规划鲲鹏计算产业计划,目标形成全行业、 全场景的鲲鹏产业体系。

联想集团(0992.HK)是全球前五服务器供应商,在收购 IBM 服务器业务后能力进一步 提升,在国内的政企市场和海外云计算市场保持较高份额,服务包括微软等大型云计 算厂商。联想积极参与服务器产业链国产化进程,采用龙芯、兆芯、申威、飞腾等多 种国产 CPU 开发出国产服务器整机,和下游操作系统、数据库等国产厂商积极合作, 推动国产软硬件的落地应用。

► 云服务

国内的云计算市场从 IaaS、PaaS 到 SaaS,主要基于 X86 Intel 架构实现。云计算的架构 需要虚拟化技术支持,而目前非 X86 平台的虚拟化技术仍较为初期。基于 X86 平台的 云服务市场较高的份额厂商包括阿里云、腾讯云、华为云、金山云(KC US)、Ucloud (688158 CN)等。

目前提供龙芯云计算服务的云厂商包括浪潮云、希云等,阿里云、腾讯云、曙光的龙 芯云服务正在搭建中。另外龙芯支持以 Spice 协议和 QXL 虚拟图形为基础的云桌面应 用,硬件厂商星网锐捷基于龙芯做了云桌面的适配。华为 ARM 和飞腾也都可以提供云 服务。其中华为云上线了 ARM 服务器服务;飞腾同腾讯云、浪潮云、中科曙光等平台 实现对接。兆芯和海光作为 X86 架构本身对云计算支持较好。

► 操作系统

由于开源 Linux 系统对 RISC 指令集进行了支持,因此基于 Linux 的操作系统和 RISC CPU 可以实现适配。最为典型的操作系统适配为 ARM 和安卓系统的适配,目前拥有最好的 生态。Linux 在国内的发行版中,麒麟和 Deepin 是国内较成熟的版本。

中国软件(600536 CH)整合了中标软件和天津麒麟,设立了新的操作系统公司。两家 子公司共同获得了 2018 年国家科技进步一等奖,麒麟操作系统同时支持包括飞腾、龙 芯、兆芯、申威、海光、鲲鹏在内的主流国产芯片。麒麟软件是国产系统的标杆,近 期发布了“傲天”计划,未来将实现百亿级资金投入,打造万人规模的自主操作系统团 队,打造桌面与服务器操作系统、云操作系统和嵌入式操作系统三大类产品。

诚迈科技(300598 CH)子公司统信软件的产品 Deepin 和 UOS 目前在国内市占率较高。 统信软件由国内领先的操作系统厂商 2019 年联合成立,支持国产 CPU 的发展,同时 与国内外主流整机厂商和数百家国内外软件厂商展开全方位合作,力争十年内成为全 球领先的基础软件供应商。

数据库

全球数据库主要公司如 Oracle、SAP HANA、微软、IBM 等主要支持 X86 架构。国产关 系型数据库大多数参考开源 MySQL、PostgreSQL 数据库及其变种;大数据平台,多源 自或直接整合开源大数据生态组件;纯自研的国产数据库较少。但国产数据库对国内 CPU 的支持力度较强。主要厂商包括:

武汉达梦成立于 2000 年,为中国电子旗下基础软件企业,先后完成近 60 项国家级或 省部级科研开发项目,产品成功应用于金融、电力等三十多个行业领域。

人大金仓成立于 1999 年,是我国最早一批开发数据库的公司之一,先后承担了多项国 家重大专项,产品广泛应用于二十多个重点行业,完成装机部署超过 50 万套,遍布全 国近 3000 个县市。

南大通用成立于 2004 年,经过多年发展,已经形成了在大规模、高性能、分布式、高 安全的数据存储、管理和应用方面的技术储备,拥有来自金融、电信、政务、国防、 企事业等领域的上万家客户。

阿里巴巴集团从云计算出发,推出过多款世界级数据库产品。在国际处理性能委员会 TPC 的 TPC-C 测试中,蚂蚁金服自研的金融级数据库 OceanBase 性能数据达到 7.07 亿 tpmC,保持世界第一的地位;在 TPC 的另一项测试 TPC-DS 中,阿里云自研云原生数 据仓库 AnalyticDB 以 1489 万的性能指标刷新了世界纪录,比第二名提升近 30%以上; 2020 年 6 月,阿里云推出新一代云原生数据库 PolarDB-X,可支持千万级并发规模和 100PB 量级的海量存储,稳定支撑天猫双十一活动顺利进行。

华为已推出的企业级 AI-Native分布式数据库 GaussDB,支持 PB级别数据量的处理能力, 可以用于金融、政府、电信、大企业等行业业务;华为另一款可大规模横向扩展的智 能分布式存储产品 FusionStorage,深度适配优化鲲鹏系列处理器,单集群横向扩展最大可达 4096 个节点,支持千万级 IOPS,时延响应低至 0.5 毫秒,提供 99.9999%的方 案级可靠性,可应用于金融互联网服务、运营商云服务、政务云、城市云等。

中兴通讯推出的自研金融级交易型分布式数据 GoldenDB,在 2019 年成功应用于中信 银行的核心系统,是中国国内唯一一个完成在大型银行核心业务商用的数据库产品。

中间件

中间件位于操作系统、网络和数据库的上层、应用软件的下层,为上层应用软件提供 运行与开发环境。根据 CCW Research 的研究,IBM 和 Oracle 分别占据了 22.2%和 16.2% 的中国市场,本土中间件厂商市场规模占比仅为 35%左右。但国产中间件市场分散, 主要玩家包括东方通、保兰德、金蝶天燕、中创股份等。

东方通是国产中间件的开拓者和领导者,以政府、电信运营商、金融、交 通等领域客户为主,2019 年电信和政府行业占营收 83%。东方通是华为鲲鹏计算产业 的深度合作伙伴,与华为在鲲鹏计算产业中合作共赢,推进国产化中间件在金融、交 通等市场中突破 IBM、Oracle 的垄断格局。

宝兰德以电信行业起步,长期深耕电信核心客户,经过多年的潜心发展, 公司产品已在中国移动 12 个省份的核心业务系统实现对 IBM、Oracle 产品的替代。

中创软件成立于 2002 年,面向网络应用提供国产中间件基础软件产品及服务,已在物 联网、云计算、大数据、移动互联网等领域研发出具有自主知识产权的解决方案和软 件产品。中创软件中间件产品作为国家科技重大专项成果,在金融、交通、能源、电 信、工业、教育等重点行业和关键领域,得到推广应用。

国产 CPU 的发展现状

指令集架构是 CPU 设计的上游,不同的指令集架构授权壁垒和生态环境差异很大。但通常 来说,生态环境越好的架构,专利和授权壁垒越高,而相对开放的指令集,缺乏完善的生 态配备。目前市场主流架构可分为四类:具有复杂指令集的 x86 架构、精简指令集的 ARM 架构、新推出的 RISC-V 架构,以及其他 RISC 类 MIPS/Power/Alpha/SPARC 等架构。

X86 架构(海光、兆芯):专利授权壁垒高但生态完备,国产芯片与海外相比仍有差距

受历史发展因素影响,X86 架构应用最为广泛,系统和软件支持种类最多,生态较为完备。 目前市场上绝大部分台式机和笔记本、以及超过 90%的服务器均使用 X86 架构 CPU,市场 基本被 Wintel 联盟垄断。根据我们的产业链调研,英特尔和 AMD 拥有绝大多数 X86 的技 术专利,占比分别为 70%和 30%左右,两家公司也存在大量的交叉授权,而几乎不对外授 权。我们认为国产 CPU 若采用 X86 架构进行进口替代,需要通过与海外拥有授权的企业建 立合资公司来使用 X86 授权生产芯片。目前我国的兆芯(桌面 CPU)、海光(服务器 CPU) 两品牌产品已经量产出货,并获得了规模性客户认可。

► 兆芯是上海联合投资(持股比例 85%,上海市国资委全资子公司)以及台湾威盛(即 VIA,直接和简介持股比例合计 15%)的合资企业。兆芯通过 VIA 使用 X86 架构的授权, 基于 VIA 版本的 X86 指令集自主研发扩展升级,开发桌面 CPU。与英特尔 2017 年推出 的第七代 i5-7400 中端处理器对照,兆芯目前推出的最新 KX6880 CPU 单核性能相比持 平,多核性能更强。

► 海光 CPU 由成都海光集成电路设计有限公司设计,交由 GlobalFoundries 代工。成都海 光股东为天津海光(持股 49%)及 AMD(持股 51%),其中天津海光是中科曙光控股36%的子公司。成都海光通过与 AMD 合作使用 x86 的 Zen1 架构的授权设计芯片,并 正基于 Zen1 架构展开自研指令集工作。海光处理器主要面向商用服务器市场,2020 年公司最新推出的 C86 3185 处理器拥有 8 个核心,单核性能与 2017 年 AMD 推出的中 端处理器锐龙 5-1400 接近。根据中科曙光年报披露,其向海光采购的 CPU 金额在 2019 年达到 2.4 亿元,海光 CPU 未来发展市场可期。

ARM 架构(华为鲲鹏、飞腾):充分适应服务器多核心高并发场景,但生态环境仍需完善

ARM 架构主要应用在移动端和服务器市场。由于 ARM 架构高并发、低功耗、高集成的特点, 移动端和 IoT 市场为 ARM 所垄断。高通、海思、苹果等移动端处理器全部基于 ARM 架构开 发,移动互联网的海量软件也大多基于 ARM 开发。云端数据中心的兴起,产生了对服务器 CPU 高并发、分布式和低能耗的需求,数据中心与移动端维持架构相同也能实现应用开发、 部署和运行的无缝协同,大幅降低开发者的难度。除 X86 架构外,ARM 占据服务器 CPU 市 场份额最大,我们预计未来 ARM 的服务器市场份额将进一步提升。ARM 相比 X86 授权更为 开放,已经在服务器市场提供正式公版授权,更有利于 CPU 厂商进行投资和适配工作,但 未来仍有限制国产厂商的可能性。华为和飞腾均获得 ARM V8 永久授权,二者均已推出相 应的服务器 CPU。

ARM 服务器的生态环境已初步建立,Linux、Windows Server 等大型操作系统,docker、VMware、 KVM、Kubernetes 等容器化和虚拟化工具,CUDA、Java 等平台都已支持 ARM 架构,但仍有 海量适配工作需要完成,ARM 服务器应用场景的拓展仍需大量投入。我国本土的华为和飞 腾积极布局 ARM 服务器生态,分别推出鲲鹏计算产业计划和 PK 体系,建设基于 ARM 架构 的国产服务器生态环境。

► 华为鲲鹏系列芯片由全其全资子公司海思半导体全自主设计,目前最新的 CPU 产品为 基于 ARM V8 架构授权研发的鲲鹏 920 芯片。鲲鹏 920 采用台积电 7nm 工艺打造,内 建 64 个内核,主频达到 2.6GHz,配备 8 通道 DDR4 内存。在鲲鹏 920 发布同时,华为 也发布了内置鲲鹏 920 芯片的泰山系列服务器作为打入市场的配套产品。

生态方面,华为公司聚焦于发展基于 ARM 架构的鲲鹏处理器的核心能力,通过战略性、 长周期的研发投入,吸纳全球计算产业的优秀人才和先进技术,借助鲲鹏计算产业打 造“新基建”底座。为完成从关键行业试点到全行业建设目标,华为计划将鲲鹏计算 产业计划分成三个阶段,最终形成全行业、全场景的产业体系。

► 飞腾 CPU 由天津飞腾信息技术有限公司设计。天津飞腾主要股东包括中国长城 (000066.SZ,持股比例 31.5%,控股股东为中国电子)以及天津先进技术研究院(持 股比例 30%)。公司通过购买 ARM V8 授权来设计 CPU,其最新产品为 FT-2000/4,主要 面向轻量级服务器和桌面、便携终端等应用场景,相比上一代 FT-1500 产品性能提升 一倍,功耗降低 33%。我们认为,公司目前主要用户是政府及企业客户。借助中国电 子旗下的长城品牌与服务器及 PC 捆绑销售,飞腾 CPU 逐渐开始获得特定客户群认可。 根据中国长城公告披露,2018 年天津飞腾实现收入 6,369 万元人民币,净利润 170 万 元人民币。

在生态上,飞腾处理器与麒麟操作系统同为中国电子集团旗下产品,两者深度适配, 组成“PK”(Phytium+Kylin)国产体系。目前中国电子集团已推出基于办公和事务处理 场景的 PK 体系 1.0 标准,并有多种应用落地。基于最新型飞腾处理器的 PK 2.0 体系在 第六届世界互联网大会上首次被提出,该体系贯通 PC 互联网、移动互联网、物联网,将在移动、云、虚拟化、大数据、物联网、人工智能等领域构建自主、安全、可靠的 “中国体系”。

RISC-V(阿里平头哥):全新开源指令集,IoT 切入市场,生态尚需构建

RISC-V 是 2010 年新出现的开源精简指令集架构,架构设计上没有历史包袱,采用的理念和 方法较为先进。和主流架构 x86/ARM 相比,RISC-V 架构架构篇幅更少,基本指令集更少, 支持模块化和拓展性,开源免费,满足差异化和定制化的需求。但 RISC-V 架构出现时间晚, 适配软件和工具方面沉淀不足,生态环境尚需构建。目前国内芯片厂商中,阿里平头哥基 于 RISC-V 架构推出了数据中心和嵌入式 IoT 芯片产品。

相比于移动端、PC 等消费终端应用,IoT 应用场景繁多,对处理器的需求较为碎片化,同 时对功耗有着较高要求。我们认为,兼具精简和灵活的 RISC-V 架构,满足 IoT 对处理器的 需求,能够从 IoT 市场切入,从而不断扩大市场份额。随着 RISC-V 基金会成员的快速增长, 配套软件工具等生态环境不断完善,RISC-V 已经开始加速落地。

“芯片之神”离开英特尔,马斯克评价能开发“全世界最好的芯片”

吉姆·凯勒认为斯拉自动驾驶技术“短期内令人失望,长期仍充满惊喜”。 吉姆·凯勒(Jim Keller),来源:英特尔 作者 | 牛耕 编辑 | 吴岩 6月11日,传奇芯片架构师吉姆·凯勒(Jim Keller)宣布从英特尔辞职。此时距离他离开特斯拉自动驾驶副总裁职位,加入

► 平头哥半导体有限公司是阿里全资的半导体芯片业务主体,主要针对下一代云端一体 芯片新型架构开发数据中心和嵌入式 IoT 芯片产品,拥有面向行业应用以 CPU、芯片 平台、OS 及算法为核心的全栈技术。目前发布产品包括玄铁系列 RISC-V 处理器、无剑 SoC 芯片设计平台、含光 AI 芯片等,在以下六大行业领域得到应用。

► 无线接入:平头哥解决方案集成低功耗 RF 芯片、AliOS、安全技术,为 IoT 智能硬件的 数据接入提供支持。

► 语音识别:广泛应用在医疗、教育、家居等领域。平头哥解决方案由语音增强处理器、 AliOS 和语音应用框架组成,为语音智能硬件提供从芯片设计到终端产品研发的全栈技 术。

► 智能视觉:广泛应用于智慧交通、自动驾驶、公共安全等领域。平头哥解决方案打造 低功耗轻量级视觉、终端实时计算和边缘计算等多层次芯片和应用方案。

► 智能家电:平头哥解决方案基于低功耗 MCU 芯片和电机控制算法,结合无线接入、语 音/视觉 AI 技术,为智能化家居落地提供服务。

► 工业控制:平头哥解决方案基于实时处理器、可靠芯片平台、操作系统和组件化控制 模块,支持多种实时现场,为工业控制系统可靠运行保驾护航。

► 物联网安全:平头哥物联网安全解决方案在芯片架构、操作系统和云服务技术链路上 提供存储加扰、数据加密、可信引导等安全基础设施,为芯片企业和终端厂家提供快 速的安全能力。

MIPS(龙芯):架构更新较慢,生态由国产厂商龙芯继承

MIPS 架构曾在移动市场拥有一定份额,但目前更新较缓慢。在国内厂商中,龙芯获得了 MIPS 的永久授权,继承了其既有生态,并基于 MIPS 发布了拥有自主版权的 LoongISA 指令 集架构和 IP 内核。从自研的指令集架构出发,龙芯推出了面向不同应用场景的龙芯系列处 理器。在面向桌面和服务器的龙芯 3 号 64 位多核系列 CPU 的基础上,龙芯积极参与国际开 源软件社区建设,与下游客户深度合作,形成了较为完整的的服务器产业链,各基础软硬 件产品均有国内厂商推出适配产品。龙芯处理器配套产品在主要信息技术领域形成突破, 已获得许多要求国产自主和信息安全的终端客户认可。目前公司最新产品 3A4000/3B4000 的性能与 AMD 28nm 工艺的最末代产品相当,财务状况方面,龙芯董事长胡伟武指出,公 司 2019 销售收入相比 2018 年实现 2.2 倍增长,净利润超过 1 亿元。

X86 替代最先落地,看好未来大厂推动下 ARM/RISC-V 架构处理器的国产化机会

我们对国产 CPU 市场发展的主要观点汇总如下。

第一,按架构来看:

► X86 架构目前拥有较为成熟的生态,尽管在授权方面受到一些限制,但短期内 X86 是 国产 CPU 替代落地相对顺利的路径;

► ARM 和 RISC-V 架构同为不断更新且持续迭代的精简指令集,适应未来服务器多核心、 高并发、低功耗的计算应用场景。ARM 架构开放公版授权,RISC-V 架构开源且自由使 用,相关国内企业可以持续的获得最新的 IP,不断优化学习曲线加速追赶垄断厂商;

第二,按企业来看:

► 海光通过 AMD 的 Zen 1 架构授权设计服务器 CPU 产品,在 Dhyana 处理器量产后,迅 速借助现有的完善生态获得下游客户认可。通过我们对近期运营商服务器公开招标数 据整理,目前只有海光及鲲鹏 CPU 入围,且海光份额更胜一筹。例如,2019 年 10 月, 中国移动公布的共计 80,676 台服务器中标情况中,在第 6 标包“均衡性服务器 3 档” (12,240 台)中,中科可控系列服务器中标份额达 50%。;2020 年 5 月,根据中国电 信公告的服务器集采项目情况,其中将集采 11,185 台装备 CPU 类型为鲲鹏 920 系列 处理器或海光 Dhyana 系列处理器。我们认为,即便 X86 架构授权存在较高的壁垒, 但相关国产 CPU 产品仍然近期是进口替代的主力军之一。

► 华为通过海思半导体推行 ARM 架构的芯片多年,有强大的研发团队支持,硬件性能相 对可靠。同时我们认为,在鲲鹏计算产业链的生态环境初步建立的情况下,大厂更容 易获得政府支持及市场信任,能以更低成本、更快捷的方式获得更多软件的适配。在 终端数量不断提升的情境下,我们认为将会有越来越多的软件厂商有意愿去适配鲲鹏 处理器,新的 CPU 生态有望在正向循环的状态下建立。发展现状来看,如上文所述, 在近一年内中移动、中国电信的大规模服务器集采中,采用华为鲲鹏系列的产品已经 实现一定规模的中标。

► 阿里旗下的阿里云是国内最大的云服务商,在云端已经有丰富的应用生态资源,但阿 里云服务的核心硬件仍然是从英特尔、NVIDIA 和 ARM 外购为主,而新应用的蓬勃发展 让数据中心有更多定制化需求,阿里云研发定制自己的数据中心处理器是必然趋势。 阿里旗下平头哥专注于服务器的硬件 AI 算力提升,顺势推出了 RISC-V 架构 CPU 及云 端加速卡芯片。从深度参与基础云服务开始,平头哥利用阿里云中积累的中上层技术 为底层硬件产品不断拓展应用空间,我们认为平头哥芯片未来有望成为阿里云生态的 核心基础,打造丰富的生态体系。

AI 芯片市场发展情况更新

通用型处理器为了满足更广泛的应用场景,内部有大量复杂的处理逻辑,这些逻辑在特定 场景下能效、性价比不高。随着人工智能的快速发展和场景落地,具有海量并行计算能力、 能够加速 AI 计算的专业化 AI 芯片应运而生。AI 芯片按产业链可分为 IP 授权商、AI 芯片设 计公司和晶圆代工厂。

► 以承担任务的不同划分,可分为利用大数据构建复杂的人工智能模型的训练芯片,以 及利用构建好的模型和新数据进行预测的推断芯片。

► 训练芯片注重绝对的算力,目前以及未来很长一段时间内,一般只部署在云端。而推 断芯片更注重综合指标,能耗、延时、成本等都要考虑在内。推断芯片多部署在终端, 如安防、手机、IoT 的边缘推断芯片和汽车的自动驾驶推断芯片。

► AI 芯片对单位算力的功耗有很高要求,一般采用 14nm/16nm 以下先进工艺生产。 NVIDIA、Xilinx 等多家芯片厂商与台积电合作,已推出多款基于 7nm 工艺的 AI 芯片。

云端 AI 芯片市场未来五年预期 4.7 倍增长,2024 年达到 214 亿美元规模。目前,已有数家 上市公司参与 AI 芯片市场,芯片的市场渗透率也在不断提升。据此,我们估算 2019 年云 端 AI 芯片市场达到 46 亿美元,未来五年将保持 36%的年化增长率。云端训练芯片当前占 据 50%以上的市场规模,但随着终端应用的加速落地,云端推断芯片市场规模预计将于 2021 年超过训练芯片。我们对细分市场的预测如下:

► 云端训练芯片市场规模在 2024 年将达到 88 亿美元,CAGR~26%。2019 年市场 90%以 上份额由 NVIDIA 占据,Google、Intel、AMD 等国际厂商正在试图挑战 NVIDIA 的市场 地位,预计未来五年 NVIDIA 的市场份额将有所下降。训练芯片强调绝对计算能力,同 时对可拓展性和快速读写也有较高要求,市场门槛较高。

► 云端推断芯片市场规模在 2024 年将达到 126 亿美元,CAGR~48%。NVIDIA 仍是推断芯 片市场的领导者,但 2019 年市场份额只有 19%,Google、Intel、AMD 和一些初创公司 抢占了剩余市场份额。推断芯片需要考虑功耗、尺寸、散热等综合性能,定制化程度 高,我们认为推断芯片市场更适合初创公司进入。

云端 AI 芯片:产品综合能力要求突出,行业竞争格局开始清晰

云端 AI 芯片实际产品化过程中,对公司的硬件、软件、通信与接口等各方面综合实力有较 高要求,壁垒较高。

► 硬件:训练芯片须支持具有较长字长的浮点数或定点数,以满足其高精度的要求,同 时要求高性能、可拓展性强。推断芯片因应用场景的多样性,其需求和约束呈现出多 样化的特点,高能效、低时延、高吞吐、安全和硬件成本等是推断芯片最重要的考虑 因素,而模型的准确度和数据精度则可以依具体情况适当降低。

► 软件:通常需要自建软件平台,平台要求支持 TensorFlow、PyTorch、MXNet、ONNX、 Caffe 等主流深度学习框架。

► 通信与接口:对于云端 AI 训练芯片而言,单芯片除了强大的计算能力还要有良好的扩 展性,存储器部分需要支持快速读写,同时对内存数量、访问内存的带宽和内存管理 方法的要求也很高。

云端 AI 芯片行业开始洗牌,已出现公司破产倒闭(Wave Computing),三类玩家的竞争格 局开始清晰。

► 传统的计算芯片巨头:NVIDIA、Intel、高通;

► 云厂商自研或扶持的厂商:阿里(含光 800)、亚马逊(Graviton)、腾讯(投资燧原科 技)、百度(昆仑)、Google(TPU)、华为海思(昇腾 910);

► 独立第三方。

边缘 AI 芯片:各类应用百花齐放,竞争格局分散

边缘 AI 芯片落地加速,各类应用场景丰富多样,不同细分市场下的竞争格局较分散。

手机 AI 芯片在相机模组、语音助手、电池管理等方面提供硬件加速支持。我们认为,手机 AI 芯片的主要作用是提升芯片附加价值与产品单价。苹果、华为、三星等传统手机厂商采 用芯片+整机垂直商业模式,加入 AI 芯片后手机整机售价走高,贡献更多营收。高通、联 发科等独立芯片供应商则受益于芯片自身 ASP 的提升。

安防边缘推断芯片实现监控系统中视频流结构化数据提取,减轻云端压力,提高工作效率。 针对不同的应用场景需求,传统视频解码芯片厂商华为海思、安霸已推出多款支持 AI 的安防边缘推断芯片,NVIDIA 和 Intel 旗下的 Movidius 也已发布多款安防 AI 芯片。我们认为, 虽然安防 AI 芯片市场格局相对稳定,现有供应商与下游客户达成了长期稳定合作,但在中 美贸易摩擦的背景下,初创公司或正面临新的历史机遇。

车载推断芯片是自动驾驶技术不可或缺的一部分,为环境感知、避障规划等应用提供硬件 支持。传统车载半导体供应商 TI、NXP、Mobileye(被 Intel 收购)和传统硬件厂商 NVIDIA 纷纷涉足自动驾驶业务,推出各自的自动驾驶平台。国内公司中,地平线的征程二代(支 持 ADAS)已经在长安 UNI-T 实现前装量产,黑芝麻的华山二号(支持 L3)已成功流片并给 客户送样。我们认为,虽然高等级自动驾驶的落地已经没有明确的时间表,但 L2/L2+级自 动驾驶系统,将在 2020 年加速渗透量产乘用车,提供 AEB、ACC、LKA、DMS 等功能,智能 汽车芯片企业或将受益。我们看到,中国本土车企正积极拥抱自动驾驶,这也给地平线、 黑芝麻等深入自动驾驶场景、软硬件结合能力突出的中国智能驾驶芯片企业带来了发展机 遇。

IoT 边缘推断芯片推动人机交互模式的变革。在 AIoT 时代,每个设备都需要配备 AIoT 芯片, 具备一定的感知、推断以及决策功能。我们认为,AIoT 芯片需求较大,但市场差异化明显。 相比绝对的算力和性能,芯片客户更强调对应用场景的深入理解,芯片厂商需要针对实际 场景进行深度迭代优化,因此 AIoT 市场最适合初创公司。国内 AI 芯片初创公司多从 AIoT 入场,如以语音识别技术见长的云知声和思必驰专注于 IoT 设备的语音交互系统,以芯片 设计起家的瑞芯微和嘉楠科技注重自研芯片在智能家居和智能零售领域的应用。

主要国产 AI 芯片企业介绍

地平线:专注边缘 AI 芯片,提供性能功耗领先的智能驾驶芯片

地平线成立于 2015 年,是一家专注于边缘 AI 芯片和相关算法的初创公司,主要面向智能 驾驶和 AIoT 两大应用场景,提供软硬件产品和解决方案。地平线主要合作伙伴包括长安、 红旗、奥迪、上汽、广汽、比亚迪等多家 Tier 1 汽车厂商。与国际领先的智能驾驶芯片厂 商相比,地平线采用创新的自研先进架构,在处理器的性能效率和迭代速度上保持领先。

2019 年 9 月,地平线发布征程二代 AI 芯片,征程二代可提供超过 4 TOPS 的等效算力,实 现最大 30fps 4K 的输入分辨率,典型功耗仅 2W,并且通过了汽车电子可靠性标准 AEC-Q100 认证,成为国内首款车规级 AI 芯片,可满足 L3 级别以上的智能驾驶。征程二代已经成功 流片,并在高等级自动驾驶、辅助驾驶、多模交互等方向获得 5 个国家的客户的前装定点。 2020 年,地平线与长安汽车合作,实现车规级 AI 芯片的前装量产。

燧原科技:专注云端 AI 训练芯片,与腾讯云服务深度合作

燧原科技于 2018 年 3 月在上海成立,主要产品是云端人工智能训练芯片以及配套软件。公 司研发团队的主要成员都拥有 15 年以上的高端芯片及相关软件生态系统的开发及量产经 验,有着丰富的工程和产品化实战经历,成功开发并量产过多颗大型芯片。2019 年 12 月, 公司发布了首款面向云端数据中心的 AI 训练芯片“邃思”、加速卡“云燧 T10”及计算和编 程平台“驭算”。邃思芯片面向数据中心,其 FP32 算力达 22 TFLOPS,国内率先支持 BF16 精度,算力达 86 TFLOPS;云邃 T10 加速卡功耗 225W,FP32 算力达 20 TFLOPS,BF16 算力 达 80 TFLOPS,每瓦算力达 0.09 TFLOPS/W;驭算平台针对邃思芯片深度优化,支持主流深 度学习框架,包括常用的算子数据库和高效灵活的调度机制,可提供视觉、自动驾驶、大 数据、高性能计算等多领域的解决方案。

产品落地方面,腾讯作为国内第二大云服务厂商和燧原科技的战略投资方,为燧原科技提 供了广泛的应用场景。目前燧原正与腾讯一起针对 AI 的多种应用场景进行深度合作。未来 规划上,燧原科技有三大目标市场,一是云服务提供商,包括公有云、私有云、混合云等, 这类企业有大量的流量和数据,需要训练算法加速 AI 相关应用;二是专注于金融、保险、 医疗、交通等领域的行业服务商;三是 AI 超算中心和智慧城市等领域。

黑芝麻:致力于 AI 自动驾驶计算平台,与多家一线车企合作

黑芝麻智能科技成立于 2016 年 8 月,致力于开发全球领先的人工智能自动驾驶计算平台, 目前已发布并量产了“华山一号”自动驾驶芯片 A500,支持 L2/2.5 级别自动驾驶,面向 L3 及以上级别的 AI 车规级芯片“华山二号”也已也成功流片并给客户送样。

黑芝麻目前已与博世签署战略合作框架协议,在智能网联汽车及自动驾驶领域展开合作。 国内一线厂方面,黑芝麻同上汽、一汽、比亚迪、蔚来等已开展业务合作,其车端图像感 知产品将应用于今年数个量产车型。同时,黑芝麻于 2018 年加入中国智能网联汽车产业创 新联盟,提供五大平台中的智能网联基础计算平台。

嘉楠科技:ASIC 区块链计算设备与 RISC-V 架构边缘 AI 芯片

嘉楠科技成立于 2013 年,主要产品为 AI 芯片和比特币矿机。

► 嘉楠是全球比特币矿机的第二大厂商。截止 2019 年 6 月,嘉楠出售的比特币矿机占全 球出售的所有比特币矿机的总算力的 22%。

► 公司在 ASIC设计方面拥有先进技术积累,包括算法开发和优化,标准单元设计和优化, 低电压和高能效操作,高性能设计系统和散热等技术,截止 2019 年 9 月,已累计生产 了 1.5 亿片 ASIC。

► 2018 年,嘉楠交付基于 RISC-V 架构的第一款商用边缘 AI 芯片勘智 K210。该芯片具有 机器视觉和机器听觉两大功能,可应用于智能家居、智能能耗、智能零售和智能驾驶 等多种场景。

……

(报告观点属于原作者,仅供参考。报告来源:中金公司)

获取报告请登录未来智库www.vzkoo.com。

立即登录请点击:「链接」

本文源自头条号:未来智库如有侵权请联系删除

半导体之国产基带芯片行业深度研究:方向与格局

获取报告请登录未来智库www.vzkoo.com。 报告摘要: 一、基带芯片行业概述 在每个移动通讯设备中都有一个基带芯片,它是一种用于无线电传输和接收数据的数字芯片。 基带芯片主要分为5个子模块:CPU处理器、信道编码器、数字信号处理器、调制解调器、 接口模块