国产 AI 算力芯片全景图
(报告作者:民生证券研究所分析师 方竞)
根据芯片的类别,AI 算力芯片主要包括 GPU、FPGA,以及以 TPU、VPU 为代表的 ASIC 芯片,其中以 GPU 用量最大,据 IDC 数据,预计到 2025 年 GPU 仍将占据 AI 芯片 8 成市场份额。

AI 芯片赋能算力基石,英伟达垄断全球市场。AI 算力芯片主要包括 GPU、FPGA,以及以 VPU、TPU 为代表的 ASIC 芯片。其中以 GPU 用量最大,据 IDC 数据,预计到 2025 年 GPU 仍将占据 AI 芯片 8 成市场份额。然而,相较传统图形 GPU,通用型算力 GPU 在芯片架构上缩减了图形图像显示、渲染等功能实现,具有更优的计算能效比,因而被广泛应用于人工智能模型训练、推理领域。

根据在网络中的位置,AI 芯片可以分为云端 AI 芯片 、边缘和终端 AI 芯片;根据其在实践中的目标,可分为训练( training )芯片和推理( inference )芯片。云端主要部署高算力的 AI 训练芯片和推理芯片,承担训练和推理任务,具体有智能数据分析、模型训练任务和部分对传输带宽要求比高的推理任务;边缘和终端主要部署推理芯片,承担推理任务,需要独立完成数据收集、环境感知、人机交互及部分推理决策控制任务。

由于英伟达 GPU 产品线丰富、产品性能顶尖、开发生态成熟,目前全球 AI 算力芯片市场仍由英伟达垄断。根据中国信通院的数据,2021 年 Q4 英伟达占据了全球 95.7%的 GPU 算力芯片市场份额,因此,英伟达数据中心业务营收增速可以较好地反应全球 AI 芯片市场增速。2023 财年,英伟达数据中心营收达到 150 亿美元,同比增长 41%,FY2017-FY2023 复合增速达 63%,表明全球 AI 芯片市场规模保持高速增长。

评价 AI 芯片的指标主要包括算力、功耗、面积、精度、可扩展性等,其中算力、功耗、面积(PPA)是评价 AI 芯片性能的核心指标:
(1)算力:衡量 AI 芯片算力大小的常用单位为 TOPS 或者 TFLOS,两者分别代表芯片每秒能进行多少万亿次定点运算和浮点运算,运算数据的类型通常有整型 8 比特(INT8)、单精度 32 比特(FP32)等。AI 芯片的算力越高,代表它的运算速度越快、性能越强。
(2)功耗:功耗即芯片运行所需的功率,除了功耗本身,性能功耗比是综合衡量芯片算力和功耗的关键指标,它代表每瓦功耗对应输出算力的大小。
(3)面积:芯片的面积是成本的决定性因素之一,通常来讲相同工艺制程之下,芯片面积越小良率越高,则芯片成本越低。此外,单位芯片面积能提供的算力大小亦是衡量 AI 芯片成本的关键指标之一。
除 PPA 之外,运行在 AI 芯片上的算法输出精度、AI 应用部署的可扩展性与灵活性,均为衡量 AI 芯片性能的指标。

英伟达的 GPGPU 是全球应用最为广泛的 AI 芯片,决定其性能的硬件参数主要包括:微架构、制程、CUDA 核数、Tensor 核数、频率、显存容量、显存带宽等。其中,微架构即 GPU 的硬件电路设计构造的方式,不同的微架构决定了 GPU的不同性能,作为英伟达 GPU 的典型代表,V100、A100、H100 GPU 分别采用Volta、Ampere、Hopper 架构;CUDA 核是 GPU 内部主要的计算单元;Tensor核是进行张量核加速、卷积和递归神经网络加速的计算单元;显存容量和带宽是决定 GPU 与存储器数据交互速度的重要指标。

除 GPU 硬件之外,与之配套的软件开发体系亦是生态的重要组成部分。GPU的生态包括底层硬件、指令集架构、编译器、API、基础库、顶层算法框架和模型等,英伟达于 2006 年发布的 CUDA 平台是当今全球应用最为广泛的 AI 开发生态系统。通用 GPU 与 CUDA 组成的软硬件底座构成了英伟达引领 AI 计算的根基,当前全球主流深度学习框架均使用 CUDA 平台。

生态构建计算壁垒,国产 GPU 厂商初期兼容 CUDA,长期仍需构筑自身软硬件生态。由于当前全球主流深度学习框架均使用 CUDA 平台进行开发,国产 GPU可以通过兼容 CUDA 的部分功能,快速打开市场,减少开发难度和用户移植成本。然而,CUDA 本身涵盖功能非常广泛,且许多功能与英伟达 GPU 硬件深度耦合,包含了许多英伟达 GPU 的专有特性,这些特性并不能在国产 AI 芯片上全部体现。因此,长期来看国产 GPU 厂商仍需通过提升自身的软硬件实力,构筑属于自己的软硬件生态。

全球 AI 芯片市场被英伟达垄断,然而国产 AI 算力芯片正起星星之火。目前,国内已涌现出了如寒武纪、海光信息等优质的 AI 算力芯片上市公司,非上市 AI 算力芯片公司如沐曦、天数智芯、壁仞科技等亦在产品端有持续突破。


国务院组建国家数据局、重组科技部,结合前期数字中国建设规划落地、浪潮集团被美国商务部列入”实体清单“等事件,我们认为,国产 AI 算力芯片迎来发展“芯“机遇,自主可控亟待加速。
自主可控受高度重视,高水平科技亟需自立自强。国务院在“两会“期间组建国家数据局,负责统筹推进数字经济发展、推进数据基础设施布局建设等任务,有望加速推进数字中国建设落地;国务院重组科技部,并组建中央科技委员会,亦有望加速推动国内高水平科技实现自立自强。AI 算力芯片作为数字中国的算力基础,国产突破势在必行,国产 AI 算力芯片迎来发展”芯“机遇。
数字中国建设对 AI 芯片国产化提出新要求。中央印发了《数字中国建设整体布局规划》。《规划》提出要夯实数字基础设施和数据资源体系“两大基础”,我们认为,数字中国基础设施的建设有望拉动以数据中心、超算中心、智能计算中心为代表的算力基础设施建设,从而带动服务器与 AI 算力芯片的需求快速增长。同时,《规划》提出要构筑自立自强的数字技术创新体系,上游 AI 芯片作为算力基础,自主可控需求凸显,数字中国建设对 AI 芯片国产化提出新要求。
浪潮集团被列入“实体清单“,AI 芯片国产化进程有望加速。当地时间 3 月2 日,美国商务部将浪潮集团、龙芯中科等 37 个实体列入“实体清单“,扩大对浪潮等中国企业的出口禁令。浪潮集团等公司被列入“实体清单”,再度敲响了中国 AI 产业发展的警钟,我们不但要加大数字基础设施建设,AI 算力芯片的自主可控推进也势在必行。
以上内容仅供学习交流,不构成投资建议。详情参阅原报告。
自然醒后为什么大脑会清爽 原来是因为大脑有这个功能
睡眠中大脑有自动清洗功能。大脑作为人体的指挥部,大脑提出的每一个指令,我们的身体都会如实的去进行,现在来看,人类研究大脑还处在瓶颈阶段,无法继续向前一步。在我们无法去理解意识如何存在于大脑的过程中,只能够通过大脑一些行为方式来判断大脑的深层次功能,比如说在睡醒之后就会感觉大脑清爽,这就是因为大脑的自动洗脑功能。自动洗脑我要新鲜事2023-05-15 23:37:400000状态极不稳定,640光年外的参宿四如果爆发,人类文明或将消失
地球夜空中明亮的参宿四一直以来都倍受天文学家关注,有关它亮度变化的记录也持续进行了两百多年。参宿四之所以有这么高的关注度,是因为它属于红超巨星,距离地球640光年到720光年的它随时都有可能超新星爆发,它也是因为超新星爆发之前频繁的亮度变化而被盯上的,2019时参宿四甚至变暗了三分之二,如此幅度的变化让天文学界相信它已经处于爆发的前期了,甚至有可能已经爆发了,只是信息还没传到地球。我要新鲜事2023-11-05 20:09:270000脑机接口技术,是不是可以让人类永生?(未来技术)
未来的一些技术可能是人类灾难不知道大家有没有想象过?要是人类的大脑有一天可以和计算机连接,是不是会让人类变得更加厉害?要知道我我们平时在读书学习的时候,最怕的就是记不住东西,然后就是在算数的时候会比较困难,要是能够在人的大脑里面接入一个机器用来储存记忆和进行算数,是不是就是简单多了?著名企业家马斯克也有过这样的想法,并且他正在付出时间制作这样的东西。我要新鲜事2023-05-15 01:08:130000地球超越宇宙的速度高达600km每秒,可是人类却无法感知
我们都知道,地球在宇宙中是不断运动的,清楚了地球公转和自转的相关知识之后,很多人都有这种疑惑,地球在宇宙中的运行速度达到600km每秒,人类却对此一无所知。其实我们人类对于运动的了解,主要是通过参照物来实现的,我们以参照物为标准,发生位置变化时认为是移动了。另外还有一些肉眼分辨不出的运动,即使悄悄地发生了位置改变,而我们却察觉不出来。我要新鲜事2023-05-14 09:35:440000果然视频|究竟是怎样的“黑科技”让这台自行车价值60万?
为什么这台车值60万?这台车用于竞技和开发,它经过风动实验室(测试),有一定的降低风阻能力,所用材料是航空航天级别的,限量的,一款产品一个模型,它所产生的一个成品不会超过100台。0000