国产 AI 算力芯片全景图
(报告作者:民生证券研究所分析师 方竞)
根据芯片的类别,AI 算力芯片主要包括 GPU、FPGA,以及以 TPU、VPU 为代表的 ASIC 芯片,其中以 GPU 用量最大,据 IDC 数据,预计到 2025 年 GPU 仍将占据 AI 芯片 8 成市场份额。
AI 芯片赋能算力基石,英伟达垄断全球市场。AI 算力芯片主要包括 GPU、FPGA,以及以 VPU、TPU 为代表的 ASIC 芯片。其中以 GPU 用量最大,据 IDC 数据,预计到 2025 年 GPU 仍将占据 AI 芯片 8 成市场份额。然而,相较传统图形 GPU,通用型算力 GPU 在芯片架构上缩减了图形图像显示、渲染等功能实现,具有更优的计算能效比,因而被广泛应用于人工智能模型训练、推理领域。
根据在网络中的位置,AI 芯片可以分为云端 AI 芯片 、边缘和终端 AI 芯片;根据其在实践中的目标,可分为训练( training )芯片和推理( inference )芯片。云端主要部署高算力的 AI 训练芯片和推理芯片,承担训练和推理任务,具体有智能数据分析、模型训练任务和部分对传输带宽要求比高的推理任务;边缘和终端主要部署推理芯片,承担推理任务,需要独立完成数据收集、环境感知、人机交互及部分推理决策控制任务。
由于英伟达 GPU 产品线丰富、产品性能顶尖、开发生态成熟,目前全球 AI 算力芯片市场仍由英伟达垄断。根据中国信通院的数据,2021 年 Q4 英伟达占据了全球 95.7%的 GPU 算力芯片市场份额,因此,英伟达数据中心业务营收增速可以较好地反应全球 AI 芯片市场增速。2023 财年,英伟达数据中心营收达到 150 亿美元,同比增长 41%,FY2017-FY2023 复合增速达 63%,表明全球 AI 芯片市场规模保持高速增长。
评价 AI 芯片的指标主要包括算力、功耗、面积、精度、可扩展性等,其中算力、功耗、面积(PPA)是评价 AI 芯片性能的核心指标:
(1)算力:衡量 AI 芯片算力大小的常用单位为 TOPS 或者 TFLOS,两者分别代表芯片每秒能进行多少万亿次定点运算和浮点运算,运算数据的类型通常有整型 8 比特(INT8)、单精度 32 比特(FP32)等。AI 芯片的算力越高,代表它的运算速度越快、性能越强。
(2)功耗:功耗即芯片运行所需的功率,除了功耗本身,性能功耗比是综合衡量芯片算力和功耗的关键指标,它代表每瓦功耗对应输出算力的大小。
(3)面积:芯片的面积是成本的决定性因素之一,通常来讲相同工艺制程之下,芯片面积越小良率越高,则芯片成本越低。此外,单位芯片面积能提供的算力大小亦是衡量 AI 芯片成本的关键指标之一。
除 PPA 之外,运行在 AI 芯片上的算法输出精度、AI 应用部署的可扩展性与灵活性,均为衡量 AI 芯片性能的指标。
英伟达的 GPGPU 是全球应用最为广泛的 AI 芯片,决定其性能的硬件参数主要包括:微架构、制程、CUDA 核数、Tensor 核数、频率、显存容量、显存带宽等。其中,微架构即 GPU 的硬件电路设计构造的方式,不同的微架构决定了 GPU的不同性能,作为英伟达 GPU 的典型代表,V100、A100、H100 GPU 分别采用Volta、Ampere、Hopper 架构;CUDA 核是 GPU 内部主要的计算单元;Tensor核是进行张量核加速、卷积和递归神经网络加速的计算单元;显存容量和带宽是决定 GPU 与存储器数据交互速度的重要指标。
除 GPU 硬件之外,与之配套的软件开发体系亦是生态的重要组成部分。GPU的生态包括底层硬件、指令集架构、编译器、API、基础库、顶层算法框架和模型等,英伟达于 2006 年发布的 CUDA 平台是当今全球应用最为广泛的 AI 开发生态系统。通用 GPU 与 CUDA 组成的软硬件底座构成了英伟达引领 AI 计算的根基,当前全球主流深度学习框架均使用 CUDA 平台。
生态构建计算壁垒,国产 GPU 厂商初期兼容 CUDA,长期仍需构筑自身软硬件生态。由于当前全球主流深度学习框架均使用 CUDA 平台进行开发,国产 GPU可以通过兼容 CUDA 的部分功能,快速打开市场,减少开发难度和用户移植成本。然而,CUDA 本身涵盖功能非常广泛,且许多功能与英伟达 GPU 硬件深度耦合,包含了许多英伟达 GPU 的专有特性,这些特性并不能在国产 AI 芯片上全部体现。因此,长期来看国产 GPU 厂商仍需通过提升自身的软硬件实力,构筑属于自己的软硬件生态。
全球 AI 芯片市场被英伟达垄断,然而国产 AI 算力芯片正起星星之火。目前,国内已涌现出了如寒武纪、海光信息等优质的 AI 算力芯片上市公司,非上市 AI 算力芯片公司如沐曦、天数智芯、壁仞科技等亦在产品端有持续突破。
国务院组建国家数据局、重组科技部,结合前期数字中国建设规划落地、浪潮集团被美国商务部列入”实体清单“等事件,我们认为,国产 AI 算力芯片迎来发展“芯“机遇,自主可控亟待加速。
自主可控受高度重视,高水平科技亟需自立自强。国务院在“两会“期间组建国家数据局,负责统筹推进数字经济发展、推进数据基础设施布局建设等任务,有望加速推进数字中国建设落地;国务院重组科技部,并组建中央科技委员会,亦有望加速推动国内高水平科技实现自立自强。AI 算力芯片作为数字中国的算力基础,国产突破势在必行,国产 AI 算力芯片迎来发展”芯“机遇。
数字中国建设对 AI 芯片国产化提出新要求。中央印发了《数字中国建设整体布局规划》。《规划》提出要夯实数字基础设施和数据资源体系“两大基础”,我们认为,数字中国基础设施的建设有望拉动以数据中心、超算中心、智能计算中心为代表的算力基础设施建设,从而带动服务器与 AI 算力芯片的需求快速增长。同时,《规划》提出要构筑自立自强的数字技术创新体系,上游 AI 芯片作为算力基础,自主可控需求凸显,数字中国建设对 AI 芯片国产化提出新要求。
浪潮集团被列入“实体清单“,AI 芯片国产化进程有望加速。当地时间 3 月2 日,美国商务部将浪潮集团、龙芯中科等 37 个实体列入“实体清单“,扩大对浪潮等中国企业的出口禁令。浪潮集团等公司被列入“实体清单”,再度敲响了中国 AI 产业发展的警钟,我们不但要加大数字基础设施建设,AI 算力芯片的自主可控推进也势在必行。
以上内容仅供学习交流,不构成投资建议。详情参阅原报告。
高温天气使英国一天发生了许多场火灾人类要警惕(全球气候变暖)
地球是人类类生存的家园,而随着人类对地球的不断开发以及工业化的不断发展,慢慢的地球环境逐渐遭到破坏,现如今虽然人类的科技水平已经十分的高,可是地球受到的伤害也是越来越重。由于人们工业化进程的发展,加快了二氧化碳的排放,这些温室气体的排放会导致地球的臭氧层遭到破坏,这样就会让地球的气温逐渐升高,引发许多自然灾害。所以人类要减少温室气体的排放,保护地球的自然环境。我要新鲜事2023-05-14 15:16:320001量子技术发展 能否制造时间机器 时空穿越?(平行宇宙)
科学家认为量子技术的发展,人类无法制造出时间机器,也不能实现时空穿越。至少从理论上来看,人类穿越时间是不可能的。只不过科学家提出了平行宇宙的观点,或许我们能够在不同的宇宙之间穿梭。时空旅行我要新鲜事2023-03-26 18:53:110000这可能是全网最全的数据仓库建设方法论!
为了解决多数据源导致的口径不一致、数据无关联、数据质量差、缺少历史数据、开发效率低等问题,企业需要构建企业级数据仓库,对数据进行规整和高效利用。除此以外,由于直连业务系统支撑多方报表导致读写交叉性能降低,影响正常业务系统使用的问题也可解决。构建企业级数据仓库的步骤分为调研、数仓设计、数仓实施和测试上线四个主要环节。我要新鲜事2023-05-14 01:35:460000金星的环境有多严酷 天文学家:唯一的探测器 只工作了两个小时
当我们将太阳系的八大行星按照距离太阳的远近排列时,地球恰好位于老三的位置,距离太阳1.5亿公里,位于太阳系的宜居带内。然而,在天文学上,恒星的宜居带并非一个固定的窄带,其范围随着恒星的亮度而变化。在太阳系刚形成的时候,约45亿年前,地球、金星和火星都位于太阳系的宜居带内,这意味着在古老的太阳系中,至少有三颗行星具备了生命的潜力。我要新鲜事2023-11-13 20:02:120000日本天文部门新发现,暗黑物质的宇宙结构(斯巴鲁望远镜)
我们可以感知到正常物质,以及只能通过引力与正常物质相互作用的暗物质。据该出版物称,质量是正常质量的五到六倍的暗物质,是基于诞生于138亿年前的宇宙密度的轻微波动而聚集的,是一个巨大的质量“晕”状结构.被“你好”吸引的普通物质造就了恒星,星系、星系团和恒星聚集的大尺度结构逐渐形成并演化成今天的宇宙。我要新鲜事2023-05-13 17:10:280000