magic_sex5 国产GPU供不应求——国产之光性能超乎假想

发布日期：2024-08-26 06:30 点击次数：192

国产GPU供不应求——国产之光性能超乎假想magic_sex5

本文援用地址：https://www.eepw.com.cn/article/202404/457390.htm

AI届春晚—英伟达GTC大会在3月召开，B100/B200晶片的亮相，刷新了盘算新速率，跟着东谈主工智能本事的日眉月异，从数据处理到算法优化，再到期骗场景的拓展，每一步齐可能带来新的市集契机。从智能硬件到云盘算，再到物联网等多个领域，AI本事的深刻期骗齐将成为市集的温雅焦点。AI对算力的条款是需要广泛的并行及相系数算，GPU正值有这个专长，步地造强者，因此GPU就出山担此重担。

台积电董事长刘德音掂量：过去 15 年每瓦 GPU 性能栽种 1000 倍，GPU 晶体管数破万亿

就在近期，在一则对英伟达CEO黄仁勋的最新专访中，黄仁勋示意：当下咱们正处于生成式东谈主工智能窜改的启程点，机器东谈主基础模子可能行将出现，新一代GPU性能超乎假想，本年到来岁，GPU齐会供不应求！

何如构建比英伟达更好的GPU

面对国外的行业龙头，国内GPU在对标的同期也在束缚逾越，减轻与头部公司的差距，在我看来，GPU 有传统 2D/3D 图形渲染 GPU 和专注高性能盘算的GPU两条主要的发展道路。跟着国度的政策救援及厂商的汗漫插足，国产GPU 厂商在图形渲染 GPU 和高性能盘算 GPGPU 领域上均推出了较为熟识的居品，在性能上束缚追逐行业主流居品，在特定领域达到业界一活水平。在软件救援方面，国产GPU企业正在积极与主流操作系统、开发环境以及图形处理软件等进行适配，确保用户省略畅通地使用各式期骗软件。同期，一些企业还在推动GPU在东谈主工智能、云盘算等新兴领域的期骗，为国产GPU生态注入新的活力。

生态方面国产厂商大多兼容英伟达 CUDA，融入大生态进而罢了客户端导入。

我国迁徙GPU和桌面GPU两大主要末端期骗场景市集捏续保捏增长。大家GPU的市集依然达到了448亿好意思元，我国约占大家市集范畴的24.7%。互联网、政府侧、就业、电信、金融、制造、证实等领域是GPU算力需求较大的领域，现在国产GPU企业齐在积极朝大模子标的布局，包括窥伺和推理。另外软件和生态建立也在加快鼓舞。

AI芯片缺少，业界：过去中国将发展我方的高端GPU

沐曦

沐曦于2020年9月成立于上海，发奋于为异构盘算提供全栈GPU芯片及处理决策，可闲居期骗于东谈主工智能、聪惠城市、自动驾驶、数字孪生、元世界等前沿领域。公司领有本事完备、遐想和产业化教育丰富的团队，中枢成员平均领有近20年高性能GPU居品端到端研发教育。

公司领有全齐自主研发的GPU IP、辅导集和架构，以及兼容主流GPU生态的无缺软件栈（MXMACA），居品具备高能效、高通用性。现在已推出MXN系列GPU（曦念念）用于AI推理，MXC系列GPU（曦云）用于AI窥伺及通用盘算，以及MXG系列GPU（曦彩）用于图形渲染，可茂盛数据中心对高能效和高通用性的算力需求。

沐曦领有现在国内出身于大家顶级GPU厂商的全建制团队，领有二十年高性能GPU从遐想到量产录用的全历程教育。算作初创公司，成立一年内获取四轮共数十亿东谈主民币的融资。2021年8月25日，公司获取十亿东谈主民币融资，由国调基金和中网投领投，和利成本、红杉中国等跟投。通过此轮融资，进一步加强了沐曦在高性能GPU领域的研发插足。

对标英伟达 A100magic_sex5，国产盘算 GPU 沐曦 MXC500 仅用 5 小时班师点亮

海光信息

海光信息主要从事高端处理器、加快器等盘算芯片居品和系统的研发、遐想和销售。公司的居品包括海光通用处理器（CPU）和海光协处理器（DCU），具有熟识而丰富的期骗生态环境，内置专用安全硬件，可茂盛互联网、金融、动力等行业的闲居期骗需求。

其系列居品海光 8100 袭取先进的 FinFET 工艺，以GPU架构为基础，兼容通用的“类 CUDA”环境以及国际主流营业盘算软件和东谈主工智能软件，可充分挖掘期骗的并行性，进展其大范畴并行盘算的能力。

摩尔线程

摩尔线程成立于2020年，是一家以全功能GPU芯片遐想为主的集成电路高技术公司，省略为闲居的科技生态勾通伙伴提供纷乱的盘算加快能力，发奋于打造为下一代互联网提供多元算力的元盘算平台。

老色哥首发

值得一提的是，摩尔线程的首创东谈主是原NVIDIA大家副总裁、中国区总司理张建中先生。中枢创建团队基本齐来自NVIDIA，领有无缺的高端芯片东谈主才团队，全面掩饰GPU芯片IP研发、系统软硬件遐想、生态建立和市集营销等。

2022年，摩尔线程就推出了GPU调解系统架构MUSA，发布并量产“苏堤”和“春晓”两颗全功能GPU芯片，这亦然国内袭取当代GPU架构，独一内置图形渲染、视频编解码、AI盘算加快、物理仿真、科学盘算四大引擎的全功能高端GPU芯片。

12月19日发布的摩尔线程MTT S4000是专为盘算而生的加快卡，基本代表国产盘算卡的领军水平。从图中不错看到这款卡的一些基本参数。其中，FP32（单精）达到25TFLOPS， FP16（半精）达到100TFLOPS，片间互联达到240GB/s。算作对比，NVIDIA的RTX4080的FP16和FP32均为48.74TFLOPS，而H100则达到了FP16为1979TFLOPS，FP32为67TFLOPS的算力；华为的晟腾910的FP16算力为320TFLOPS。

近日，无问芯穹发布了“无穹Infini-AI”大模子开发与就业平台，并晓示与摩尔线程达成深度策略勾通。

摩尔线程首个千卡KUAE智算中心落地

国内首家：摩尔线程推出 GPU 云桌面居品，救援最高 20 路 1080p 30 帧并发

壁仞科技

壁仞科技创立于 2019 年，在 GPU、DSA（专用加快器）和盘算机体系缚构等领域具有深厚的本事鸠合。公司发奋于开发原创性的通用盘算体系，建立高效的软硬件平台，同期在智能盘算领域提供一体化的处理决策。

2022 年 8 月公司发布的通用 GPU 芯片 BR100 创下大家通用 GPU 算力纪录，峰值算力达到国际厂商在售旗舰居品 3 倍以上。BR100 率先袭取 Chiplet 本事、新一代主机接口PCIe 5.0、救援 CXL 互连合同，树立了公司在国内厂商间的本事率先地位。公司坚捏自主研发，同步推出原创架构“壁立仞”和自研BIRENSUPA 软件平台，罢了了 BR100 性能的大幅栽种。

以壁仞科技于 2022 年8 月发布的首款 GP GPU BR100 为例，该芯片袭取 Chiplet 本事，16 位浮点算力达到 1000T 以上、8 位定点算力达到 2000T 以上，单芯片峰值算力达到 PFLOPS级别，是国际厂商在售旗舰居品的 3 倍以上，创造了大家通用 GPU 的算力纪录。

770亿晶体管的中国第一算力通用GPU芯片！壁仞科技BR100亮相国外

壁仞科技初度参与巨擘AI评测MLPerf 获多项大家第一

不仅如斯，国内也有一些厂商，依靠着IP及丰富的居品类型，束缚在GPU领域活跃着。

寒武纪

寒武纪是国内率先东谈主工智能芯片遐想企业，搭建闲居掩饰末端、云表、边际端场景的智能芯片居品体系。公司面向末端、云表、边际端三大场景，区分研发推出末端智能处理器IP（智能处理器的产等级罢了决策，由中枢架构、代码、文档等构成）、云表智能芯片及加快卡（用于加快特定领域期骗才智的板卡居品，以盘算芯片为中枢部件）、边际智能芯片及加快卡等居品，适用于千般智能末端、云就业器、边际盘算斥地等，并为该三类居品，研发推出调解的基础系统软件平台，为客户提供丰富芯片居品与系统软件处理决策，发奋构建云、边、端一体的智能生态。

寒武纪推出的新款智能加快卡 MLU370-X8/M8、窥伺整机玄念念 1001智能加快器(MLU-X1001)。初度将双芯片四芯粒念念元370整合在MLU370-X8智能加快卡中，提供了两倍于法式念念元370加快卡的内存、编解码资源，同期搭载MLU-Link™多芯互联本事。在YOLOv3、Transformer、BERT和ResNet101窥伺任务中， 8卡并行平均性能达350W RTX GPU的155%。

寒武纪1A、寒武纪1H期骗于华为海念念等旗舰智高手机芯片内，已集成在卓绝1亿台智高手机过头他智能末端中。念念元系列芯片及对应加快器居品，已期骗在中科晨曦、波澜、逸想等多家厂商的就业器中。基于此，公司居品放射互联网、云盘算、动力、证实、金融、电信、交通、医疗等行业，救援东谈主工智能行业千般中小企业发展。

在2023年度中国AI芯片前锋企业TOP 30中，寒武纪入选。寒武纪入选2023中国AI芯片前锋企业TOP30

寒武纪子公司与中国一汽勾通，聚焦智能驾驶芯片研发与期骗

寒武纪入选2022年度东谈主工智能领航企业TOP50

芯原股份

芯原依托自主半导体 IP，为客户提供平台化、全处所、一站式芯片定制就业和半导体 IP 授权就业，领有独到的“芯片遐想平台即就业”筹商形态。公司可提供高清视频、物联网贯穿、数据中心等多种一站式芯片定制处理决策，领有自主可控的图形处理器 IP、神经收罗处理器 IP 等五类处理器 IP 及 1400 多个数模搀杂 IP 和射频 IP，可快速打造出从界说到测试封装完成的半导体居品，业务范围掩饰销耗电子、汽车电子、物联网等多种期骗领域。据 IPnest 在 2021 年的统计，芯原的半导体 IP 销售收入排中国大陆第二，大家第七，其中公司的图形处理器 IP 排行大家前三。

公司的GPU IP已被繁密主流和高端的汽车品牌所袭取，同期，公司基于约 20年 Vivante GPU 的研发教育，所推出的 Vivante 3D GPGPU IP 还可提供从低功镶嵌式斥地到高性能就业器的盘算能力，茂盛闲居的东谈主工智能盘算需求。

芯原携最新的高效力IP期骗亮相2024年国际镶嵌式展

袭取芯原NPU IP的AI类芯片已在大家出货卓绝1亿颗

赛昉基于RISC-V的JH-7110智能视觉处理平台袭取了芯原的露馅处理器IP

嘉楠基于RISC-V的端侧AIoT SoC袭取了芯原的ISP IP和GPU IP

近些年国产GPU正在繁茂发展，不外相较于国际巨头，仍然存在较大差距。连年来，大模子快速发展，国产GPU在大模子窥伺方面的不及也突显出来，在大模子窥伺及软件和生态方面齐濒临诸多挑战，举个例子，多媒体和图形处理齐属于单精度浮点盘算（FP32）的盘算需求，双精度浮点盘算能力FP64是进行高算力盘算的硬性筹商。英伟达的A100同期具备上述两类能力，而国内大多GPU只可处理单精度浮点盘算。

但在东谈主工智能、物联网等多卑劣领域快速发展情况下，我国数据中心端、云厂商以及智算领域对GPU需求也极为繁荣，在中好意思贸易战、大家芯片供应不褂讪的情况下，我国发展AI行业，造成自主可控的芯片供应体系，为国产GPU提供了进入市集的契机。是以举座看来，国产GPU市集空间如故非常广袤的。

magic_sex5 国产GPU供不应求——国产之光性能超乎假想

热点资讯