magic_sex5 国产GPU供不应求——国产之光性能超乎假想
国产GPU供不应求——国产之光性能超乎假想magic_sex5
本文援用地址:https://www.eepw.com.cn/article/202404/457390.htmAI届春晚—英伟达GTC大会在3月召开,B100/B200晶片的亮相,刷新了盘算新速率,跟着东谈主工智能本事的日眉月异,从数据处理到算法优化,再到期骗场景的拓展,每一步齐可能带来新的市集契机。从智能硬件到云盘算,再到物联网等多个领域,AI本事的深刻期骗齐将成为市集的温雅焦点。AI对算力的条款是需要广泛的并行及相系数算,GPU正值有这个专长,步地造强者,因此GPU就出山担此重担。
台积电董事长刘德音掂量:过去 15 年每瓦 GPU 性能栽种 1000 倍,GPU 晶体管数破万亿
就在近期,在一则对英伟达CEO黄仁勋的最新专访中,黄仁勋示意:当下咱们正处于生成式东谈主工智能窜改的启程点,机器东谈主基础模子可能行将出现,新一代GPU性能超乎假想,本年到来岁,GPU齐会供不应求!
何如构建比英伟达更好的GPU
面对国外的行业龙头,国内GPU在对标的同期也在束缚逾越,减轻与头部公司的差距,在我看来,GPU 有传统 2D/3D 图形渲染 GPU 和专注高性能盘算的GPU两条主要的发展道路。跟着国度的政策救援及厂商的汗漫插足,国产GPU 厂商在图形渲染 GPU 和高性能盘算 GPGPU 领域上均推出了较为熟识的居品,在性能上束缚追逐行业主流居品,在特定领域达到业界一活水平。在软件救援方面,国产GPU企业正在积极与主流操作系统、开发环境以及图形处理软件等进行适配,确保用户省略畅通地使用各式期骗软件。同期,一些企业还在推动GPU在东谈主工智能、云盘算等新兴领域的期骗,为国产GPU生态注入新的活力。
生态方面国产厂商大多兼容英伟达 CUDA,融入大生态进而罢了客户端导入。
我国迁徙GPU和桌面GPU两大主要末端期骗场景市集捏续保捏增长。大家GPU的市集依然达到了448亿好意思元,我国约占大家市集范畴的24.7%。互联网、政府侧、就业、电信、金融、制造、证实等领域是GPU算力需求较大的领域,现在国产GPU企业齐在积极朝大模子标的布局,包括窥伺和推理。另外软件和生态建立也在加快鼓舞。
AI芯片缺少,业界:过去中国将发展我方的高端GPU
沐曦
沐曦于2020年9月成立于上海,发奋于为异构盘算提供全栈GPU芯片及处理决策,可闲居期骗于东谈主工智能、聪惠城市、自动驾驶、数字孪生、元世界等前沿领域。公司领有本事完备、遐想和产业化教育丰富的团队,中枢成员平均领有近20年高性能GPU居品端到端研发教育。
公司领有全齐自主研发的GPU IP、辅导集和架构,以及兼容主流GPU生态的无缺软件栈(MXMACA),居品具备高能效、高通用性。现在已推出MXN系列GPU(曦念念)用于AI推理,MXC系列GPU(曦云)用于AI窥伺及通用盘算,以及MXG系列GPU(曦彩)用于图形渲染,可茂盛数据中心对高能效和高通用性的算力需求。
沐曦领有现在国内出身于大家顶级GPU厂商的全建制团队,领有二十年高性能GPU从遐想到量产录用的全历程教育。算作初创公司,成立一年内获取四轮共数十亿东谈主民币的融资。2021年8月25日,公司获取十亿东谈主民币融资,由国调基金和中网投领投,和利成本、红杉中国等跟投。通过此轮融资,进一步加强了沐曦在高性能GPU领域的研发插足。
对标英伟达 A100magic_sex5,国产盘算 GPU 沐曦 MXC500 仅用 5 小时班师点亮
海光信息
海光信息主要从事高端处理器、加快器等盘算芯片居品和系统的研发、遐想和销售。公司的居品包括海光通用处理器(CPU)和海光协处理器(DCU),具有熟识而丰富的期骗生态环境,内置专用安全硬件,可茂盛互联网、金融、动力等行业的闲居期骗需求。
其系列居品海光 8100 袭取先进的 FinFET 工艺,以GPU架构为基础,兼容通用的“类 CUDA”环境以及国际主流营业盘算软件和东谈主工智能软件,可充分挖掘期骗的并行性,进展其大范畴并行盘算的能力。
摩尔线程
摩尔线程成立于2020年,是一家以全功能GPU芯片遐想为主的集成电路高技术公司,省略为闲居的科技生态勾通伙伴提供纷乱的盘算加快能力,发奋于打造为下一代互联网提供多元算力的元盘算平台。
老色哥首发值得一提的是,摩尔线程的首创东谈主是原NVIDIA大家副总裁、中国区总司理张建中先生。中枢创建团队基本齐来自NVIDIA,领有无缺的高端芯片东谈主才团队,全面掩饰GPU芯片IP研发、系统软硬件遐想、生态建立和市集营销等。
2022年,摩尔线程就推出了GPU调解系统架构MUSA,发布并量产“苏堤”和“春晓”两颗全功能GPU芯片,这亦然国内袭取当代GPU架构,独一内置图形渲染、视频编解码、AI盘算加快、物理仿真、科学盘算四大引擎的全功能高端GPU芯片。
12月19日发布的摩尔线程MTT S4000是专为盘算而生的加快卡,基本代表国产盘算卡的领军水平。从图中不错看到这款卡的一些基本参数。其中,FP32(单精)达到25TFLOPS, FP16(半精)达到100TFLOPS,片间互联达到240GB/s。算作对比,NVIDIA的RTX4080的FP16和FP32均为48.74TFLOPS,而H100则达到了FP16为1979TFLOPS,FP32为67TFLOPS的算力;华为的晟腾910的FP16算力为320TFLOPS。
近日,无问芯穹发布了“无穹Infini-AI”大模子开发与就业平台,并晓示与摩尔线程达成深度策略勾通。
摩尔线程首个千卡KUAE智算中心落地
国内首家:摩尔线程推出 GPU 云桌面居品,救援最高 20 路 1080p 30 帧并发
壁仞科技
壁仞科技创立于 2019 年,在 GPU、DSA(专用加快器)和盘算机体系缚构等领域具有深厚的本事鸠合。公司发奋于开发原创性的通用盘算体系,建立高效的软硬件平台,同期在智能盘算领域提供一体化的处理决策。
2022 年 8 月公司发布的通用 GPU 芯片 BR100 创下大家通用 GPU 算力纪录,峰值算力达到国际厂商在售旗舰居品 3 倍以上。BR100 率先袭取 Chiplet 本事、新一代主机接口PCIe 5.0、救援 CXL 互连合同,树立了公司在国内厂商间的本事率先地位。公司坚捏自主研发,同步推出原创架构“壁立仞”和自研BIRENSUPA 软件平台,罢了了 BR100 性能的大幅栽种。
以壁仞科技于 2022 年8 月发布的首款 GP GPU BR100 为例,该芯片袭取 Chiplet 本事,16 位浮点算力达到 1000T 以上、8 位定点算力达到 2000T 以上,单芯片峰值算力达到 PFLOPS级别,是国际厂商在售旗舰居品的 3 倍以上,创造了大家通用 GPU 的算力纪录。
770亿晶体管的中国第一算力通用GPU芯片!壁仞科技BR100亮相国外
壁仞科技初度参与巨擘AI评测MLPerf 获多项大家第一
不仅如斯,国内也有一些厂商,依靠着IP及丰富的居品类型,束缚在GPU领域活跃着。
寒武纪
寒武纪是国内率先东谈主工智能芯片遐想企业,搭建闲居掩饰末端、云表、边际端场景的智能芯片居品体系。公司面向末端、云表、边际端三大场景,区分研发推出末端智能处理器IP(智能处理器的产等级罢了决策,由中枢架构、代码、文档等构成)、云表智能芯片及加快卡(用于加快特定领域期骗才智的板卡居品,以盘算芯片为中枢部件)、边际智能芯片及加快卡等居品,适用于千般智能末端、云就业器、边际盘算斥地等,并为该三类居品,研发推出调解的基础系统软件平台,为客户提供丰富芯片居品与系统软件处理决策,发奋构建云、边、端一体的智能生态。
寒武纪推出的新款智能加快卡 MLU370-X8/M8、窥伺整机玄念念 1001智能加快器(MLU-X1001)。初度将双芯片四芯粒念念元370整合在MLU370-X8智能加快卡中,提供了两倍于法式念念元370加快卡的内存、编解码资源,同期搭载MLU-Link™多芯互联本事。在YOLOv3、Transformer、BERT和ResNet101窥伺任务中, 8卡并行平均性能达350W RTX GPU的155%。
寒武纪1A、寒武纪1H期骗于华为海念念等旗舰智高手机芯片内,已集成在卓绝1亿台智高手机过头他智能末端中。念念元系列芯片及对应加快器居品,已期骗在中科晨曦、波澜、逸想等多家厂商的就业器中。基于此,公司居品放射互联网、云盘算、动力、证实、金融、电信、交通、医疗等行业,救援东谈主工智能行业千般中小企业发展。
在2023年度中国AI芯片前锋企业TOP 30中,寒武纪入选。寒武纪入选2023中国AI芯片前锋企业TOP30
寒武纪子公司与中国一汽勾通,聚焦智能驾驶芯片研发与期骗
寒武纪入选2022年度东谈主工智能领航企业TOP50
芯原股份
芯原依托自主半导体 IP,为客户提供平台化、全处所、一站式芯片定制就业和半导体 IP 授权就业,领有独到的“芯片遐想平台即就业”筹商形态。公司可提供高清视频、物联网贯穿、数据中心等多种一站式芯片定制处理决策,领有自主可控的图形处理器 IP、神经收罗处理器 IP 等五类处理器 IP 及 1400 多个数模搀杂 IP 和射频 IP,可快速打造出从界说到测试封装完成的半导体居品,业务范围掩饰销耗电子、汽车电子、物联网等多种期骗领域。据 IPnest 在 2021 年的统计,芯原的半导体 IP 销售收入排中国大陆第二,大家第七,其中公司的图形处理器 IP 排行大家前三。
公司的GPU IP已被繁密主流和高端的汽车品牌所袭取,同期,公司基于约 20年 Vivante GPU 的研发教育,所推出的 Vivante 3D GPGPU IP 还可提供从低功镶嵌式斥地到高性能就业器的盘算能力,茂盛闲居的东谈主工智能盘算需求。
芯原携最新的高效力IP期骗亮相2024年国际镶嵌式展
袭取芯原NPU IP的AI类芯片已在大家出货卓绝1亿颗
赛昉基于RISC-V的JH-7110智能视觉处理平台袭取了芯原的露馅处理器IP
嘉楠基于RISC-V的端侧AIoT SoC袭取了芯原的ISP IP和GPU IP
近些年国产GPU正在繁茂发展,不外相较于国际巨头,仍然存在较大差距。连年来,大模子快速发展,国产GPU在大模子窥伺方面的不及也突显出来,在大模子窥伺及软件和生态方面齐濒临诸多挑战,举个例子,多媒体和图形处理齐属于单精度浮点盘算(FP32)的盘算需求,双精度浮点盘算能力FP64是进行高算力盘算的硬性筹商。英伟达的A100同期具备上述两类能力,而国内大多GPU只可处理单精度浮点盘算。
但在东谈主工智能、物联网等多卑劣领域快速发展情况下,我国数据中心端、云厂商以及智算领域对GPU需求也极为繁荣,在中好意思贸易战、大家芯片供应不褂讪的情况下,我国发展AI行业,造成自主可控的芯片供应体系,为国产GPU提供了进入市集的契机。是以举座看来,国产GPU市集空间如故非常广袤的。