英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型

2023-06-14 22:31:55 来源:雪球网

凭借发布的新品,AMD正式向英伟达的AI芯片王者地位发起挑战。

美东时间6月13日周二,AMD举行了新品发布会,其中最重磅的新品当属性用于训练大模型的ADM最先进GPU Instinct MI300。


(资料图片仅供参考)

AMD CEO苏姿丰介绍,生成式AI和大语言模型(LLM)需要电脑的算力和内存大幅提高。她预计,今年,数据中心AI 加速器的市场将达到300亿美元左右,到2027 年将超过1500 亿美元,复合年增长率超过 50%。

苏姿丰演示介绍,AMD的Instinct MI300A号称全球首款针对AI和高性能计算(HPC)的加速处理器(APU)加速器。在13个小芯片中遍布1460亿个晶体管。

它采用CDNA 3 GPU架构和24个Zen 4 CPU内核,配置128GB的HBM3内存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。AMD在发布会稍早介绍,新的Zen 4c内核比标准的Zen 4内核密度更高,比标准Zen 4的内核小35%,同时保持100%的软件兼容性。

AMD推出一款GPU专用的MI300,即MI300X,该芯片是针对LLM的优化版,拥有192GB的HBM3内存、5.2TB/秒的带宽和 896GB/秒的Infinity Fabric 带宽。AMD将1530亿个晶体管集成在共12个5纳米的小芯片中。

AMD称,MI300X提供的HBM密度最高是英伟达AI芯片H100的2.4倍,其HBM带宽最高是H100的1.6倍。这意味着,AMD的芯片可以运行比英伟达芯片更大的模型。

Lisa Su介绍,MI300X可以支持400亿个参数的Hugging Face AI 模型运行,并演示了让这个LLM写一首关于旧金山的诗。这是全球首次在单个GPU上运行这么大的模型。单个MI300X可以运行一个参数多达800亿的模型。

LLM需要的GPU更少,给开发者带来的直接好处就是,可以节约成本。

AMD还发布了AMD Instinct 平台,它拥有八个MI300X,采用行业标准OCP设计,提供总计1.5TB 的HBM3 内存。

苏姿丰称,适用于CPU和GPU的版本MI300A现在就已出样,MI300X和八个GPU的Instinct 平台将在今年第三季度出样,第四季度正式推出。

亚马逊、微软、Meta已经或将要运用AMD新品

除了AI芯片,AMD此次发布会还介绍了第四代EPYC(霄龙)处理器,特别是在全球可用的云实例方面的进展。

AMD第四代EPYC(霄龙)在云工作负载的性能是英特尔竞品处理器的1.8倍,在企业工作负载中的处理速度是英特尔竞品的1.9倍。

AMD称,第四代EPYC(霄龙)启用新的Zen 4c内核,比英特尔Xeon 8490H的效率高1.9倍。由于绝大多数AI在CPU上运行,AMD在CPU AI领域具有绝对的领先优势。

亚马逊周二宣布,在用AWS Nitro和第四代EPYC 处理器打造新的实例。亚马逊云的EC2 M7a实例现已提供预览版,性能比M6a实例高50%。

AMD也将在内部工作中运用EC2 M7a实例,包括芯片设计的EDA软件。AMD还宣布,今年7月,甲骨文将推出Genoa E5实例。

AMD发布的EPYC Bergamo处理器是业界首款x86原生CPU,有128个内核,每个插槽256个线程。这意味着一个普通的2U 4 节点平台将有 2048 个线程。

Bergamo比前代Milan的性能高2.5倍,现在就可以向AMD的云客户发货。

Meta的公司代表介绍,Meta在基础设施中使用EPYC处理器。Meta也对基于AMD的处理器设计开源。Meta方面称,计划为其基础设施使用云处理器Bergamo,还要将Bergamo用于其存储平台。

AMD同时推出本周二上市的CPU Genoa-X。它将增加超过1GB 的96核L3缓存。它共有四个SKU,16到 96 个内核。因为SP5插槽兼容,所以它可以与现有的EPYC 平台一起使用。

微软的公司代表和AMD一道展示了微软云Azure HPC的性能,在EPYC处理器的帮助下,Azure四年内的性能提升四倍。

Azure宣布,搭载Genoa-X的HBv4和HX系列实例、以及新的HBv3实例全面上市。Azure还称,性能最高可较市面基准提升5.7倍。

AMD此前通过收购Pensando获得DPU技术。此次AMD称,其P4 DPU架构是世界上最智能的DPU,它能减少数据中心的网络开销,并提高了服务器的可管理性。AMD的Pensando SmartNICs是这种新数据中心架构不可或缺的组成部分。

AMD还提到有自己的AI芯片软件,名为ROCm。AMD总裁Victor Peng称,在构建强大的软件堆栈方面,AMD取得了真正的巨大进步,ROCm软件栈可与模型、库、框架和工具的开放生态系统配合使用。

本文来自华尔街见闻,欢迎下载APP查看更多

关键词:

相关文章

热文推荐

英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型
英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型

凭借发布的新品,AMD正式向英伟达的AI芯片王者地位发......更多>

新五丰跌停后我读了这个报告|世界报道
新五丰跌停后我读了这个报告|世界报道

新五丰发行股份及支付现金购买资产并募集配套资金暨关......更多>

希望证监会取消现金分红要除权的规定
希望证监会取消现金分红要除权的规定

上市公司的现金分红,是指公司将净利润中的一部分以现......更多>

中国化学:1-5月合同金额合计1417.65亿元
中国化学:1-5月合同金额合计1417.65亿元

中国化学公布2023年15月主要经营情况公告合同金额合计......更多>

排行推荐

全球速讯:宋都股份延期回复上交所2022年报问询函
全球速讯:宋都股份延期回复上交所2022年报问询函
宋都股份延期回复上交所2022年报问询函,年报,问询函,... 更多>
恒勃股份(301225.SZ):将于6月16日在深交所上市|全球速讯
恒勃股份(301225.SZ):将于6月16日在深交所上市|全球速讯
格隆汇6月14日丨恒勃股份301225SZ公布公司股票将于202... 更多>
拒绝3连败!世界第4逆转克星,单局21-7晋级,石宇奇等来复仇战!
拒绝3连败!世界第4逆转克星,单局21-7晋级,石宇奇等来复仇战!
今日,印尼羽毛球公开赛继续进行,首轮男单焦点战,日... 更多>
苹果账户恢复流程_苹果账户恢复
苹果账户恢复流程_苹果账户恢复
1、第一步:首先进入苹果中国官网,然后在上部导航条... 更多>
雷电微力回应中标某相控阵天线TR组件项目:信息不属实
有投资者在互动平台向雷电微力(301050)提问,“招标网... 更多>
世界聚焦:国旅联合:拟采用现金的方式、以自有及自筹资金5088.06万元收购公司控股股东所持有的江西省海际购进出口有限公司100%股权
国旅联合(600358):拟采用现金的方式、以自有及自筹资... 更多>
莫云解盘系列(97):重回万亿流动性,人工智能cpo“光”芒万丈-聚看点
今天其实复盘都不需要了,看我昨天复盘就行。昨天复盘... 更多>
【1043章】2023.06.14 收评 (这里全被雪球警告了)手牵手准备唱我为祖国献石油|天天微资讯
今天浮盈1 7w左右估计,至少没亏,遮羞布还是盖上了... 更多>
速递!5月风机招标“中场休息” 海风竞配密集出炉或酝酿爆发
5月风机招标迎来一波低潮。记者粗略统计,刚过去的5月... 更多>
48亿资金被印度没收?小米回应!|环球今日讯
中国手机制造商在印度遭遇“黑暗时刻”。最新消息称,... 更多>
33.5%!隆基绿能再次刷新商业级CZ硅片晶硅-钙钛矿叠层电池最高效率 焦点热文
6月14日,被冠以“技术和市场风向标”的IntersolarEur... 更多>
最新:摩根大通:今年全球石油需求预计平均为10140万桶/日
摩根大通称,今年全球石油需求预计平均为10140万桶 ... 更多>
广东省市场监管局召开“618”网络集中促销经营主体合规经营指导会_环球信息
为进一步规范“618”期间网络促销行为,保护消费者合... 更多>
全球快资讯丨WIKO Hi畅享60 Pro曝光:骁龙695依旧能打
WIKOHi畅享60Pro曝光:骁龙695依旧能打 更多>

三重罗生门结印(三重罗生门) 当

AI技术加速迭代:周鸿祎视角下的大

南京市浦口区开展“贯彻二十大 奋

容易“上头”怎么办?王艺迪叮嘱自

最新消息:智慧农业:公司截至2022

每日热门:成都经开区“产销联动”

新莱福:公司研制的电子陶瓷元件暂

百川畅银:与安徽省金鼎安全科技股

最新:融创中国:高等法院已颁令撤

赛力斯:公司生产经营状况正常 未