英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型
2023-06-14 22:31:55 来源:雪球网 小 中
凭借发布的新品,AMD正式向英伟达的AI芯片王者地位发起挑战。
美东时间6月13日周二,AMD举行了新品发布会,其中最重磅的新品当属性用于训练大模型的ADM最先进GPU Instinct MI300。
(资料图片仅供参考)
AMD CEO苏姿丰介绍,生成式AI和大语言模型(LLM)需要电脑的算力和内存大幅提高。她预计,今年,数据中心AI 加速器的市场将达到300亿美元左右,到2027 年将超过1500 亿美元,复合年增长率超过 50%。
苏姿丰演示介绍,AMD的Instinct MI300A号称全球首款针对AI和高性能计算(HPC)的加速处理器(APU)加速器。在13个小芯片中遍布1460亿个晶体管。
它采用CDNA 3 GPU架构和24个Zen 4 CPU内核,配置128GB的HBM3内存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。AMD在发布会稍早介绍,新的Zen 4c内核比标准的Zen 4内核密度更高,比标准Zen 4的内核小35%,同时保持100%的软件兼容性。
AMD推出一款GPU专用的MI300,即MI300X,该芯片是针对LLM的优化版,拥有192GB的HBM3内存、5.2TB/秒的带宽和 896GB/秒的Infinity Fabric 带宽。AMD将1530亿个晶体管集成在共12个5纳米的小芯片中。
AMD称,MI300X提供的HBM密度最高是英伟达AI芯片H100的2.4倍,其HBM带宽最高是H100的1.6倍。这意味着,AMD的芯片可以运行比英伟达芯片更大的模型。
Lisa Su介绍,MI300X可以支持400亿个参数的Hugging Face AI 模型运行,并演示了让这个LLM写一首关于旧金山的诗。这是全球首次在单个GPU上运行这么大的模型。单个MI300X可以运行一个参数多达800亿的模型。
LLM需要的GPU更少,给开发者带来的直接好处就是,可以节约成本。
AMD还发布了AMD Instinct 平台,它拥有八个MI300X,采用行业标准OCP设计,提供总计1.5TB 的HBM3 内存。
苏姿丰称,适用于CPU和GPU的版本MI300A现在就已出样,MI300X和八个GPU的Instinct 平台将在今年第三季度出样,第四季度正式推出。
亚马逊、微软、Meta已经或将要运用AMD新品除了AI芯片,AMD此次发布会还介绍了第四代EPYC(霄龙)处理器,特别是在全球可用的云实例方面的进展。
AMD第四代EPYC(霄龙)在云工作负载的性能是英特尔竞品处理器的1.8倍,在企业工作负载中的处理速度是英特尔竞品的1.9倍。
AMD称,第四代EPYC(霄龙)启用新的Zen 4c内核,比英特尔Xeon 8490H的效率高1.9倍。由于绝大多数AI在CPU上运行,AMD在CPU AI领域具有绝对的领先优势。
亚马逊周二宣布,在用AWS Nitro和第四代EPYC 处理器打造新的实例。亚马逊云的EC2 M7a实例现已提供预览版,性能比M6a实例高50%。
AMD也将在内部工作中运用EC2 M7a实例,包括芯片设计的EDA软件。AMD还宣布,今年7月,甲骨文将推出Genoa E5实例。
AMD发布的EPYC Bergamo处理器是业界首款x86原生CPU,有128个内核,每个插槽256个线程。这意味着一个普通的2U 4 节点平台将有 2048 个线程。
Bergamo比前代Milan的性能高2.5倍,现在就可以向AMD的云客户发货。
Meta的公司代表介绍,Meta在基础设施中使用EPYC处理器。Meta也对基于AMD的处理器设计开源。Meta方面称,计划为其基础设施使用云处理器Bergamo,还要将Bergamo用于其存储平台。
AMD同时推出本周二上市的CPU Genoa-X。它将增加超过1GB 的96核L3缓存。它共有四个SKU,16到 96 个内核。因为SP5插槽兼容,所以它可以与现有的EPYC 平台一起使用。
微软的公司代表和AMD一道展示了微软云Azure HPC的性能,在EPYC处理器的帮助下,Azure四年内的性能提升四倍。
Azure宣布,搭载Genoa-X的HBv4和HX系列实例、以及新的HBv3实例全面上市。Azure还称,性能最高可较市面基准提升5.7倍。
AMD此前通过收购Pensando获得DPU技术。此次AMD称,其P4 DPU架构是世界上最智能的DPU,它能减少数据中心的网络开销,并提高了服务器的可管理性。AMD的Pensando SmartNICs是这种新数据中心架构不可或缺的组成部分。
AMD还提到有自己的AI芯片软件,名为ROCm。AMD总裁Victor Peng称,在构建强大的软件堆栈方面,AMD取得了真正的巨大进步,ROCm软件栈可与模型、库、框架和工具的开放生态系统配合使用。
本文来自华尔街见闻,欢迎下载APP查看更多
关键词:
相关文章
- 英伟达AI芯片劲敌来了!AMD推出MI300X,可运行多达800亿参数模型
- 新五丰跌停后我读了这个报告|世界报道
- 希望证监会取消现金分红要除权的规定
- 中国化学:1-5月合同金额合计1417.65亿元
- 全球速讯:宋都股份延期回复上交所2022年报问询函
- 恒勃股份(301225.SZ):将于6月16日在深交所上市|全球速讯
- 拒绝3连败!世界第4逆转克星,单局21-7晋级,石宇奇等来复仇战!
- 苹果账户恢复流程_苹果账户恢复
- 连续两个涨停!传闻为特斯拉FSD提供算力中心 城地香江澄清:不属实!
- 金新农:预计第三季度生猪价格可能略有上涨 但很难突破去年高点 环球消息
- 昆仑万维:控股子公司拟发行股份收购Singularity AI全部股权 天天快讯
- 金圆股份:公司股票6月16日起被实施其他风险警示
- 龚正会见美中关系全国委员会会长欧伦斯|每日热讯
- 新亚制程:拟收购控股子公司少数股东权益 环球快资讯
- 天天热议:让我操心的格力空调
- 热讯:刚刚,央妈扣动扳机了……
- 百度文心一格×京东618:打造电商行业首个AI线下广告,节省80%制作成本 通讯
- 当前看点!硅料价格逼近成本线要“破防”了?议价空间被压缩后多家企业停止出货
- 美国5月PPI同比上升1.1% 预期1.50%
- 世界快讯:阿里集团公关团队将独立运作?知情人士:误传!
- 为解决私募创投退出难题 深圳大力发展S基金
- 环球看点!欢聚(YY.US)回购2025年到期的0.750%可转换优先票据 总额约4.3亿美元
- 世界即时:什么是三极管的截止饱和放大
- 康圣环球(09960.HK)6月14日耗资3240港元回购2000股
- 长沙开福区召开“护薪”大会 约谈21个欠薪高风险项目
- #金猫榜# 风冷散热效能更高,九州风神冰立方开始整活,又双叒叕带数显啦! 全球短讯
- 这才是正宗酱油炒饭的做法,米饭粒粒分明,太香了
- 立昂技术:公司暂无产品应用到新能源汽车零部件上_世界快讯
- 隆基绿能再次刷新商业级CZ硅片晶硅-钙钛矿叠层电池最高效率
- 环球短讯!沃尔核材:乐庭智联生产的800G高速通信线部分规格已通过客户验证并实现小批量交付
热文推荐
排行推荐

全球速讯:宋都股份延期回复上交所2022年报问询函

恒勃股份(301225.SZ):将于6月16日在深交所上市|全球速讯

拒绝3连败!世界第4逆转克星,单局21-7晋级,石宇奇等来复仇战!
