ICC訊 甲骨文與AMD周四聯(lián)合宣布,AMD最新Instinct MI355X GPU將登陸甲骨文云基礎(chǔ)設(shè)施(OCI),為大規(guī)模AI訓(xùn)練和推理工作負(fù)載提供較前代產(chǎn)品2倍以上的性價比優(yōu)勢。OCI將構(gòu)建由多達(dá)131,072塊MI355X GPU加速的zettascale級AI超級計算集群,支持客戶開展規(guī)?;疉I開發(fā)。
OCI執(zhí)行副總裁Mahesh Thiagarajan表示:"我們致力于提供最廣泛的AI基礎(chǔ)設(shè)施選擇。AMD加速器與OCI高性能網(wǎng)絡(luò)、靈活架構(gòu)的結(jié)合,將滿足客戶對新型智能體應(yīng)用的訓(xùn)練推理需求。"該方案采用高吞吐、超低延遲的RDMA集群網(wǎng)絡(luò)架構(gòu),MI355X GPU計算性能提升近3倍,高頻內(nèi)存容量增加50%。
AMD數(shù)據(jù)中心解決方案事業(yè)部執(zhí)行副總裁Forrest Norrod指出:"雙方合作始終致力于為客戶提供開放、高效且靈活的解決方案。新一代AMD加速器與Pollara網(wǎng)卡將支持更多AI推理、微調(diào)和訓(xùn)練場景。"
MI355X核心優(yōu)勢
新平臺具備288GB HBM3顯存和8TB/s內(nèi)存帶寬,支持4位浮點計算(FP4)標(biāo)準(zhǔn),采用液冷設(shè)計實現(xiàn)單機架125千瓦功率密度。每機架部署64塊1400瓦GPU,配合AMD Turin高頻CPU(最高3TB系統(tǒng)內(nèi)存)實現(xiàn)高效任務(wù)調(diào)度。客戶可通過AMD開源ROCm軟件棧無縫遷移現(xiàn)有代碼,并利用Pollara智能網(wǎng)卡的先進RoCE功能構(gòu)建高性能網(wǎng)絡(luò)。
(注:RDMA指遠(yuǎn)程直接內(nèi)存訪問技術(shù),RoCE為基于融合以太網(wǎng)的RDMA協(xié)議)