ICC訊 拉斯維加斯AWS re:Invent大會現(xiàn)場——今年,AWS可謂手握一手好牌。首席執(zhí)行官Matt Garman在主題演講中重點介紹了兩項AI基礎設施公告以及三項模型更新。以下是你需要了解的此次大會重點。
AI工廠登場,電信運營商面臨挑戰(zhàn)
AWS首次推出了其“AI工廠”產(chǎn)品。該產(chǎn)品將允許客戶在其現(xiàn)有的數(shù)據(jù)中心空間內(nèi)部署AWS芯片、網(wǎng)絡和AI服務以及英偉達的計算平臺,以滿足AI計算和數(shù)據(jù)主權兩方面的需求。
一方面,看到AWS發(fā)布此消息實在令人遺憾。原因在于,“AI工廠”曾是電信運營商如何避免重蹈“啞管道”覆轍的一個答案。德國電信、Orange、瑞士電信和Telenor等運營商已開始朝著正確的方向邁出試探性的步伐。但當它們還在摸索,并且以典型的電信業(yè)速度緩慢推進時,AWS卻早已忙于構建企業(yè)和公共部門客戶正在尋找的完整方案。
另一方面,我們早就預言過結局會是這樣。在數(shù)據(jù)主權方面,電信運營商可能仍有一些角色可以扮演,但AWS已經(jīng)明確將目標對準了那些有監(jiān)管和主權要求的客戶,并宣揚其能夠在公司現(xiàn)有設施中部署專用基礎設施的能力。
AvidThink創(chuàng)始人兼負責人Roy Chua認為,這項發(fā)布可能具有雙重影響。他告訴Fierce,雖然AWS AI工廠“可能被視為與一些電信運營商的舉措存在競爭關系”,但運營商也“可以將AI工廠視為一種讓AWS幫助其建立自身私有AI能力的方式——即電信運營商可以為自己業(yè)務利用的、獨立的私有AI基礎設施”。我們猜想,他們別無選擇,只能設法從這些挑戰(zhàn)中尋找機遇。
芯片重磅發(fā)布:Trainium 3上市,Trainium 4預覽
re:Invent大會上還有兩條重要的芯片新聞。第一條是關于Trainium 3的全面上市。這款AI訓練芯片是AWS在去年的re:Invent大會上宣布的。與上一代芯片相比,Trainium 3提供了4.4倍的計算能力、3.9倍的內(nèi)存帶寬,以及每毫瓦功耗下5倍的AI令牌處理能力。
AWS還預告了仍在開發(fā)中的Trainium 4。Garman表示,與Trainium 3相比,下一代芯片將提供6倍的FP4性能、4倍的內(nèi)存帶寬和2倍的內(nèi)存容量。
但這些性能提升并不一定意味著AWS正在試圖挑戰(zhàn)英偉達。Futurum Group首席執(zhí)行官Daniel Newman告訴Fierce:“我不知道誰需要聽到這個,但并非每一款新發(fā)布的AI芯片都‘旨在與英偉達競爭或擊敗它’。我們正處在一個巨大技術超級周期的開端,每一款能為AI生產(chǎn)的芯片都在熱銷?!币簿褪钦f,市場需求足夠大,足以讓所有參與者分得一杯羹,這不是一場零和游戲。
盡管如此,F(xiàn)uturum Group副總裁兼AI平臺實踐負責人Nick Patience告訴Fierce,如果Trainium能夠“突破‘溢出需求’的定位,獲得廣泛的財富500強企業(yè)采用”,那對亞馬遜來說可能是一個巨大的福音。不過,到目前為止,這尚未發(fā)生。
模型家族更新與應對技術債務的新工具
AWS在其Nova基礎模型家族中推出了一系列新選項。其中包括適用于各種工作負載的“主力模型”Nova Lite、用于智能推理的Nova 2 Pro,以及具有先進多模態(tài)輸入輸出能力的Nova 2 Omni。
AWS還推出了Nova Forge服務。Garman介紹,這項服務引入了開放式訓練模型的概念。也就是說,F(xiàn)orge允許企業(yè)在Nova訓練過程中的各個檢查點注入其專有數(shù)據(jù),從而創(chuàng)建可在Amazon Bedrock中使用的定制化“Novellas”模型。索尼是Nova Forge的使用者之一,他們利用該工具創(chuàng)建了一個基于Nova 2的內(nèi)部模型,以改進其合規(guī)實踐。
可以將這視為超越了檢索增強生成技術的一步。AWS不僅僅是讓企業(yè)在其數(shù)據(jù)上進行推理查詢,而是真正將這些數(shù)據(jù)整合到模型訓練過程中,以創(chuàng)建定制模型。我們認為這有可能進一步推動Trainium的采用,因為Trainium就是為處理此類微調(diào)工作負載而設計的。
除了模型更新,亞馬遜還推出了新的Frontier Agents。你可以在這里閱讀更多相關信息,以及圍繞該公司AI快速進展引發(fā)的爭議。
應對技術債務
AWS也在利用智能體AI的力量來應對技術債務。AWS Transform正在獲得一套新的智能體AI工具集,旨在加速舊有企業(yè)代碼和應用程序的現(xiàn)代化改造,并且能夠跨任何API、框架、架構或語言工作。
考慮到阻礙AI應用的技術債務規(guī)模驚人,這顯然是一件大事。正如Garman在臺上指出的,埃森哲估計技術債務每年給美國企業(yè)造成總計2.4萬億美元的損失,而高德納咨詢公司發(fā)現(xiàn)70%的IT預算被遺留系統(tǒng)消耗。
事實上,AWS并非唯一致力于解決此問題的公司。微軟在五月份通過GitHub CoPilot推出了AI驅(qū)動的應用程序現(xiàn)代化功能。
值得注意的是,AWS特別瞄準了Windows現(xiàn)代化,宣稱其智能體是一種快速簡便的方法,可以將.NET應用程序、SQL Server和舊版用戶界面升級到不受許可協(xié)議約束的開源替代方案。還有用于大型機和VMware遷移的新智能體。
Chua告訴Fierce,這些新工具可能有助于加速云遷移,并最終“為AI/其他投資釋放資源”。他補充說,電信運營商甚至可能受益,或許能夠利用這些工具來改造“諸如計費和OSS/BSS等已有數(shù)十年歷史的核心系統(tǒng)”。
原文:https://www.fierce-network.com/cloud/heres-what-we-think-aws-big-reinvent-news