數日前,SimilarWeb更新了一份關于聊天機器人ChatGPT訪問數的數據統(tǒng)計。數據顯示,2023年4月ChatGPT訪問量再創(chuàng)新高,已經超過了必應、DuckDuckGo等其他國際搜索引擎,也超越了紐約時報和CNN等知名網站;目前ChatGPT訪問數已經達到百度搜索引擎的60%,谷歌搜索引擎的2%。
圖1:ChatGPT訪問數據統(tǒng)計(圖源:SimilarWeb)
當然,不光是ChatGPT,近一段時間以來,全球科技巨頭紛紛發(fā)布自己的大模型。北京時間5月11日,谷歌宣布推出最新大型語言模型PaLM 2,在部分任務上已經超越GPT-4;在中國市場,百度、360、阿里、華為、京東、騰訊等也都紛紛推出了自己的AI大模型。
訪問量陡增的ChatGPT,加上紛至沓來的AI大模型,AIGC(人工智能生成內容)產業(yè)不僅帶來檢索效率和工作效率的提升,同時由于大模型需要大量的數據和算力進行訓練和運行,并在使用過程中產生大量新的數據,因此對底層基礎設備提出了更高的要求。
在數據傳輸方面,光通信行業(yè)市場調研機構Lightcounting曾在2021年時預測,800G光模塊將從2025年底開始主導市場。如今,在GPT等大模型的帶動下,這一節(jié)奏明顯提前。市場消息顯示,目前已經有云服務廠商開始集中測試和采購800G光模塊,相關需求將在2023年下半年開始集中爆發(fā)。
800G以太網需求提前爆發(fā)
為什么頭部云服務商如此重視800G以太網用以數據傳輸呢?
最直接的回答就是:為了應對數據大爆炸。就以AI大模型訓練而言,公開數據顯示,從GPT-1到GPT-3,模型的參數量從1.1億個增長到了1750億個。有傳言稱,GPT-4模型的參數達到5000億個,甚至可能超過萬億規(guī)模。根據市場調查機構TrendForce的數據,如果以英偉達A100顯卡的處理能力計算,GPT-3.5大模型需要2萬塊GPU來處理訓練數據。
因此,在算力集群的超算中心里,先進芯片和先進算力之間并不是劃等號的,算力芯片只是提供了算力,而要高效利用算力還需要依賴光模塊、存儲等芯片的支持。
如下圖所示,這是中國移動在《算力網絡白皮書(2021年版)》中分享的一張算力網絡體系架構。在這個結構中,中國移動將其分為算網底座、算網大腦、算網運營三個部分,其中在算網底座這部分,全光底座是行業(yè)的共識。因此,先進算力實際上是遵循“木桶效應”的,算力、存儲和網絡傳輸三大核心環(huán)節(jié),一個出現短板,整個系統(tǒng)的性能就會出現巨大的下滑,這便是為什么云服務商積極部署800G以太網光模塊的原因。
圖2:先進算力網絡框圖(圖源:中國移動)
目前,已經有多家方案商表示已經完成800G光模塊送樣量產。供需大幅度提前讓LightCounting修改了自己在2022年的預測,該機構在今年3月份最新預測中表示,雖然今年整個以太網光模塊市場將出現10%的下滑,但是800G光模塊市場將在2023年維持高速增長。
當然,不光是800G光模塊,在交換機芯片和交換機整機方面,產業(yè)也是快速跟進。2022年8月,博通正式發(fā)布自己的Tomahawk 51.2 Tbps交換機芯片;在2022年OCP全球峰會上,思科發(fā)布了兩款新的800G交換機系列——Nexus 9232E和8111交換機,以及帶有100G和400G接口的800G光模塊。如下圖所示,過去12年里,交換機的交換能力已經從640G發(fā)展到102.4T。
圖3:交換機容量擴張年表
800G以太網的優(yōu)勢
當前,芯片廠商如博通等,設備廠商如思科等,云服務商如亞馬遜等,圍繞著高性能計算、5G和深度學習等產業(yè)積極向800G以太網過渡。
對于高性能計算和深度學習訓練等領域而言,800G以太網具有兩大突出的賦能價值。其一是在同等算力規(guī)模下,800G以太網能夠帶來倍增的計算效率。通過以太網技術聯盟發(fā)布的800GBASE-R規(guī)范可以看出,800G以太網是400G的延伸和擴展,最直觀的改變是帶寬是此前400G以太網的兩倍。如下圖所示,端到端的以太網通信實際上可以抽象為這種連接,如果交換機全部端口從400G升級到800G,那么交換機傳輸容量將直接翻倍。
圖4:端到端800G以太網實施用例
其二是能夠進行更大規(guī)模的算力集群。我們都知道,算力網絡最底層的算力底座一般會分為算力基礎設施和網絡基礎設施,兩者融合使得目前的數據中心和算力中心呈現出一種類似葉脊的架構。結合下圖來看,這是Facebook構建的樹形數據中心網絡架構,名為data center fabric網絡架構,里面的連接無處不在。
圖5:4層data center fabric網絡架構(圖源:Facebook)
從上圖的上方不難看出,data center fabric網絡架構是一個四層結構,也被成為“F4結構”。不過,Facebook在2019年已經將其升級為“F16結構”,原因是數據暴漲和設備更新讓“F4結構”已經難以適應。
參考下圖來看,“F16結構”明顯是更大規(guī)模的算力集群,連接數量和服務器數量都更多。預計這個結構很快也會更新,因為在2019年Facebook認為400G并不成熟,所以只支持了100G以太網,如今800G已經步入商用,這個集群規(guī)模顯然太小了。
圖6:16層data center fabric網絡架構(圖源:Facebook)
800G以太網的部署挑戰(zhàn)
在具體實現的過程中,800GBASE-R規(guī)范并非是簡單地將兩個400G拼接在一起,而是引入了新的介質訪問控制(MAC)和物理編碼子層(PCS),能夠以最小的成本實現800G。由于新的PCS包含對之前PCS的重用,因此保留了標準RS(544, 514)前向糾錯,并提供了很好的向后兼容特性。
下圖是800G Pluggable MSA工作組在《800G MSA白皮書》中給出的示意圖,這是一種能夠快速上市的800G實現方案,通過重新調整兩個400G的PMA,進而得到一個800G的PMA,再定義一個低成本的800G的PMD,最終實現基于8通道100Gb/s技術的800G以太網。
圖7:800G SR8方案系統(tǒng)框圖(圖源:MSA)
當然,為了繼續(xù)向1.6T以太網進化,MSA工作組在白皮書中指出,后續(xù)800G會通過每通道200G PAM4技術進行優(yōu)化,并且DSP芯片會采用更先進的工藝制程,因此這是一種更加低功耗、低延遲的解決方案。不過,如MSA工作組所言,這種實現方式實際上是為了從800G向1.6T過渡,是一種未來式的實現方式。
圖8:800G FR4方案框圖(圖源:MSA)
雖然系統(tǒng)框圖都已經很清晰,不過要完成800G交換芯片的設計還是會遇到很多挑戰(zhàn)。
首先,第一個顯著的問題是,800G并不是簡單的兩個400G疊加,那么MAC、PCS和PMA被集成之后,如何保證整個系統(tǒng)能夠實現最佳的性能和延遲。
下圖展示的是一個800G芯片的設計框圖,對于這款芯片而言,信號完整性、電源完整性等方面的測試只是基礎,重點是如何系統(tǒng)性優(yōu)化beachfront、SerDes、PCS和MAC這些塊分區(qū)。如果是在交換機芯片研發(fā)設計的過程中,又會分為單裸片方案、雙裸片方案和Chiplet三個不同的類型,需要考慮的因素都不同。比如在Chiplet配置方式里,需要考慮如何更好地進行模塊劃分,如何進行參考時鐘布線等。
圖9:具有8通道100G Serdes的800G芯片示例圖
為了保證在各種實現方式中,整個芯片的信號一致性和低延遲,就需要一種高效的FEC,用以補償更快傳輸速度下必然伴隨的更高錯誤率。
第二個挑戰(zhàn)是芯片功耗和面積難題。目前800G芯片采用的是112G SerDes或PHY技術,進而打造成一款并行處理能力強和時鐘速度快的硬件。雖然采用先進制程,不過為了保證良率,芯片面積不能過小。然而,在交換機中,器件的集成度只會越來越高,因此合適的芯片尺寸是一個非常值得考究的問題;另外,高速芯片必然伴隨功耗問題,如果功耗過高就需要在交換機中加入額外的、昂貴的冷卻系統(tǒng)。
第三個挑戰(zhàn)也來自112G SerDes或PHY技術,那就是如何做到更好的跨信道傳輸。為了讓各個112G SerDes或PHY之間具有最小的串擾(xtalk)影響,在芯片實現的過程中往往會采用增加封裝層數,以滿足高速SerDes或PHY串擾規(guī)格,這必然會帶來更高的成本挑戰(zhàn)。同時,多層封裝也需要考慮南北(N/S)、東西(E/W)方向進行封裝出線的問題。
因此,如果要打造一款高性能的800G芯片,就需要擁有用于優(yōu)化beachfront、SerDes、PCS和MAC設計的專業(yè)知識,同時對時鐘布線、封裝出線和Chiplet等有深刻的認識。如此,才能夠打造出一顆完美的800G芯片。
新思科技800G以太網方案
看到了挑戰(zhàn)和要求,可能對一些想要從事800G以太網芯片研究的人進行了勸退。為了幫助大家應對這些挑戰(zhàn),新思科技提供了業(yè)界唯一完整的200G/400G/800G以太網IP解決方案。
作為全球以太網IP開發(fā)的領航者,新思科技能夠為業(yè)界提供經過硅驗證的800G以太網IP方案。我們上面提到,800G是基于112G SerDes或PHY技術進行實現。新思科技112G以太網PHY IP解決方案可實現真正的長距離、中距離、極短距離和超短距離(LR、MR、VSR、XSR)接口,以及CEI-112G-Linear和CEI-112G-XSR+光接口,是支持實現800G光模塊和800G交換機的理想方案。
早在2021年1月,新思科技就已經推出經過硅驗證的采用5納米FinFET工藝的112G以太網PHY IP,提供超出IEEE 802.3ck和OIF標準電氣規(guī)范的卓越信號完整性和電氣性能。研發(fā)人員借助這款PHY IP能實現高集成度的800G以太網芯片,擁有顯著的性能、面積和功耗優(yōu)勢。這款IP主要用于長距離和中距離接口,能夠在大于45dB的信道中以低于5pJ/bit實現出色的BER(誤碼率)。
另外,用于極短距離接口的新思科技112G以太網PHY可以在大于20dB的信道中以低于3pJ/bit的速度實現出色的BER;用于超短距離接口的新思科技112G以太網PHY可以在大于10dB的信道中以低于1.4pJ/bit實現出色的BER。
這些PHY IP全部都支持在芯片的四個邊緣進行布局和堆疊,最大限度地提高每個芯片邊緣的帶寬。它們都支持脈沖幅度調制4級(PAM-4)、不歸零(NRZ)信號和獨立的每通道數據速率,并以極高的靈活性支持PCI Express®、DDR、HBM、Die-to-Die、CXL和CCIX等廣泛的連接協議。
為了使研發(fā)人員能夠加速基于以太網設計的驗證收斂,新思科技還推出了用于以太網的VC VIP,提供一套全面的協議、方法、驗證和生產力功能。
圖10:新思科技以太網VIP
通過這些IP和VIP,再結合新思科技在路由可行性研究、封裝基板指南、信號和電源完整性模型以及串擾分析等方面的全面經驗,研發(fā)人員可實現高速可靠的800G芯片開發(fā)。
當然,在此還需要額外提到,新思科技112G以太網PHY是該公司廣泛的IP產品組合中的一部分,新思IP產品組合包括邏輯庫、嵌入式存儲器、嵌入式測試、模擬IP、有線和無線接口IP、安全IP、嵌入式處理器和子系統(tǒng),對高性能HPC應用進行全方位的賦能。
結語
AIGC產業(yè)的爆發(fā)進一步帶動了800G以太網的需求。通過引入全新的MAC和PCS,800G以太網找到了當前最經濟理想的實現方案——8通道112G SerDes或PHY技術。不過,要把800G SR8方案系統(tǒng)框圖兌現到具體的800G芯片中,依然面臨著性能、功耗、面積和信號完整性等多方面的挑戰(zhàn),幫助大家克服這些挑戰(zhàn),便是新思科技112G以太網PHY IP和以太網VIP的價值所在。
新聞來源:TechSugar