服務(wù)器和機(jī)架式網(wǎng)絡(luò)基礎(chǔ)設(shè)施系統(tǒng)內(nèi)的光學(xué) I/O 模塊通常接受主動冷卻系統(tǒng)的直接冷卻,特別是來自機(jī)架式設(shè)備前面板的強(qiáng)制風(fēng)冷。機(jī)架式設(shè)備的散熱設(shè)計需要平衡 I/O 模塊的熱管理與處理器或 ASIC 的散熱,以避免 I/O 或 ASIC 工作溫度熱裕度過高。根據(jù)處理器冷卻需求和光學(xué) I/O 模塊總功率優(yōu)化冷卻策略,有助于實現(xiàn)適當(dāng)?shù)钠胶猓畲笙薅鹊靥岣呦到y(tǒng)的能效。
鏈路長度與數(shù)據(jù)傳輸率
用于 56G 和 112G 的光學(xué) I/O 模塊目前可以使用風(fēng)冷。在以 112G 或更高的數(shù)據(jù)傳輸率進(jìn)行相干光通信時,可插拔光學(xué) I/O 模塊的功率水平 (33W+) 可能需要將液冷措施擴(kuò)展到模塊。
112G 和 224G 兩代收發(fā)器仍將以 IEEE 802.3 標(biāo)準(zhǔn)中定義的標(biāo)準(zhǔn)鏈路長度為目標(biāo),因此系統(tǒng)設(shè)計人員和數(shù)據(jù)中心運營商不應(yīng)期望僅僅為了適應(yīng)光模塊的更高功率要求而改變標(biāo)準(zhǔn)。這意味著前幾代光模塊中已經(jīng)存在的熱需求預(yù)計會增加,而舊的熱管理方法可能效果不佳。
外形尺寸
可插拔光模塊帶來的挑戰(zhàn)在于,自近 20 年前采用光纖收發(fā)器模塊以來,其外形尺寸一直未發(fā)生變化?,F(xiàn)在,業(yè)界正在向 224G 發(fā)展,新一代光學(xué) I/O 模塊需要向后兼容現(xiàn)有的機(jī)架式設(shè)備,以便進(jìn)行升級。這意味著熱密度將繼續(xù)增加,可能導(dǎo)致強(qiáng)制風(fēng)冷這種冷卻光學(xué) I/O 模塊的唯一方法都不再有效。
散熱
附在光學(xué) I/O 模塊上的散熱片可增強(qiáng)強(qiáng)制風(fēng)冷系統(tǒng)的冷卻能力,但由于耐用性要求,散熱片受限于金屬與金屬之間的接觸,無法最大限度地傳熱。對于任何散熱片接觸來說,裸金屬接觸都是不可取的,而考慮到過去幾年光模塊功率水平的大幅提高,這一點在 I/O 模塊上尤為明顯。預(yù)計每個模塊的功率需求將增加至 40W,將進(jìn)一步加劇這一瓶頸。要改善裸露金屬接觸表面的熱接觸電阻,可以將熱界面材料 (TIM) 安裝到與可插拔模塊緊密接觸的騎乘式散熱片上,幫助提高傳熱效率。
將 TIM 安裝到騎乘式散熱片的問題在于 TIM 的可靠性。當(dāng)插入或從屏蔽罩中取出 TIM 時,模塊的鋒利邊緣會刮掉 TIM,導(dǎo)致熱效率在每次插配后都會降低,使它在插入幾次之后就不起作用了。如果這些模塊暴露在惡劣的現(xiàn)場條件下,例如由于電纜負(fù)載導(dǎo)致的斜角插入,這種耐用性挑戰(zhàn)會進(jìn)一步加劇,因為這會使脆弱的 TIM 表面更易暴露于模塊的鋒利邊緣。要確保重復(fù)插配的高可靠性,就需要重新設(shè)計散熱片接觸方法,以便 TIM 能夠經(jīng)受住多達(dá) 100 次的插配循環(huán)。
屏蔽罩/散熱片上的導(dǎo)熱片損壞
監(jiān)測模塊溫度
增加功率密度需要重新評估光模塊的傳統(tǒng)熱表征方法。傳統(tǒng)上,采用 70°C 外殼溫度要求作為熱規(guī)格(即作為數(shù)字光學(xué)監(jiān)控 (DOM) 溫度的指標(biāo))。然而,最近的研究表明,即使外殼溫度達(dá)到 70°C,模塊內(nèi)部的溫度敏感組件仍會有幾度的熱裕度。這會導(dǎo)致對系統(tǒng)熱可行性的結(jié)論不準(zhǔn)確,進(jìn)而導(dǎo)致冷卻系統(tǒng)過度運轉(zhuǎn)。例如,在 I/O 熱性能是限制因素的系統(tǒng)中,風(fēng)扇會以高于所需的速度運行以滿足外殼溫度要求,即使模塊內(nèi)部組件還有溫度殘留。一種新的熱表征(本報告稍后將討論)將有助于解決當(dāng)前方法的這一局限性。
模塊溫度圖解
模擬與測試
模擬/預(yù)測工程用于優(yōu)化系統(tǒng)設(shè)計、組件放置和冷卻策略,再進(jìn)行構(gòu)建和部署。在完成機(jī)械設(shè)計之前,優(yōu)化光模塊上的散熱片和強(qiáng)制風(fēng)冷方法通常需要模擬整個機(jī)箱內(nèi)的氣流。機(jī)架安裝服務(wù)器在高度和寬度方面是標(biāo)準(zhǔn)化的,大多數(shù)部署采用 1RU 外形尺寸。其他組件(例如芯片、附加卡、SSD 等)的放置會影響流經(jīng)機(jī)箱和一排 I/O 模塊的氣流路徑,從而影響冷卻效果。
組件級模擬對于光學(xué) I/O 模塊也很重要,因為它可以識別模塊主體上的熱點。模擬需要考慮模塊本身的內(nèi)部結(jié)構(gòu),其次是與孤立模塊的測量結(jié)果的相關(guān)性。單獨運行溫度測試時,需進(jìn)行接觸測量和紅外攝像機(jī)測量。了解了收發(fā)器中的熱特性后,就可以將它用作系統(tǒng)級模擬的輸入信息,然后進(jìn)行系統(tǒng)級測試和關(guān)聯(lián)。
熱模擬系統(tǒng)
浸入式冷卻
高功率 112G 和 224G 光模塊在浸入式冷卻系統(tǒng)中可以有效冷卻。雖然從熱負(fù)荷角度來看這是最有效的冷卻方法,但介電流體會給模塊連接器帶來挑戰(zhàn),主要是影響信號完整性。光學(xué)模塊和 I/O 連接器通常在設(shè)計時會假定周圍的電介質(zhì)是空氣,將空氣替換為其他電介質(zhì)會導(dǎo)致耦合效率低下。因此,浸入式冷卻機(jī)架安裝設(shè)備中的 112G 和 224G 通道將需要與介電流體兼容的專用模塊。如果優(yōu)先選擇浸入式冷卻,較低的效率和更專業(yè)的構(gòu)造會導(dǎo)致每個機(jī)架單元的成本更高。