你的位置:首頁(yè) > 電源管理 > 正文

借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

發(fā)布時(shí)間:2024-07-19 責(zé)任編輯:lina

【導(dǎo)讀】數(shù)據(jù)中心正在部署基于人工智能 (AI) 的技術(shù),處理器密集型服務(wù)器正在推動(dòng)能源需求的增長(zhǎng),下表說(shuō)明了這種發(fā)展趨勢(shì)所帶來(lái)的巨大影響。國(guó)際能源署 (IEA) 預(yù)測(cè),到 2030 年,數(shù)據(jù)中心的耗電量將占全球耗電量的 7%,相當(dāng)于印度全國(guó)的耗電量。


數(shù)據(jù)中心正在部署基于人工智能 (AI) 的技術(shù),處理器密集型服務(wù)器正在推動(dòng)能源需求的增長(zhǎng),下表說(shuō)明了這種發(fā)展趨勢(shì)所帶來(lái)的巨大影響。國(guó)際能源署 (IEA) 預(yù)測(cè),到 2030 年,數(shù)據(jù)中心的耗電量將占全球耗電量的 7%,相當(dāng)于印度全國(guó)的耗電量。


借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

圖 1:數(shù)據(jù)中心 CPU 和 GPU 技術(shù)的功耗。


由于電力需求不斷增長(zhǎng),關(guān)注能源效率至關(guān)重要。泰克與知名電源完整性專家 Steve Sandler 合作,開發(fā)了出色的測(cè)量技術(shù),旨在改進(jìn)下一代人工智能數(shù)據(jù)中心的運(yùn)營(yíng)效率/能效。隨著對(duì)電力的需求不斷增長(zhǎng),對(duì)能源效率的重視至關(guān)重要。與備受認(rèn)可的電力完整性專家史蒂夫·桑德勒(Steve Sandler)合作;泰克開發(fā)了良好的測(cè)量技術(shù),以提高下一代 AI 數(shù)據(jù)中心的運(yùn)營(yíng)/瓦特。


提高電源分配網(wǎng)絡(luò) (PDN) 的能效提高供電網(wǎng)絡(luò) (PDN) 的能源效率


PDN 必須為驅(qū)動(dòng)服務(wù)器機(jī)架中的 GPU 敏感負(fù)載提供許多低噪聲直流電源軌。追求更高速度和更高密度意味著,需要在更低電壓水平和更大電流下實(shí)現(xiàn)更快邊緣速率、更高頻率和更多軌道。這突顯了良好電源完整性的重要性。PDN 必須為驅(qū)動(dòng)這些服務(wù)器機(jī)架中 GPU 的敏感負(fù)載提供許多低噪聲直流電源軌。追求更高的速度和更高的密度意味著更快的邊沿速率、更高的頻率和更多的電源軌,但電壓水平更低,電流更高,如上圖所示。這強(qiáng)調(diào)了良好的電源完整性。


進(jìn)行電源完整性測(cè)試的目的是,驗(yàn)證到達(dá)負(fù)載點(diǎn) (POL) 的電壓和電流在所有預(yù)期運(yùn)行條件下是否滿足負(fù)載的電源軌規(guī)格要求。要在千兆赫頻率下準(zhǔn)確測(cè)量毫伏級(jí)電源軌噪聲,尤其需要注意。進(jìn)行電源完整性測(cè)量的目的是驗(yàn)證在所有預(yù)期工作條件下到達(dá)負(fù)載點(diǎn) (POL) 的電壓和電流是否符合負(fù)載的電源軌規(guī)格。在GHz頻率下,需要特別注意精確測(cè)量電源軌噪聲的毫伏。


讓我們通過(guò)基于的服務(wù)器系統(tǒng)的電源分配網(wǎng)絡(luò)高能級(jí)結(jié)構(gòu)圖,了解如何評(píng)估 PDN 性能。讓我們看一下如何通過(guò)基于服務(wù)器的系統(tǒng)上的配電網(wǎng)絡(luò)的高級(jí)視圖來(lái)評(píng)估 PDN 性能。


借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

圖 2:數(shù)據(jù)中心的高級(jí)配電網(wǎng)絡(luò)。


如圖所示,典型數(shù)據(jù)中心通過(guò) 12 V、24 V 或 48 V 直流電源為其基于 AI 的服務(wù)器供電,然后在主板上將電壓轉(zhuǎn)換為其他電源電壓。工程師能夠查看從電源輸出到 FPGA、處理器和其他復(fù)雜 IC 的鏈路中的每個(gè)環(huán)節(jié),因此可以將電源軌阻抗控制在非常低的水平,以便輸送由 GPU 技術(shù)驅(qū)動(dòng)的 AI 服務(wù)器所需的高電流。阻抗管理的棘手之處在于配電網(wǎng)絡(luò)由許多阻抗組成,包括電壓調(diào)節(jié)器、去耦電容器和 PCB 走線。高速交換和熱插拔服務(wù)器卡會(huì)引入意外的阻抗變化,這可能導(dǎo)致過(guò)多的瞬變或噪聲。如圖所示,典型的數(shù)據(jù)中心通過(guò) 12、24 或 48 V DC 電源為其基于 AI 的服務(wù)器供電,然后將其轉(zhuǎn)換為主板上的其他電源電壓。工程師能夠查看從電源輸出到 FPGA、處理器和其他復(fù)雜 IC 的鏈條中的每個(gè)環(huán)節(jié),因此必須將電源軌阻抗管理在非常低的水平,以便提供由 GPU 技術(shù)驅(qū)動(dòng)的以 AI 為中心的服務(wù)器中的高電流。使阻抗管理復(fù)雜化的是,網(wǎng)絡(luò)由許多阻抗組成,包括穩(wěn)壓器、去耦電容器和PCB走線。高速交換和熱插拔服務(wù)器卡會(huì)帶來(lái)意想不到的阻抗變化,從而導(dǎo)致過(guò)多的瞬變或噪聲。


要確保穩(wěn)定節(jié)能的設(shè)計(jì),首先要最大限度地減少 PDN 中的噪聲。電源軌噪聲規(guī)格可以達(dá)到數(shù)百兆赫或數(shù)千兆赫的頻率范圍,其幅度達(dá)到毫伏級(jí)。要確保穩(wěn)定、節(jié)能的設(shè)計(jì),首先要將 PDN 中的噪聲降至最低。電源軌上的噪聲規(guī)格可以上升到MHz或GHz頻率范圍,幅度以毫伏為單位。


評(píng)估能效首先要對(duì)交流線路輸入和輸出進(jìn)行電能質(zhì)量測(cè)量,以確保線電壓和線電流符合要求。用于評(píng)估質(zhì)量的測(cè)量值如下所示:評(píng)估能效首先要對(duì)交流線路輸入和輸出進(jìn)行電能質(zhì)量測(cè)量,以確保線路電壓和線路電流。


評(píng)估質(zhì)量的測(cè)量值如下所示:

  • 頻率頻率

  • 有效電壓和電流

  • 有效值 電壓和電流

  • 阻抗阻抗

  • 波峰因數(shù)(電壓和電流)波峰因數(shù)(電壓和電流

  • 有功功率、無(wú)功功率和視在功率真實(shí)功率、無(wú)功功率和視在功率

  • 功率因數(shù)和相位功率因數(shù)和相位


為了確保準(zhǔn)確進(jìn)行這些測(cè)量,示波器探頭的選擇非常重要;使用差分探頭測(cè)量系統(tǒng)的線電壓,使用電流探頭測(cè)量系統(tǒng)的線電流。確保這些測(cè)量準(zhǔn)確無(wú)誤;示波器探頭的選擇很重要;使用差分探頭測(cè)量系統(tǒng)的線路電壓,使用電流探頭測(cè)量系統(tǒng)的線路電流。


另一個(gè)關(guān)鍵測(cè)量是對(duì) PDN 控制環(huán)路響應(yīng)進(jìn)行頻率響應(yīng)分析。這將提供有關(guān)控制環(huán)路速度和電源穩(wěn)定性的重要信息。借助波特圖查看分析結(jié)果,圖 3 中是示例設(shè)置。另一個(gè)關(guān)鍵測(cè)量是對(duì)PDN的控制環(huán)路響應(yīng)進(jìn)行頻率響應(yīng)分析。這將提供有關(guān)控制回路速度和電源穩(wěn)定性的寶貴信息。波特圖用于查看分析,圖 3 中的設(shè)置示例如下。


借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

圖 3:電源分配網(wǎng)絡(luò)阻抗的測(cè)量設(shè)置。


電源完整性探測(cè)系統(tǒng)應(yīng)受重視電源完整性探測(cè)系統(tǒng)值得關(guān)注


當(dāng)今示波器配備的高阻抗 10X 無(wú)源探頭可能具有足夠的帶寬,但會(huì)使您想要測(cè)量的噪聲信號(hào)發(fā)生衰減。1X 探頭可無(wú)衰減地傳遞噪聲信號(hào),但其帶寬僅為幾百兆赫。具有 50? 輸入阻抗的傳輸線探頭或電纜具有出色的高頻性能,但在直流情況下會(huì)產(chǎn)生顯著負(fù)載,除非增加直流隔離器。  衰減傳輸線探頭產(chǎn)生的負(fù)載較小,同時(shí)保持低噪聲和高帶寬。當(dāng)今示波器附帶的高阻抗 10X 無(wú)源探頭可能具有足夠的帶寬,但它們會(huì)衰減您嘗試測(cè)量的噪聲信號(hào)。1X探頭通過(guò)噪聲信號(hào)而不衰減,但它們被限制在幾個(gè)MHz帶寬內(nèi)。輸入阻抗為 50 Ω的傳輸線探頭或電纜具有出色的高頻性能,但在直流時(shí)會(huì)造成很大的負(fù)載,除非添加直流模塊。 衰減傳輸線探頭提供更少的負(fù)載,同時(shí)保持低噪聲和高帶寬。


電源軌探頭是另一類低噪聲探頭,偏移范圍高達(dá) 4 GHz,直流偏移范圍為 -60 至 +60 Vdc。在識(shí)別噪聲源方面,電源軌探頭是一種比傳統(tǒng)無(wú)源探頭更準(zhǔn)確的替代工具,如下圖 4 所示。根據(jù)電源軌的電壓,可能需要直流阻斷器。  如果需要,請(qǐng)確保直流阻斷器為示波器提供浪涌保護(hù),并且不受直流或交流偏置的影響。電源軌探頭雖然能夠測(cè)量很小的噪聲,但也是單端測(cè)量。  因此,需要使用能夠進(jìn)一步減少測(cè)量接地環(huán)路誤差的同軸隔離器。Picotest 提供多種直流阻斷器和同軸隔離器來(lái)滿足此類需求。  詳細(xì)了解終極電源軌噪聲測(cè)量。電源軌探頭是另一類探頭,可在高達(dá) 4 GHz 的頻率下提供低噪聲和高失調(diào)范圍,直流失調(diào)范圍為 -60 至 +60 Vdc。在識(shí)別噪聲源方面,這被視為傳統(tǒng)無(wú)源探頭的更準(zhǔn)確替代方案;如下圖 4 所示。根據(jù)電源軌的電壓,可能需要一個(gè)直流塊。如果是這種情況,請(qǐng)確保它為示波器提供浪涌保護(hù),并且對(duì)直流或交流偏置不敏感。電源軌探頭雖然噪聲非常低,但也是單端的。為此,請(qǐng)尋找能夠進(jìn)一步減小測(cè)量接地環(huán)路誤差的同軸隔離器。Picotest提供一系列直流模塊和同軸隔離器來(lái)滿足這些需求。了解有關(guān)終極電源軌噪聲測(cè)量的更多信息。


借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

圖 4:使用無(wú)源探頭(下方跡線)和電源軌探頭(上方跡線)的電源線紋波測(cè)量比較。


快速低噪聲采集與超快速邊緣負(fù)載相結(jié)合,可模擬 AI 級(jí)處理器工作負(fù)載,從而可以準(zhǔn)確評(píng)估 PDN 設(shè)計(jì)中的電源軌噪聲電壓以及電源軌與電源軌之間的串?dāng)_。在結(jié)合使用泰克 5 B 系列 MSO 或 6 B 系列 MSO 示波器的情況下,Picotest提供了完整的負(fù)載設(shè)備系列,最高為 2,000 安培、1 納秒的邊緣負(fù)載,并支持高達(dá) 65Ms/s 的采樣率,以進(jìn)行精確的模擬實(shí)驗(yàn)。(見圖 5)快速、低噪聲采集與超快邊緣負(fù)載相結(jié)合,可模擬 AI 級(jí)處理器工作負(fù)載;允許準(zhǔn)確評(píng)估 PDN 設(shè)計(jì)中的電源軌噪聲電壓和電源軌到電源軌串?dāng)_。與泰克 5 系列 B MSO 或 6 系列 B MSO 示波器結(jié)合使用;Picotest 提供高達(dá) 2,000 安培、1ns 邊緣負(fù)載的完整負(fù)載系列,支持高達(dá) 65MS/s 的采樣率,以實(shí)現(xiàn)精確的仿真工作。(見圖5)


借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

圖 5  顯示了對(duì) AI 級(jí)處理器進(jìn)行偽隨機(jī)高幅度負(fù)載的特性分析。


使用 Picotest 負(fù)載設(shè)備進(jìn)行特性分析,并通過(guò)泰克 6 系列 B MSO 示波器進(jìn)行測(cè)量,可以確保特性分析的準(zhǔn)確性。泰克 6 系列 B MSO 示波器是捕獲低噪聲、高分辨率信號(hào)的理想儀器。圖5.顯示 AI 級(jí)處理器高振幅負(fù)載的偽隨機(jī)步長(zhǎng)的表征。這種表征的準(zhǔn)確性是通過(guò)使用 Picotest 負(fù)載實(shí)現(xiàn)的,并由泰克 6 系列 B MSO 示波器測(cè)量,非常適合低噪聲和高分辨率信號(hào)捕獲。


示波器測(cè)量分析有助于節(jié)省時(shí)間并減少錯(cuò)誤


識(shí)別和分析 PDN 中的故障點(diǎn)可能耗費(fèi)時(shí)間。在電源分配網(wǎng)絡(luò)中尋找紋波、過(guò)沖、欠沖、開啟、關(guān)閉、時(shí)間趨勢(shì)、穩(wěn)定時(shí)間和抖動(dòng)信號(hào)是一項(xiàng)復(fù)雜的任務(wù)。值得慶幸的是,當(dāng)今大多數(shù)現(xiàn)代示波器都提供了內(nèi)置分析軟件,用于設(shè)置儀器和自動(dòng)執(zhí)行信號(hào)采集和顯示。下方為波紋自動(dòng)測(cè)量示例。將這些特性內(nèi)置到儀器中,再加上具備通過(guò)遠(yuǎn)程 PC 進(jìn)行自動(dòng)化的功能,可以簡(jiǎn)化大型團(tuán)隊(duì)的 AI 性能評(píng)估工作,同時(shí),還可以評(píng)估 AI 支持性能隨時(shí)間和溫度的變化情況,以測(cè)試服務(wù)器的效率和耐久性。


借助電源完整性測(cè)試提高人工智能數(shù)據(jù)中心的能效

圖 6:自動(dòng)紋波測(cè)量,并在 5 系列 B MSO 示波器顯示屏的右側(cè)顯示注釋結(jié)果。


總結(jié)


由于人工智能 (AI) 推動(dòng)下一代數(shù)據(jù)中心的能源需求增長(zhǎng),評(píng)估電源分配網(wǎng)絡(luò) (PDN) 的性能和效率變得比以往任何時(shí)候都更加重要。隨著人工智能 (AI) 推高下一代數(shù)據(jù)中心的能源需求;評(píng)估供電網(wǎng)絡(luò)的性能和效率變得比以往任何時(shí)候都更加重要。采用良好的 PDN 測(cè)試和測(cè)量策略,將會(huì)使 AI 就緒數(shù)據(jù)中心達(dá)到最佳運(yùn)行性能、可靠性和能效,擁有良好的 PDN 評(píng)估測(cè)試和測(cè)量策略將導(dǎo)致數(shù)據(jù)中心在性能、可靠性和能源效率方面實(shí)現(xiàn)最佳功能、人工智能就緒。

(來(lái)源:泰克科技)


免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)聯(lián)系小編進(jìn)行處理。


推薦閱讀:

大幅提高48 V至12 V調(diào)節(jié)第一級(jí)的效率

貿(mào)澤推出全新汽車資源中心幫助工程師了解并引領(lǐng)EV/HEV技術(shù)的未來(lái)

基于熱性能的NIS(V)3071 PCB設(shè)計(jì)考慮因素

貿(mào)澤電子新品推薦:2024年第二季度推出超過(guò)10,000個(gè)新物料

觀眾登記開啟|elexcon2024深圳國(guó)際電子展8月27-29日約您來(lái)見,20+重磅活動(dòng)與數(shù)千新品引爆AI+技術(shù)生態(tài) 


特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉