|
引言/ G+ A( C1 a( ]! s5 z* Y; |% b
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢。然而,有效管理光學(xué)NoC的功耗帶來了新的挑戰(zhàn)[1]。$ P. f5 W6 y1 A
/ @, }# r) e" r, d本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動動態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測技術(shù)。
* F' s6 O o M7 o& ~/ Q R, o1 f4 |4 N# I& |* S
( r3 s' W# y& x- V
背景9 G: w. a& r6 i* A$ y
光學(xué)NoC使用光來傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:' q7 g2 q2 a4 l. q9 c( T
激光器:光源,可以是片外或片上調(diào)制器:將電信號轉(zhuǎn)換為光信號波導(dǎo):在芯片上引導(dǎo)光光電探測器:將光信號轉(zhuǎn)換回電信號# W/ e& Q1 L/ w3 a2 }6 N9 D1 ]: H
- W# V) {3 i- r4 V( V* f% G光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲。這意味著激光器通常需要持續(xù)供電,即使不主動傳輸數(shù)據(jù)時也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。; s+ i0 o3 v- Z1 {; t. P6 W
1 H" d5 f# h- x3 [. ^6 \為解決這個問題,研究人員開發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測的網(wǎng)絡(luò)活動動態(tài)調(diào)整激光功率。一般方法包括:5 u$ G0 J; g' e- n% W5 {9 n2 F
監(jiān)控網(wǎng)絡(luò)活動指標(biāo)預(yù)測未來活動相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)" V+ m$ x/ P2 a7 N: I' u
0 S6 N: N0 T6 {3 C) Y# l
讓我們看看為不同類型處理器提出的一些具體方案。
" g: o/ A$ _& E: j3 ^" \
* {: d2 f! h* S3 o3 P9 b; H4 Q/ C- u多核CPU設(shè)計中的激光調(diào)制方案2 S0 Z) f0 l* p& p& g U' f
Probe
4 T9 [. q" [+ c& @0 a最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個塊都有專用的片外激光器,可以使用單寫多讀(SWMR)總線廣播消息。( k* A3 S3 Z3 G4 O) s
6 k$ Y0 i% p& @# XProbe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測未來活動。使用兩種類型的預(yù)測器:用于低流量變化:過去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表
1 b3 G% d$ u5 E) Y& f6 B[/ol]
& ]$ A7 v; _5 S* V w. h錦標(biāo)賽預(yù)測器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。1 J0 U0 g1 i' F( A+ L% T- k- o
+ @' ], m z1 Q7 {6 o4 eColdBus
" ~& C6 n( W% h3 yColdBus采用不同的方法,基于L1緩存未命中預(yù)測活動。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來自L1未命中。, {& H* x2 P# o
) Z. K) m' T. K$ k5 k& b使用類似于分支預(yù)測器的基于PC的預(yù)測器來識別可能導(dǎo)致未命中的指令。然后,一個時期預(yù)測器估計這些未命中何時發(fā)生。
) i+ s2 e5 ^' E' z) |- k x4 T4 w/ [5 n6 s5 w
ColdBus還引入了一個"額外波導(dǎo)",為需要的站點提供應(yīng)急功率。
& z2 r8 h0 p( c9 t0 y3 v& R) W/ n( r$ s, Z7 Y( P5 K E
PShaRe
& A, I0 X/ S5 v0 c L" G5 L5 KPShaRe在之前工作的基礎(chǔ)上有幾個關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測器站點之間的功率共享重用浪費的光功率進行熱調(diào)諧$ \/ w( x! c) H7 ^; k. d) f1 ^: M8 K* |
[/ol]" f8 x. X- o4 V. l% _) k G
圖1顯示了整體架構(gòu):- b8 w0 ?3 k, T& q9 ?& Y2 f
) a- U/ h$ q+ _( D. k2 V
v0i132opydn64034878813.png (157.24 KB, 下載次數(shù): 3)
下載附件
保存到相冊
v0i132opydn64034878813.png
2024-9-22 01:17 上傳
- k3 V4 I/ K. T( k; P: G! }& i+ Z
圖1:PShaRe架構(gòu),顯示連接光學(xué)站點的功率和數(shù)據(jù)波導(dǎo)。1 v) c# z0 V& ^1 E
' \& F0 t0 @. G
神經(jīng)網(wǎng)絡(luò)預(yù)測器使用14個性能計數(shù)器輸入,對每個站點在下一個時期的活動進行二元預(yù)測。; k1 R: f1 u9 f
) E1 }, D5 ]' Q. K& G5 W5 w( M
BigBus
" `; z! s( u: [3 t對于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
9 z. ]5 [$ ]6 ~- q( K l" u
0 a, r& @. c' |6 y# t- I9 ]7 R圖2說明了BigBus設(shè)計:: i8 P7 s9 g, m+ s5 `" i
$ E/ _& S( V1 i- V! a
2lsssyofp4g64034878913.png (216.89 KB, 下載次數(shù): 4)
下載附件
保存到相冊
2lsssyofp4g64034878913.png
2024-9-22 01:17 上傳
$ D: V9 U5 ^. {# j! |
圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫的分層組織。
/ {% ]/ s4 H8 d4 P5 j! S9 X) o* I/ C, f1 U2 R; v
BigBus使用兩階段預(yù)測過程:每個站點根據(jù)等待時間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測與歷史數(shù)據(jù)結(jié)合
- a$ P5 H$ H, f, S6 T[/ol]
( y1 M4 w. G- S. Z: g- p這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
) T9 @# K" m* E+ f! D7 E$ F$ \( k- n1 a' j8 v
0 ^; ]$ t6 u+ d' q, R9 L7 h多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
( q: h: }) R& L$ ?) ^! m) p+ t對于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計將光網(wǎng)絡(luò)擴展到插槽之間。Nuplet同時使用片內(nèi)和片間光網(wǎng)絡(luò)。1 ^- n+ d4 A4 s4 N i; s
2 L; ~: I% M& b/ [% f; B0 N
片間預(yù)測機制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊列中的待處理事件
W0 r* d0 y2 [2 B: H[/ol]3 [5 i4 E: y4 t- n, c; o
功率請求表(PRT)存儲歷史令牌計數(shù)。預(yù)測將PRT值與當(dāng)前流量趨勢和隊列狀態(tài)結(jié)合。9 K( Y- m0 T' I# a2 R7 s) }
1 b* K# Q1 O7 K0 @$ y) L& r
GPU設(shè)計中的激光調(diào)制方案% ~5 F; T: o! H. A
由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來了獨特的挑戰(zhàn)。GPUOpt設(shè)計將光學(xué)NoC適配于GPU架構(gòu)。- k7 j( A$ Z6 a' I J0 ?. |' q
" U& Q1 I) F0 x" p% @5 z圖3顯示了GPUOpt的整體架構(gòu):, u9 w- j- K$ k4 ]' H& S
" n9 G# b- i7 D2 w
m5tbfrm3byw64034879013.png (198.05 KB, 下載次數(shù): 3)
下載附件
保存到相冊
m5tbfrm3byw64034879013.png
2024-9-22 01:17 上傳
! x+ y: c6 [, O圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。* H4 `, t" l$ O: I
5 y8 f6 n" q @6 D- JGPUOpt對流式多處理器(SM)站點和最后級緩存(LLC)站點使用不同的預(yù)測機制:
$ g4 s7 T; [" ~4 S1. SM站點使用基于以下因素的受限預(yù)測器(Restr_Pred):3 t# {" K# p: Z' K* r
接收的消息發(fā)送的消息等待時間
& \# d/ Q( v4 V5 g! c0 G4 u, j3 d; }- M& f1 e8 [& p0 W7 C
2. LLC站點使用考慮以下因素的靈活預(yù)測器(Flex_Pred):$ A' m j! Q& U! [
接收的消息發(fā)送的消息待處理事件. _" l) ?' R: w0 q |+ K
6 q1 z* M# S3 G$ ]) A" X
激光控制器將這些預(yù)測結(jié)合起來,確定整體功率需求。
0 b* B( t) p3 K
' O; Y( n9 J8 e& O
' @% T9 D: t/ e. N關(guān)鍵概念和趨勢
! t8 p& y; Y! h雖然具體方案各不相同,但一些共同主題和最佳實踐浮現(xiàn)出來:
2 @, O# Z1 B+ R l. }. `0 ~" f O7 {
1.將時間劃分為固定時期進行預(yù)測和重新配置( G' P9 s4 h, B. Y9 @$ \
2. 使用多個輸入指標(biāo):$ p" y4 D4 w2 W L
網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件
/ t+ z) |3 e' ?3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合2 X- L6 u& z) G4 F- \( [% v
4. 使用非線性預(yù)測函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系6 | O% O) j' E, S8 R% u( K: s# y0 H
5. 對不同流量類型進行單獨預(yù)測(如一致性與非一致性)- t" D# j: O) E* l) @
6. 分層設(shè)計以實現(xiàn)可擴展性
$ b% }" k! w* l6 H7. 盡可能重用未使用的光功率) ^* c; X8 s: Q8 H8 o! w5 e
8. 為特定架構(gòu)經(jīng)驗性地調(diào)整預(yù)測參數(shù)
/ J5 B, S: V: r7 ?0 q4 q% ?
! |3 Y( j4 p6 A圖4說明了有效激光調(diào)制可能帶來的功率節(jié)。# ?+ y4 q6 I; _9 j# m. u
8 r. c: ]2 ?* i
om02xkr3dhc64034879113.png (100.12 KB, 下載次數(shù): 3)
下載附件
保存到相冊
om02xkr3dhc64034879113.png
2024-9-22 01:17 上傳
+ s+ A. R; }3 u; }. x$ t% l0 B圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測試中的相對激光功耗。
. S- s& Z/ b- O2 z( J; `+ u( `- o0 Q" c6 Z
: n6 I8 n7 ?/ b% M, w9 B X1 L
未來方向( m c! T( P) n- [
隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實施,可以期待這些技術(shù)的進一步完善。方向包括:
/ {! ~6 `( n! Q* w7 ?5 Z用于更準(zhǔn)確預(yù)測的機器學(xué)習(xí)技術(shù)與應(yīng)用層知識的集成在運行時調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對新興工作負(fù)載(如AI加速)的專門化* q3 n( x6 U' R( u2 n% w( h
+ u" u; j* T9 ~/ g" L3 K- a/ g U- k: _! T
結(jié)論4 _$ i* L7 H* O7 s, A
有效的激光調(diào)制對實現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢非常重要。通過準(zhǔn)確預(yù)測網(wǎng)絡(luò)活動并相應(yīng)調(diào)整激光功率,可以在保持性能的同時最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來計算系統(tǒng)解鎖新的能效水平。: [3 b8 j' w9 [& ^5 g1 @1 G
. p- n& O p) J) \3 p
! F4 K1 ]! j% x2 O4 q U' D
參考文獻
- R" D4 N9 h+ L[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.) ~* Z7 u2 ]! A) b
5 a6 t( [1 Y) F5 P3 o! o
- END -
5 r$ B) k0 L8 o7 g) s+ r2 g4 k4 z/ I, r& Y, Y, Y! G: K
軟件申請我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請體驗免費版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。) y8 o4 k" c' e* _9 d) H. P$ ]
點擊左下角"閱讀原文"馬上申請; v% O/ a- K) r; ~ h& `
1 J" W; Y, Z {歡迎轉(zhuǎn)載
0 t# _( m2 O3 v6 @) k3 U7 `/ H6 V7 Z
轉(zhuǎn)載請注明出處,請勿修改內(nèi)容和刪除作者信息!/ v# h$ \% S* i8 ]. u
! {8 x; `" e8 ~" R: N% S( f6 p# ?' d/ r/ y$ S
- N/ T8 _; I* T5 J& `7 l) A
tlesfwadvw464034879213.gif (16.04 KB, 下載次數(shù): 4)
下載附件
保存到相冊
tlesfwadvw464034879213.gif
2024-9-22 01:17 上傳
) D% `- \3 [( a+ G h8 ]3 }
0 |6 N% S; ]$ ?' }+ [4 {- T, P關(guān)注我們1 m; z1 t2 ]4 D7 c0 z
# {2 u- w, J3 ?+ R0 l" S$ z( d
9 E) I" v4 m/ q s8 {7 ~. M
0rzxntnecf364034879313.png (31.33 KB, 下載次數(shù): 2)
下載附件
保存到相冊
0rzxntnecf364034879313.png
2024-9-22 01:17 上傳
3 z( ~& U) R& J6 i8 }5 n3 A | ( J; |% c& H' |+ U
wklhaednp3g64034879413.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊
wklhaednp3g64034879413.png
2024-9-22 01:17 上傳
# `, m; }' v. A0 ^. r
| 4 V9 \3 r9 |+ {' U
v05awecejyj64034879513.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊
v05awecejyj64034879513.png
2024-9-22 01:17 上傳
/ V+ A3 I0 p2 j/ \2 K1 k
|
9 g! V# \1 c# }0 C$ S+ i* F1 k4 B" h! G
6 k7 {1 A0 A) K# h9 d
! K& \" h% q& E6 ]5 L, s關(guān)于我們:; Q/ ^& f$ z3 s$ p* M
深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計自動化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計和仿真軟件,提供成熟的設(shè)計解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對光電芯片、微機電系統(tǒng)、超透鏡的設(shè)計與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。/ W) ^, V1 @& E% k+ Y4 C
& I2 C5 L @+ z Y8 a9 Dhttp://www.latitudeda.com/
% R6 U! ]9 v N(點擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|