|
引言
7 k3 d/ j) @% A8 ~+ @. w0 r隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來(lái)替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來(lái)了新的挑戰(zhàn)[1]。$ D+ T$ y- }! K& ~1 w" T3 l N0 f D* z$ D6 w
! J, w8 t& r# `* U
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。/ T4 W+ Z+ B+ @
- y' r3 A, C# i- f' n+ s
& F# c m7 a7 D# H M2 x% N4 a2 [背景1 T! x, t7 e& x8 ~6 r" f
光學(xué)NoC使用光來(lái)傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
+ A' r- D4 y9 {6 r( ?激光器:光源,可以是片外或片上調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)波導(dǎo):在芯片上引導(dǎo)光光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)9 m! e$ V( b; o3 d4 B0 g( P$ C9 v
) t6 G$ |3 |+ b0 M' H. \光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
/ k- K& \) c* [) @1 J
! f1 P: G0 Q: G$ H1 s; H6 N1 @為解決這個(gè)問(wèn)題,研究人員開(kāi)發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:
+ J+ a/ S2 }. N4 u/ Z監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò). L5 U/ K/ s5 P
: E. L4 {8 F n3 t3 ^2 x/ I" y* ]讓我們看看為不同類型處理器提出的一些具體方案。
6 x& q/ M. \" P& N3 ]3 {1 C; C$ c! }, t+ j0 R
多核CPU設(shè)計(jì)中的激光調(diào)制方案9 N' T; _, j0 s% W3 K
Probe
2 v" R- R+ V& S* s: f6 W8 h最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫(xiě)多讀(SWMR)總線廣播消息。/ x9 o$ j" f* E3 G( e$ o4 |
- g7 h+ x* d9 u; a0 ?
Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)。使用兩種類型的預(yù)測(cè)器:用于低流量變化:過(guò)去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表* [ k. d1 D8 x( i: X2 J4 k& l) Y( ^
[/ol]3 R/ O! P/ H, Z/ ]9 N7 E U7 w
錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。
9 l+ l3 v/ @! p# r2 a
* m, ?5 j' u& O. }ColdBus
1 s7 q- X7 t$ ~; z! wColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來(lái)自L1未命中。
) `' g- m! e! O9 V, S# D
3 U* ^, b( @- p$ G. R2 u使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來(lái)識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。8 L7 K& Q3 n, B4 _
/ s6 v9 g8 W! n' V
ColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。: l2 h- m1 m) w' e; Q
; o- u% }3 k5 E2 ^5 wPShaRe
* k7 w% M) b, {2 o' _ _7 HPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器站點(diǎn)之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧/ z. M5 O! _7 X8 P# o8 h {
[/ol]& G3 h, o: h# y) T: K& o/ o4 @" I& y
圖1顯示了整體架構(gòu):
1 U1 [1 b% c0 j7 Y# X7 b u) E N: A
cjhdyiznw5w64024513536.png (157.24 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
cjhdyiznw5w64024513536.png
2024-9-20 01:31 上傳
+ j5 i0 b4 @+ [6 V' L8 ?& [
圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。; B# z# Z$ \1 G( Z
! D( p1 ^: H' C' p* _9 A8 L9 {神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。( w: c, `, ], ?1 W0 s! l1 s. p
% F* Z! J4 C$ o& pBigBus
0 N" ~6 L8 `4 V5 l對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。7 W% S) Z4 a9 n3 p/ N" S
2 U2 I- U+ p6 u& L圖2說(shuō)明了BigBus設(shè)計(jì):
$ @- V9 X* t# ]7 X: Y% A( T4 h# c/ y$ j+ r
* Z! I& T7 t) T$ J7 @( o4 L
hck0tgbp1b364024513636.png (216.89 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
hck0tgbp1b364024513636.png
2024-9-20 01:31 上傳
) {) r* t7 x7 z圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫(kù)的分層組織。% K( C: o0 i4 O3 T2 L( ?9 p
8 U( a" x: T9 ?6 eBigBus使用兩階段預(yù)測(cè)過(guò)程:每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合' a2 M \0 ~2 Z
[/ol]& o2 q3 \ r( S3 |/ _0 T, V% h: B2 f
這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
1 d. l' ^* |' K& j" s
5 J( \- \' k2 I8 u3 o3 |& D
7 h6 k3 w/ H0 O1 X# g多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
" j+ p) K2 [ {2 k對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。4 ^+ d' X, r5 h9 k' [ J4 h% _- o7 E
8 b! G" i1 q! p" r+ s8 {) k, ]片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊(duì)列中的待處理事件( Q1 w( a/ o0 S6 w& S
[/ol]8 z, V3 @2 d$ o: g0 g
功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。! t3 W. H' E+ F! y
; @8 V, b) F/ |7 VGPU設(shè)計(jì)中的激光調(diào)制方案
! V$ w; B( G) E2 y! g由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來(lái)了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
4 w3 e0 }. D+ T& \2 U" w# Y3 z; Q3 O( X9 ?" {8 D
圖3顯示了GPUOpt的整體架構(gòu):
$ g. A$ a' I* j7 ?2 l ]% X! N$ Q' D" x6 S- `1 {
2r1e3lybmxf64024513736.png (198.05 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
2r1e3lybmxf64024513736.png
2024-9-20 01:31 上傳
1 v Z2 O+ b/ k0 c! k
圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。1 o% F$ F; B: B2 ]. ?
6 H% X' g9 N* Y: w' t1 G& \. MGPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制: q( ]8 ?! _: ?, x5 T* c, t( K$ d% e
1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):
. H5 Z; c1 o' S( W+ N# a接收的消息發(fā)送的消息等待時(shí)間
* u2 S2 y) K/ w* M9 n, C4 k& Q4 [" K0 Y+ P4 x
2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):" ]5 q, \& k7 i n0 m
接收的消息發(fā)送的消息待處理事件
, W9 }% V k2 n# q, F8 M
) M- O8 b! y" x: h& [0 o4 K激光控制器將這些預(yù)測(cè)結(jié)合起來(lái),確定整體功率需求。& b& F$ j, O* c3 m* B; Q1 s
! i# T: C2 o2 Y0 {) l3 Z% h/ |
' ?( G4 N+ K- l6 i& S% W關(guān)鍵概念和趨勢(shì)
8 _5 k! ]3 }$ X. t9 G8 b雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來(lái):. u! u& x+ e- D% j( c6 c: V- G. `
~- s& N) k7 p+ f
1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置
9 U6 r0 s; U+ T# i3 z2. 使用多個(gè)輸入指標(biāo):( G, D# a% _+ s# { _
網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類型待處理事件
: ?; f* M6 U& D. d) w3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合0 `, [$ ?+ |# @$ g& w7 ]" m8 Z
4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系* E: @0 O; ~7 |. z# [: \: i: x
5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)/ D/ v( }: N/ D
6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性" {/ H5 [/ w- Z! k! ?1 G
7. 盡可能重用未使用的光功率
5 M! ?# ^7 M/ `3 [2 T! q8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)
3 K) w$ W' M& k+ c
% P K$ k4 W# } Z Q圖4說(shuō)明了有效激光調(diào)制可能帶來(lái)的功率節(jié)。4 Z: H9 T* [% n/ M
# W$ D% I9 P g9 P- |
opnnfadxepq64024513836.png (100.12 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
opnnfadxepq64024513836.png
2024-9-20 01:31 上傳
+ ~+ `- o& }8 ~$ |( ~- m圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。3 `/ W0 s/ @! k+ I V& _# z, E2 [/ ]
/ S* y5 ^, v/ E' L+ m- [
% Y c. d7 ~# e: M% p3 J* C未來(lái)方向
0 W! l' P" k* y) j2 O! M隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:# a) T( e% H/ e2 g& M+ W* Q
用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識(shí)的集成在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對(duì)新興工作負(fù)載(如AI加速)的專門化" ^+ L t4 x' s! L- ] P
' s7 @" t- v2 S$ \+ [& L
0 c8 p# f J9 s3 i" m; ~, R* Q結(jié)論
( K0 J3 L8 |3 q6 t4 L有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過(guò)準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來(lái)計(jì)算系統(tǒng)解鎖新的能效水平。3 p s5 j. O( O
; l( A$ V+ |7 ?) A
9 k& L( \' Z( I+ U參考文獻(xiàn)0 U* f. {9 g/ o, [+ ^% d
[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.0 y1 l, c6 y6 u6 u3 W: t1 P
5 c7 Q1 q! x0 f9 @+ V
- END -3 e- b: D2 c# j0 s0 H
" ]7 m# R- s+ C' x! z0 o4 E) F0 `軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。5 l! T9 m# H& b# `- p# d" B
點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)* L/ ^5 a9 K1 ]0 s9 O6 h
( E( J9 T- K$ K( m" k1 d歡迎轉(zhuǎn)載
% H! S$ O% q4 z
' v9 _" C8 E0 \/ t' i7 m轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!
0 |: {# e/ ~4 K& I& ~7 ]5 X, h3 ^" a. X
+ t3 n: c" e# v# j# s q+ O5 a1 R: Q: ^5 _) H* O0 H# c
pqequtkewc264024513936.gif (16.04 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
pqequtkewc264024513936.gif
2024-9-20 01:31 上傳
# w( d7 n. u v, ^
" ~6 l9 T, o1 a( p關(guān)注我們
# G2 n, ?- h6 A& @2 x: n5 W% X1 ^
) f1 d9 c/ r$ ?+ N W4 ~
f04h1q5oxrw64024514036.png (31.33 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
f04h1q5oxrw64024514036.png
2024-9-20 01:31 上傳
; c# l! f3 y' D% l. }. Q
| 3 Z. Z4 g" k& N) e
ckxurcq3lg364024514137.png (82.79 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
ckxurcq3lg364024514137.png
2024-9-20 01:31 上傳
" q& f9 U- Q4 a
| . Q7 J( c( |& h. d$ i
rq40zwpyofx64024514237.png (21.52 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
rq40zwpyofx64024514237.png
2024-9-20 01:31 上傳
d: |+ A5 V" j j8 Z5 Z | * v* m* e- |; K- t/ |6 y& ]
8 ~7 |+ J' r. {" Z9 G: R
' {9 P" t( S/ O+ k4 A ]* E* h+ f# B0 L" }4 P: d: F# q
關(guān)于我們:
- {& p. e) x" `; O; f7 y p$ y" H深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開(kāi)發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
9 G/ X7 o) f, @0 M
( E) X- n' |. p% t; ^: Ihttp://www.latitudeda.com/
# X* R! E9 d6 |2 \(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|