|
引言4 ` d; p; D' K N" c1 W3 X
隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱(chēng)為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來(lái)替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來(lái)了新的挑戰(zhàn)[1]。. a* N; r. u7 Y) e
" l S: Y6 ~6 b- P
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。
5 y; a5 Z% \+ w8 F: m( f t
$ ~* D( G( f8 P2 |0 b9 `3 j5 l
背景
) c, W" d0 }; U' p9 o7 j$ |4 ^光學(xué)NoC使用光來(lái)傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
5 {9 p+ W1 `+ j激光器:光源,可以是片外或片上調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)波導(dǎo):在芯片上引導(dǎo)光光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)
) N0 P4 J5 Q% U' ?, X% J6 u2 f0 }# \# Z, `5 F
光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
4 C* o) \. {2 O* G# ~8 Z# Y/ L3 e7 G l. z& M' i
為解決這個(gè)問(wèn)題,研究人員開(kāi)發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:- A$ ]; D7 ?! o- H" N# e1 E
監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)相應(yīng)調(diào)整激光功率重新配置網(wǎng)絡(luò)
6 U) N- _7 h$ x! A0 i! ]
3 E" Q+ j% J* L2 i讓我們看看為不同類(lèi)型處理器提出的一些具體方案。4 Z% ~% @6 I. @4 r
3 k1 g4 U" k( v/ r' @. E$ ~& v多核CPU設(shè)計(jì)中的激光調(diào)制方案
' ~$ J0 S: {1 VProbe
4 L/ y3 \ q+ Z8 ]% r: j最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專(zhuān)用的片外激光器,可以使用單寫(xiě)多讀(SWMR)總線(xiàn)廣播消息。
9 [! i9 X# o' A9 n' Y4 J3 y9 W5 o' a/ {0 u4 _6 r
Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)。使用兩種類(lèi)型的預(yù)測(cè)器:用于低流量變化:過(guò)去和當(dāng)前利用率的加權(quán)平均用于高變化:由利用率水平索引的模式歷史表9 [/ t/ O3 X2 P8 O; R+ o* w$ u
[/ol]
1 j$ t, @3 N- j3 [( @2 Q錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。1 a) \! k/ O! Q7 N( ^
. M# m1 h) j) N
ColdBus
/ ~4 n( v3 n: d1 J+ cColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來(lái)自L(fǎng)1未命中。
* ` _$ F0 X* l9 A4 i2 o
6 d. L' |: O: x使用類(lèi)似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來(lái)識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。9 {: N: l. |" m+ X+ T. ]
6 O, [) X: W( }4 ~ColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。, U9 _1 c: J: ^7 G: @3 u* E( ~/ p( V
' @) ^7 r5 _; B4 M0 z/ c/ j# O
PShaRe
$ M0 h" e6 m: y( {. B& Z* ~0 X% RPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)基于神經(jīng)網(wǎng)絡(luò)的非線(xiàn)性預(yù)測(cè)器站點(diǎn)之間的功率共享重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧1 X! o- u/ L) L0 B; k% T
[/ol]
' G! ^8 G$ |7 d# X5 Z圖1顯示了整體架構(gòu):
5 f1 k- t6 n$ O4 c% V
( V& E5 y; [' ?
v0i132opydn64034878813.png (157.24 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
v0i132opydn64034878813.png
2024-9-22 01:17 上傳
9 i) D5 B8 N* d2 a, l) x4 ?圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。/ J/ P9 U8 J1 d
' f& O, r2 v! t4 q: l; W- @1 w
神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。
! ?2 N' Y( J, a: q |! ?
# V. f+ \# f( V5 [0 F; l, i) c$ LBigBus1 d; M/ o" m3 r6 u
對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。
# |) a+ d* p. g' |$ a; d9 B
& C3 A$ k: v8 G/ J9 V% X) W* n( K圖2說(shuō)明了BigBus設(shè)計(jì):
4 g/ e0 [4 q" p6 p: `$ G! j6 [- F% I" F
- e+ f7 h% j% R& |! D) w
2lsssyofp4g64034878913.png (216.89 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
2lsssyofp4g64034878913.png
2024-9-22 01:17 上傳
9 D3 s2 K5 x- Z4 ?6 C1 ^; p, F& u# h圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫(kù)的分層組織。+ e5 t& @* N6 ?% x( G. g
; U/ i7 O- x8 }" h8 d' N! Y5 M3 O
BigBus使用兩階段預(yù)測(cè)過(guò)程:每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合* h7 |5 u: V5 ~: y W5 ?5 ?; T
[/ol]# O5 P. \% Q9 G5 V) H' w
這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
, m+ w3 X9 P, d: @, m' A- o" Y4 w$ l8 t3 t6 o$ |
8 p0 F8 s* u; n多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案5 f5 e. T2 f2 q& w: D
對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。
* ]6 \ `. P9 T, {1 `! F7 y7 o! N% E% }" S3 r$ O
片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:發(fā)送到片間光學(xué)站(ICOS)的消息ICOS隊(duì)列中的待處理事件- c# _4 X( g+ Q( S* ~+ h
[/ol]
) f. S ~/ x( h4 \+ _; i! {: h功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。6 ]2 m* b. E [* c
& M+ I/ S3 ?3 e( Q& a$ n& A
GPU設(shè)計(jì)中的激光調(diào)制方案
" V/ I, {! Q, T& d4 ~9 @- g6 X0 c由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來(lái)了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
* V% a& z: f) E7 s3 Y# d
: d8 L1 d3 \0 B圖3顯示了GPUOpt的整體架構(gòu):
; {5 U8 Z$ |9 {; I& T, Q/ ~9 H/ N% l4 |8 z" A
m5tbfrm3byw64034879013.png (198.05 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
m5tbfrm3byw64034879013.png
2024-9-22 01:17 上傳
9 r' l7 p, j4 L8 X0 X- X圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。
3 N& U% g; I8 g% E8 b; f c+ N0 q7 a5 X# S% |
GPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:
8 J2 C) s$ V) Q3 [1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):! ~. B9 h9 G! d2 k. F; t0 {; @
接收的消息發(fā)送的消息等待時(shí)間: v0 w4 [7 ]5 r( u' h) M9 D
2 d7 Z( N+ c: y4 P2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):6 f9 c7 d' d- B A7 j7 T
接收的消息發(fā)送的消息待處理事件
1 k% c2 W" s( j! R% Y* G% F$ S# J$ Y
8 Z& ]$ l8 _0 s6 {( L激光控制器將這些預(yù)測(cè)結(jié)合起來(lái),確定整體功率需求。
9 _ T1 |# g8 |( S d/ k* l
; U% g3 M3 D- T- J# q# ]. k, h. ?9 c' J- e# C0 W8 C
關(guān)鍵概念和趨勢(shì)* m1 ?- z( @3 t% s
雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來(lái):
+ E! z+ c$ \ D+ J& I
6 b! n5 ?( e1 Y1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置7 w. }' U& H( G( Z, Z
2. 使用多個(gè)輸入指標(biāo):# l6 Y) @% o+ \
網(wǎng)絡(luò)利用率緩沖區(qū)占用率緩存未命中率指令類(lèi)型待處理事件5 c" b( b5 S) P
3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合! ^$ ]: J \' ?% n- z( l. \0 B
4. 使用非線(xiàn)性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系4 \. _* a8 [: }# X8 w
5. 對(duì)不同流量類(lèi)型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)+ v6 A4 m. \4 T# `' i* H9 Q1 \
6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性
. V! y$ q k/ N2 H7. 盡可能重用未使用的光功率6 d$ e3 w0 E( i `7 A
8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)
" L5 Z7 ]" |- w0 N/ W
! [: H1 T1 X; ?+ v+ o. i! p; |圖4說(shuō)明了有效激光調(diào)制可能帶來(lái)的功率節(jié)。
. @: I# }) f0 X% C" g% `; Z/ V b: L% Q/ k7 ^
om02xkr3dhc64034879113.png (100.12 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
om02xkr3dhc64034879113.png
2024-9-22 01:17 上傳
8 a; R+ L1 ^/ b( s圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。
3 j; g' C! b: b0 u0 Y4 e) j$ i1 c' ^. N) C: i. y
' q6 N4 u @' }/ A2 V# z未來(lái)方向
. R/ Q3 Z7 E" s: S9 v隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:+ t* T5 J' T2 K" O' C
用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)與應(yīng)用層知識(shí)的集成在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化針對(duì)新興工作負(fù)載(如AI加速)的專(zhuān)門(mén)化* L2 t$ o- P. S. t$ `9 x
/ V: J6 B- m. B8 j
9 J6 j/ H6 B- L# c結(jié)論
# W" O9 P* K L, K有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過(guò)準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來(lái)計(jì)算系統(tǒng)解鎖新的能效水平。6 Q; s' A* o# |3 d! f' W8 S, e
. w2 e) U- z) W* r6 Y
. W5 d7 R; n9 X! ?7 P參考文獻(xiàn)
3 Z4 v% j" Y( G9 I; O8 S[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.0 l: f" B I/ F4 t% f0 j
; y, B4 C# b& X* r; c$ c. W- END -
: E+ O0 M- G F) q; J! o
) n: V5 g f: ~& R6 _' O軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。0 t8 k7 ]9 [, z9 C) Y
點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)+ w u# U+ d8 a+ @3 [
( A9 |+ P+ \ S
歡迎轉(zhuǎn)載7 t4 y4 ] F( y! ?+ U2 B2 A4 j
* o6 @! U2 I( g
轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!
# E. E8 g8 k5 a" d: T$ ]' {# I; P+ L c$ Q) `1 T
0 `: h4 J; ]$ d; L& D
& ^/ t( j. {; N1 ~2 y- b0 }
tlesfwadvw464034879213.gif (16.04 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
tlesfwadvw464034879213.gif
2024-9-22 01:17 上傳
" q/ l3 H+ |6 h" z. |4 h* Q4 L% c- N. W7 J
關(guān)注我們# Y( Z9 H! }" {
. w! P6 M7 R' ~# u5 q1 l" t* F+ m! t7 O0 \
0rzxntnecf364034879313.png (31.33 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
0rzxntnecf364034879313.png
2024-9-22 01:17 上傳
H' w6 g a# u- l4 G. F, e7 U, |2 [
| 7 d" J+ g& r# @# }5 M
wklhaednp3g64034879413.png (82.79 KB, 下載次數(shù): 1)
下載附件
保存到相冊(cè)
wklhaednp3g64034879413.png
2024-9-22 01:17 上傳
|9 J _) u+ U
| / y+ S! w! F$ ~
v05awecejyj64034879513.png (21.52 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
v05awecejyj64034879513.png
2024-9-22 01:17 上傳
9 P: \+ i3 R7 x4 i9 u | 2 m- h( z2 P0 x6 p1 W
3 e* [; u P8 r I# @1 z0 i3 H3 ~* N* f. c) k
, C8 ]+ D/ J( ~, [% t
關(guān)于我們:
+ Y# _' d9 f/ y2 P: u' i深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專(zhuān)注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開(kāi)發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶(hù)。逍遙科技與國(guó)內(nèi)外晶圓代工廠(chǎng)及硅光/MEMS中試線(xiàn)合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶(hù)提供前沿技術(shù)與服務(wù)。
, _) C; \. @ M# z1 H2 B
, U# g9 [ G# P( T: c4 E' j* _6 dhttp://www.latitudeda.com/9 |6 y: M) u+ x% {5 w. t
(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|