電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 52|回復(fù): 0
收起左側(cè)

光學(xué)片上網(wǎng)絡(luò)的激光調(diào)制方案

[復(fù)制鏈接]

552

主題

552

帖子

4418

積分

四級(jí)會(huì)員

Rank: 4

積分
4418
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-18 08:00:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言
7 k3 d/ j) @% A8 ~+ @. w0 r隨著硅晶體管縮放接近極限,研究人員正在探索新技術(shù)以繼續(xù)提高處理器性能和效率。有前途的方向是使用片上光學(xué)網(wǎng)絡(luò)(也稱為光學(xué)片上網(wǎng)絡(luò)或光學(xué)NoC)來(lái)替代傳統(tǒng)的電氣互連。與電氣網(wǎng)絡(luò)相比,光學(xué)NoC在帶寬、延遲和功耗方面具有潛在優(yōu)勢(shì)。然而,有效管理光學(xué)NoC的功耗帶來(lái)了新的挑戰(zhàn)[1]。$ D+ T$ y- }! K& ~1 w" T3 l  N0 f  D* z$ D6 w
! J, w8 t& r# `* U
本文將探討用于最小化光學(xué)NoC靜態(tài)功耗的激光調(diào)制方案。我們將介紹基于網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)制激光功率的關(guān)鍵概念、架構(gòu)和預(yù)測(cè)技術(shù)。/ T4 W+ Z+ B+ @
- y' r3 A, C# i- f' n+ s

& F# c  m7 a7 D# H  M2 x% N4 a2 [背景1 T! x, t7 e& x8 ~6 r" f
光學(xué)NoC使用光來(lái)傳輸芯片上組件之間的數(shù)據(jù);緲(gòu)建模塊包括:
+ A' r- D4 y9 {6 r( ?
  • 激光器:光源,可以是片外或片上
  • 調(diào)制器:將電信號(hào)轉(zhuǎn)換為光信號(hào)
  • 波導(dǎo):在芯片上引導(dǎo)光
  • 光電探測(cè)器:將光信號(hào)轉(zhuǎn)換回電信號(hào)9 m! e$ V( b; o3 d4 B0 g( P$ C9 v

    ) t6 G$ |3 |+ b0 M' H. \光傳輸本身非常高效,但產(chǎn)生光的激光器消耗大量功率。一個(gè)關(guān)鍵挑戰(zhàn)是光子不能像電荷那樣容易存儲(chǔ)。這意味著激光器通常需要持續(xù)供電,即使不主動(dòng)傳輸數(shù)據(jù)時(shí)也是如此。這種靜態(tài)功耗可能占光學(xué)NoC總功耗的80-90%。
    / k- K& \) c* [) @1 J
    ! f1 P: G0 Q: G$ H1 s; H6 N1 @為解決這個(gè)問(wèn)題,研究人員開(kāi)發(fā)了激光調(diào)制方案,旨在根據(jù)預(yù)測(cè)的網(wǎng)絡(luò)活動(dòng)動(dòng)態(tài)調(diào)整激光功率。一般方法包括:
    + J+ a/ S2 }. N4 u/ Z
  • 監(jiān)控網(wǎng)絡(luò)活動(dòng)指標(biāo)
  • 預(yù)測(cè)未來(lái)活動(dòng)
  • 相應(yīng)調(diào)整激光功率
  • 重新配置網(wǎng)絡(luò). L5 U/ K/ s5 P

    : E. L4 {8 F  n3 t3 ^2 x/ I" y* ]讓我們看看為不同類型處理器提出的一些具體方案。
    6 x& q/ M. \" P& N3 ]3 {1 C; C$ c! }, t+ j0 R
    多核CPU設(shè)計(jì)中的激光調(diào)制方案9 N' T; _, j0 s% W3 K
    Probe
    2 v" R- R+ V& S* s: f6 W8 h最早提出的激光調(diào)制方案之一是Probe。使用64核架構(gòu),核心分組為4x4塊。每個(gè)塊都有專用的片外激光器,可以使用單寫(xiě)多讀(SWMR)總線廣播消息。/ x9 o$ j" f* E3 G( e$ o4 |
    - g7 h+ x* d9 u; a0 ?
    Probe根據(jù)鏈路利用率和緩沖區(qū)利用率指標(biāo)預(yù)測(cè)未來(lái)活動(dòng)。使用兩種類型的預(yù)測(cè)器:
  • 用于低流量變化:過(guò)去和當(dāng)前利用率的加權(quán)平均
  • 用于高變化:由利用率水平索引的模式歷史表* [  k. d1 D8 x( i: X2 J4 k& l) Y( ^
    [/ol]3 R/ O! P/ H, Z/ ]9 N7 E  U7 w
    錦標(biāo)賽預(yù)測(cè)器根據(jù)最近的準(zhǔn)確性在兩者之間選擇。
    9 l+ l3 v/ @! p# r2 a
    * m, ?5 j' u& O. }ColdBus
    1 s7 q- X7 t$ ~; z! wColdBus采用不同的方法,基于L1緩存未命中預(yù)測(cè)活動(dòng)。關(guān)鍵洞察是在共享內(nèi)存系統(tǒng)中,大部分網(wǎng)絡(luò)流量來(lái)自L1未命中。
    ) `' g- m! e! O9 V, S# D
    3 U* ^, b( @- p$ G. R2 u使用類似于分支預(yù)測(cè)器的基于PC的預(yù)測(cè)器來(lái)識(shí)別可能導(dǎo)致未命中的指令。然后,一個(gè)時(shí)期預(yù)測(cè)器估計(jì)這些未命中何時(shí)發(fā)生。8 L7 K& Q3 n, B4 _
    / s6 v9 g8 W! n' V
    ColdBus還引入了一個(gè)"額外波導(dǎo)",為需要的站點(diǎn)提供應(yīng)急功率。: l2 h- m1 m) w' e; Q

    ; o- u% }3 k5 E2 ^5 wPShaRe
    * k7 w% M) b, {2 o' _  _7 HPShaRe在之前工作的基礎(chǔ)上有幾個(gè)關(guān)鍵創(chuàng)新:
  • 一致性和非一致性流量的獨(dú)立網(wǎng)絡(luò)
  • 基于神經(jīng)網(wǎng)絡(luò)的非線性預(yù)測(cè)器
  • 站點(diǎn)之間的功率共享
  • 重用浪費(fèi)的光功率進(jìn)行熱調(diào)諧/ z. M5 O! _7 X8 P# o8 h  {
    [/ol]& G3 h, o: h# y) T: K& o/ o4 @" I& y
    圖1顯示了整體架構(gòu):
    1 U1 [1 b% c0 j7 Y# X7 b  u) E  N: A
    + j5 i0 b4 @+ [6 V' L8 ?& [
    圖1:PShaRe架構(gòu),顯示連接光學(xué)站點(diǎn)的功率和數(shù)據(jù)波導(dǎo)。; B# z# Z$ \1 G( Z

    ! D( p1 ^: H' C' p* _9 A8 L9 {神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器使用14個(gè)性能計(jì)數(shù)器輸入,對(duì)每個(gè)站點(diǎn)在下一個(gè)時(shí)期的活動(dòng)進(jìn)行二元預(yù)測(cè)。( w: c, `, ], ?1 W0 s! l1 s. p

    % F* Z! J4 C$ o& pBigBus
    0 N" ~6 L8 `4 V5 l對(duì)于非常大的核心數(shù)(500+),需要像BigBus這樣的設(shè)計(jì)。BigBus使用分層架構(gòu),將塊簇組成更大的單元。7 W% S) Z4 a9 n3 p/ N" S

    2 U2 I- U+ p6 u& L圖2說(shuō)明了BigBus設(shè)計(jì):
    $ @- V9 X* t# ]7 X: Y% A( T4 h# c/ y$ j+ r
    * Z! I& T7 t) T$ J7 @( o4 L
    ) {) r* t7 x7 z圖2:BigBus架構(gòu),顯示由蛇形光鏈路連接的核心和緩存庫(kù)的分層組織。% K( C: o0 i4 O3 T2 L( ?9 p

    8 U( a" x: T9 ?6 eBigBus使用兩階段預(yù)測(cè)過(guò)程:
  • 每個(gè)站點(diǎn)根據(jù)等待時(shí)間和待處理事件決定是否增加/減少令牌
  • 激光控制器將當(dāng)前預(yù)測(cè)與歷史數(shù)據(jù)結(jié)合' a2 M  \0 ~2 Z
    [/ol]& o2 q3 \  r( S3 |/ _0 T, V% h: B2 f
    這允許在當(dāng)前條件的響應(yīng)性和穩(wěn)定性之間取得平衡。
    1 d. l' ^* |' K& j" s
    5 J( \- \' k2 I8 u3 o3 |& D

    7 h6 k3 w/ H0 O1 X# g多插槽系統(tǒng)(MULTI-SOCKET SYSTEMS)中的激光調(diào)制方案
    " j+ p) K2 [  {2 k對(duì)于像服務(wù)器這樣的多芯片系統(tǒng),像Nuplet這樣的設(shè)計(jì)將光網(wǎng)絡(luò)擴(kuò)展到插槽之間。Nuplet同時(shí)使用片內(nèi)和片間光網(wǎng)絡(luò)。4 ^+ d' X, r5 h9 k' [  J4 h% _- o7 E

    8 b! G" i1 q! p" r+ s8 {) k, ]片間預(yù)測(cè)機(jī)制旨在確定要流通的仲裁令牌數(shù)量。它考慮:
  • 發(fā)送到片間光學(xué)站(ICOS)的消息
  • ICOS隊(duì)列中的待處理事件( Q1 w( a/ o0 S6 w& S
    [/ol]8 z, V3 @2 d$ o: g0 g
    功率請(qǐng)求表(PRT)存儲(chǔ)歷史令牌計(jì)數(shù)。預(yù)測(cè)將PRT值與當(dāng)前流量趨勢(shì)和隊(duì)列狀態(tài)結(jié)合。! t3 W. H' E+ F! y

    ; @8 V, b) F/ |7 VGPU設(shè)計(jì)中的激光調(diào)制方案
    ! V$ w; B( G) E2 y! g由于GPU側(cè)重于內(nèi)存帶寬而非延遲,因此帶來(lái)了獨(dú)特的挑戰(zhàn)。GPUOpt設(shè)計(jì)將光學(xué)NoC適配于GPU架構(gòu)。
    4 w3 e0 }. D+ T& \2 U" w# Y3 z; Q3 O( X9 ?" {8 D
    圖3顯示了GPUOpt的整體架構(gòu):
    $ g. A$ a' I* j7 ?2 l  ]% X! N$ Q' D" x6 S- `1 {
    1 v  Z2 O+ b/ k0 c! k
    圖3:GPU光學(xué)NoC的架構(gòu),顯示由光網(wǎng)絡(luò)連接的SM和LLC集群。1 o% F$ F; B: B2 ]. ?

    6 H% X' g9 N* Y: w' t1 G& \. MGPUOpt對(duì)流式多處理器(SM)站點(diǎn)和最后級(jí)緩存(LLC)站點(diǎn)使用不同的預(yù)測(cè)機(jī)制:  q( ]8 ?! _: ?, x5 T* c, t( K$ d% e
    1. SM站點(diǎn)使用基于以下因素的受限預(yù)測(cè)器(Restr_Pred):
    . H5 Z; c1 o' S( W+ N# a
  • 接收的消息
  • 發(fā)送的消息
  • 等待時(shí)間
    * u2 S2 y) K/ w* M9 n, C4 k
    & Q4 [" K0 Y+ P4 x
    2. LLC站點(diǎn)使用考慮以下因素的靈活預(yù)測(cè)器(Flex_Pred):" ]5 q, \& k7 i  n0 m
  • 接收的消息
  • 發(fā)送的消息
  • 待處理事件
    , W9 }% V  k2 n# q, F8 M

    ) M- O8 b! y" x: h& [0 o4 K激光控制器將這些預(yù)測(cè)結(jié)合起來(lái),確定整體功率需求。& b& F$ j, O* c3 m* B; Q1 s

    ! i# T: C2 o2 Y0 {) l3 Z% h/ |

    ' ?( G4 N+ K- l6 i& S% W關(guān)鍵概念和趨勢(shì)
    8 _5 k! ]3 }$ X. t9 G8 b雖然具體方案各不相同,但一些共同主題和最佳實(shí)踐浮現(xiàn)出來(lái):. u! u& x+ e- D% j( c6 c: V- G. `
      ~- s& N) k7 p+ f
    1.將時(shí)間劃分為固定時(shí)期進(jìn)行預(yù)測(cè)和重新配置
    9 U6 r0 s; U+ T# i3 z2. 使用多個(gè)輸入指標(biāo):( G, D# a% _+ s# {  _
  • 網(wǎng)絡(luò)利用率
  • 緩沖區(qū)占用率
  • 緩存未命中率
  • 指令類型
  • 待處理事件
    : ?; f* M6 U& D. d) w
    3. 將當(dāng)前指標(biāo)與歷史數(shù)據(jù)結(jié)合0 `, [$ ?+ |# @$ g& w7 ]" m8 Z
    4. 使用非線性預(yù)測(cè)函數(shù)(如神經(jīng)網(wǎng)絡(luò))捕捉復(fù)雜關(guān)系* E: @0 O; ~7 |. z# [: \: i: x
    5. 對(duì)不同流量類型進(jìn)行單獨(dú)預(yù)測(cè)(如一致性與非一致性)/ D/ v( }: N/ D
    6. 分層設(shè)計(jì)以實(shí)現(xiàn)可擴(kuò)展性" {/ H5 [/ w- Z! k! ?1 G
    7. 盡可能重用未使用的光功率
    5 M! ?# ^7 M/ `3 [2 T! q8. 為特定架構(gòu)經(jīng)驗(yàn)性地調(diào)整預(yù)測(cè)參數(shù)
    3 K) w$ W' M& k+ c
    % P  K$ k4 W# }  Z  Q圖4說(shuō)明了有效激光調(diào)制可能帶來(lái)的功率節(jié)。4 Z: H9 T* [% n/ M
    # W$ D% I9 P  g9 P- |

    + ~+ `- o& }8 ~$ |( ~- m圖4:ideal、Probe和ColdBus方案在各種基準(zhǔn)測(cè)試中的相對(duì)激光功耗。3 `/ W0 s/ @! k+ I  V& _# z, E2 [/ ]

    / S* y5 ^, v/ E' L+ m- [

    % Y  c. d7 ~# e: M% p3 J* C未來(lái)方向
    0 W! l' P" k* y) j2 O! M隨著光學(xué)NoC從研究轉(zhuǎn)向?qū)嶋H實(shí)施,可以期待這些技術(shù)的進(jìn)一步完善。方向包括:# a) T( e% H/ e2 g& M+ W* Q
  • 用于更準(zhǔn)確預(yù)測(cè)的機(jī)器學(xué)習(xí)技術(shù)
  • 與應(yīng)用層知識(shí)的集成
  • 在運(yùn)行時(shí)調(diào)整參數(shù)的自適應(yīng)方案
  • 考慮電氣和光網(wǎng)絡(luò)的整體優(yōu)化
  • 針對(duì)新興工作負(fù)載(如AI加速)的專門化" ^+ L  t4 x' s! L- ]  P
    ' s7 @" t- v2 S$ \+ [& L

    0 c8 p# f  J9 s3 i" m; ~, R* Q結(jié)論
    ( K0 J3 L8 |3 q6 t4 L有效的激光調(diào)制對(duì)實(shí)現(xiàn)光學(xué)片上網(wǎng)絡(luò)的潛在優(yōu)勢(shì)非常重要。通過(guò)準(zhǔn)確預(yù)測(cè)網(wǎng)絡(luò)活動(dòng)并相應(yīng)調(diào)整激光功率,可以在保持性能的同時(shí)最小化靜態(tài)功耗。隨著處理器架構(gòu)繼續(xù)發(fā)展,激光調(diào)制方案需要適應(yīng)新的設(shè)計(jì)約束和流量模式。該領(lǐng)域的持續(xù)研究有望為未來(lái)計(jì)算系統(tǒng)解鎖新的能效水平。3 p  s5 j. O( O

    ; l( A$ V+ |7 ?) A

    9 k& L( \' Z( I+ U參考文獻(xiàn)0 U* f. {9 g/ o, [+ ^% d
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.0 y1 l, c6 y6 u6 u3 W: t1 P
    5 c7 Q1 q! x0 f9 @+ V
    - END -3 e- b: D2 c# j0 s0 H

    " ]7 m# R- s+ C' x! z0 o4 E) F0 `軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無(wú)論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。5 l! T9 m# H& b# `- p# d" B
    點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)* L/ ^5 a9 K1 ]0 s9 O6 h

    ( E( J9 T- K$ K( m" k1 d歡迎轉(zhuǎn)載
    % H! S$ O% q4 z
    ' v9 _" C8 E0 \/ t' i7 m轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!
    0 |: {# e/ ~4 K& I& ~7 ]5 X, h3 ^" a. X

    + t3 n: c" e# v# j# s  q+ O5 a1 R: Q: ^
    5 _) H* O0 H# c

    # w( d7 n. u  v, ^
    " ~6 l9 T, o1 a( p關(guān)注我們
    # G2 n, ?- h6 A& @2 x: n5 W% X1 ^

    ) f1 d9 c/ r$ ?+ N  W4 ~ ; c# l! f3 y' D% l. }. Q
    3 Z. Z4 g" k& N) e
    " q& f9 U- Q4 a
    . Q7 J( c( |& h. d$ i

      d: |+ A5 V" j  j8 Z5 Z
                          * v* m* e- |; K- t/ |6 y& ]

    8 ~7 |+ J' r. {" Z9 G: R

    ' {9 P" t( S/ O+ k4 A  ]* E* h+ f# B0 L" }4 P: d: F# q
    關(guān)于我們:
    - {& p. e) x" `; O; f7 y  p$ y" H深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開(kāi)發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    9 G/ X7 o) f, @0 M
    ( E) X- n' |. p% t; ^: Ihttp://www.latitudeda.com/
    # X* R! E9 d6 |2 \(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表