|
引言
: S7 g8 T9 T8 `* f$ k基于可編程馬赫-曾德干涉儀(MZI)網(wǎng)格實(shí)現(xiàn)的光神經(jīng)網(wǎng)絡(luò)(ONN)已成為加速機(jī)器學(xué)習(xí)計(jì)算的方法。本文概述了基于MZI的光處理器,重點(diǎn)介紹了兩種關(guān)鍵架構(gòu) - Reck網(wǎng)格和Diamond網(wǎng)格,并分析了實(shí)現(xiàn)ONN的性能。6 B3 Y/ y8 v# W2 c- h
# f0 G3 k1 v" \
MZI光處理器基礎(chǔ)
# c# a( q; U& n/ p! ~光處理器的基本構(gòu)建模塊是2x2可重構(gòu)MZI,如圖11所示。由兩個(gè)3-dB耦合器組成,帶有可調(diào)相移器θ和φ,用于控制功率分配比和兩個(gè)輸出之間的相對(duì)相位。, R2 f/ `) H0 |1 e: U* t
oopqxrhyxww64076734929.png (420.64 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
oopqxrhyxww64076734929.png
2 小時(shí)前 上傳
7 P$ q3 N/ ?& ~4 u f# V) \圖1:具有可調(diào)相移器θ和φ的2x2可重構(gòu)MZI示意圖。, f+ y, g0 R) T0 ?
9 `7 r; H# F. i; I( X單個(gè)MZI的單一轉(zhuǎn)移矩陣由下式給出:
+ U! |5 w8 E. Y3 L4 x2 o' g4 b
3potgicok5u64076735029.png (106.42 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
3potgicok5u64076735029.png
2 小時(shí)前 上傳
# v( |, T; _1 N( e5 Y/ n1 B# E) ?& R9 S& |7 I
通過在網(wǎng)格中級(jí)聯(lián)多個(gè)MZI,可以實(shí)現(xiàn)更大的單一變換。圖2所示的4x4處理器的Reck網(wǎng)格是一種三角形排列,可使用6個(gè)MZI實(shí)現(xiàn)任何4x4單一矩陣。& T) L3 m9 L( A* w# R
6 v+ M. g# ^! Y0 ~* F; P- j
bbtbhgtws5d64076735129.png (84.74 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
bbtbhgtws5d64076735129.png
2 小時(shí)前 上傳
# q; M# Y' i) [. v8 f* w( K" n圖2:由6個(gè)MZI組成的4x4 Reck網(wǎng)格光處理器示意圖。
4 O8 i% M* s2 }' C- t* ~" ]. y+ ?8 Q$ d+ F$ O! K
完整4x4 Reck處理器的單一矩陣由各個(gè)MZI矩陣的乘積給出:
4 r% k; I; k- F) T/ @# }- |2 X
v5gyerqtnfy64076735230.png (38.98 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
v5gyerqtnfy64076735230.png
2 小時(shí)前 上傳
4 f a1 N) @! `1 j- r) L# x, c* x* e! o+ {' ]+ X0 ~: F0 Y
光處理器編程& p6 f+ w- ]( [3 u3 h0 }
要對(duì)光處理器進(jìn)行編程以實(shí)現(xiàn)所需的單一變換,必須確定每個(gè)MZI所需的相移。這是通過分解過程完成的,該過程將目標(biāo)矩陣依次乘以逆MZI矩陣:
; i, K; W& R" x0 j9 f
i2d2rtbjzyu64076735330.png (40.11 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
i2d2rtbjzyu64076735330.png
2 小時(shí)前 上傳
/ r2 l0 r( G$ R4 `* O
; ^0 v9 G+ h: ~2 x, E2 y% |通過在每個(gè)步驟中將非對(duì)角元素設(shè)置為零,可以提取所需的相移。圖3顯示了4x4 Reck網(wǎng)格在此分解過程中考慮MZI的順序。
7 }0 D$ F: T: Y
x5rbbssmxsr64076735430.png (146.39 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
x5rbbssmxsr64076735430.png
2 小時(shí)前 上傳
* y0 V% Q$ i$ v: Y- e/ [# J
圖3:4x4 Reck網(wǎng)格中用于編程的MZI分解順序。
8 q2 u4 q" w% L9 V" U! f
3 {2 g5 _8 I, \% |; Y光神經(jīng)網(wǎng)絡(luò)
/ l: e% b, z; B6 K0 x( f; w) s* M6 FONN利用這些可編程光處理器來實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)層中的線性變換。圖4顯示了單層ONN的結(jié)構(gòu)。0 B9 g7 |6 Z9 _8 f1 n
1ioqdxfr24i64076735530.png (222.16 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
1ioqdxfr24i64076735530.png
2 小時(shí)前 上傳
2 P4 t3 i4 _' [+ n( V# S
圖4:光學(xué)實(shí)現(xiàn)的單層神經(jīng)網(wǎng)絡(luò)示意圖。7 k8 z, p1 v" }6 z% S8 ]; G
/ ~6 ?& c3 s7 [- b! k* Y
光處理器實(shí)現(xiàn)權(quán)重矩陣W,而非線性激活函數(shù)通常以電子方式應(yīng)用。對(duì)于分類任務(wù),網(wǎng)絡(luò)接受多維輸入I0并為每個(gè)類別產(chǎn)生輸出概率。& M1 r5 e4 \1 X
8 ?' x# o' k" m [1 n. R網(wǎng)絡(luò)使用反向傳播進(jìn)行訓(xùn)練,通過最小化均方誤差等損失函數(shù)來優(yōu)化權(quán)重矩陣:
, D# g3 o$ w$ [' @ }% \5 o) ?
0jkfbzbd0vd64076735630.png (25.62 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
0jkfbzbd0vd64076735630.png
2 小時(shí)前 上傳
) Q3 k4 P9 w2 C* @3 m5 t
$ N7 N2 k: j7 r7 W% j1 D/ G; P0 f2 A
圖5顯示了4類數(shù)據(jù)集示例和4x4 ONN的訓(xùn)練過程。
$ e7 a. I9 ~1 a
v1o45em4svh64076735730.png (253.27 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
v1o45em4svh64076735730.png
2 小時(shí)前 上傳
) Q# E2 V% M. |; K( G
圖5:(a)4類高斯數(shù)據(jù)集和(b)顯示4x4 ONN的損失和準(zhǔn)確度與訓(xùn)練周期的關(guān)系的訓(xùn)練過程。, ^" }! d, I" V! @
1 a$ L& a% g9 E( g6 F( q" {
Diamond網(wǎng)格架構(gòu)4 }; A, b3 }3 T' m! y1 R( J
Reck網(wǎng)格可以實(shí)現(xiàn)任何單一矩陣,但對(duì)制造誤差和光損耗很敏感。為解決這個(gè)問題,提出了一種替代的Diamond網(wǎng)格架構(gòu),如圖6所示的4x4處理器。
6 X$ J$ N2 m% O
1qdmqy20vq364076735831.png (496.17 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
1qdmqy20vq364076735831.png
2 小時(shí)前 上傳
# Z8 x) R9 r' h: O/ B; f
圖6:具有9個(gè)MZI的4x4 Diamond網(wǎng)格光處理器示意圖。
* F: Y o' p7 u! l' `% `2 K' m! T) H- e! T7 Y
與相同大小的Reck網(wǎng)格相比,Diamond網(wǎng)格使用額外的N(N-1)(N-2)/2個(gè)MZI。這提供了幾個(gè)優(yōu)點(diǎn):更對(duì)稱的拓?fù)浣Y(jié)構(gòu),具有平衡的光路能夠?qū)⒉恍枰墓庵囟ㄏ虻筋~外的輸出優(yōu)化權(quán)重矩陣的額外自由度) }# u# Y# Z% R7 H
[/ol]
" V. r5 O# I, f! L: q4x4 Diamond處理器的單一矩陣由下式給出:
+ t& \8 c8 ?& {' p
1prnfvrpj5e64076735931.png (71.81 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
1prnfvrpj5e64076735931.png
2 小時(shí)前 上傳
2 E; `$ `/ B/ {& [& ]% Y+ e9 u0 g/ t& p, |$ S; A% k5 e$ P
可以使用與Reck網(wǎng)格類似的分解過程對(duì)其進(jìn)行編程,遵循圖7所示的順序。
7 g1 g5 U Z6 c9 h5 y1 Y
zz1clakmcvm64076736031.png (236.55 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
zz1clakmcvm64076736031.png
2 小時(shí)前 上傳
3 S1 ?1 A: Y, s# R" a5 x9 \
圖7:4x4 Diamond網(wǎng)格中用于編程的MZI分解順序。3 t, K" X7 }, @1 D
/ H. A3 m7 s& k4 b# m性能比較
+ d9 I/ O0 V f: J2 `* ^: W! C為比較Reck和Diamond架構(gòu),分析了各種大小的單層ONN的實(shí)現(xiàn)性能。圖8顯示了4x4處理器的分類準(zhǔn)確度與相位誤差的關(guān)系。
( A9 e. p9 @$ Q5 W# }: H* ?
rlujfeftugo64076736131.png (125.34 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
rlujfeftugo64076736131.png
2 小時(shí)前 上傳
: G% B* W7 W; y9 m$ ?
圖8:4x4 Reck和Diamond ONN的分類準(zhǔn)確度與相位誤差的關(guān)系,每個(gè)MZI的損耗為(a)0 dB和(b)1 dB。
9 W) ^: F2 N+ T
5 B: B4 \2 ^; PDiamond網(wǎng)格對(duì)相位誤差表現(xiàn)出更好的魯棒性,尤其是在存在光損耗的情況下。這種優(yōu)勢(shì)在更大的網(wǎng)絡(luò)規(guī)模中變得更加明顯。& j; \. S2 H% _
+ S) X' a0 D1 Q' x' n9 h: A- j/ A
圖9比較了不同大小處理器(最大64x64)的準(zhǔn)確度與相位誤差的關(guān)系。
2 x( @9 g6 f: V, y
p0oz0wwbgf364076736231.png (416.84 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
p0oz0wwbgf364076736231.png
2 小時(shí)前 上傳
& M, I' Q; \4 X
圖9:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準(zhǔn)確度與相位誤差的關(guān)系。
7 i7 D& m3 I" \. G7 Y$ L1 ~6 V4 W5 q0 Y' W
對(duì)于較大的網(wǎng)絡(luò),高精度區(qū)域縮小,但Diamond網(wǎng)格在所有尺寸上都保持更好的性能。6 \9 |* K0 G( f# X
/ Y; `, D4 A: P! [4 z圖10將此分析擴(kuò)展到包括每個(gè)MZI的光損耗影響。
8 O) t- S" H3 ^6 j* Y3 n7 Z% C
kagrofhrnyk64076736332.png (391.07 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
kagrofhrnyk64076736332.png
2 小時(shí)前 上傳
. I" A* n& R/ i* n圖10:不同大。╝-d)Reck和(e-h)Diamond ONN的分類準(zhǔn)確度與損耗和相位誤差的關(guān)系。# j1 Z t+ M5 f$ }0 r; ^
! q5 z9 e0 `; _# b6 p5 @再次,Diamond網(wǎng)格在所有網(wǎng)絡(luò)規(guī)模上表現(xiàn)出更優(yōu)的魯棒性。 p2 Q0 c7 n0 a
3 j9 s' D6 d% @7 S* @/ b最后,圖11總結(jié)了不同網(wǎng)絡(luò)規(guī)模的兩個(gè)關(guān)鍵性能指標(biāo) - 性能指標(biāo)(>75%準(zhǔn)確度的區(qū)域)和訓(xùn)練期間達(dá)到的最終損失值。
% A$ M+ F- g9 z3 h; U6 w
ry5kcbvddlr64076736432.png (92.32 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
ry5kcbvddlr64076736432.png
2 小時(shí)前 上傳
) [: s9 p6 [6 r6 K4 ~圖11:不同大小的Reck和Diamond ONN的(a)性能指標(biāo)和(b)最終損失值比較。
9 i+ Z# t( D/ H6 H+ c0 }8 @3 ~% H7 K; ]+ J9 Z1 S' o
Diamond網(wǎng)格在這兩個(gè)指標(biāo)上始終優(yōu)于Reck網(wǎng)格,優(yōu)勢(shì)隨網(wǎng)絡(luò)規(guī)模增大而增加。
; O' t# z! y X$ |/ L2 G
9 R1 C; B2 o0 d: y. X/ E7 k結(jié)論
. s4 w5 v/ P$ f G6 ^7 T4 Y基于可編程MZI的光處理器為實(shí)現(xiàn)ONN和加速機(jī)器學(xué)習(xí)計(jì)算提供了有前途的平臺(tái)。Reck網(wǎng)格提供了可實(shí)現(xiàn)任何單一變換的緊湊設(shè)計(jì),但Diamond網(wǎng)格提高了對(duì)制造誤差和光損耗的魯棒性。這使Diamond架構(gòu)更適合實(shí)際的大規(guī)模ONN。硅基光電子制造和架構(gòu)設(shè)計(jì)的持續(xù)進(jìn)步可能會(huì)進(jìn)一步提高這些光處理器的性能,有望實(shí)現(xiàn)新一類超快速、節(jié)能的機(jī)器學(xué)習(xí)加速器。& m: L/ I$ i( \( Q
+ @) r' v5 w3 H! z, H
參考文獻(xiàn)
$ W" G3 |' c0 \+ p[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.1 [7 s5 R! R, k1 W" T7 l3 {% q0 c
END
1 I [2 [" L! j, ^2 ~4 I
/ S, I8 y8 \' M% ?1 U6 K) }2 Z
8 F( K1 ^' x! A: g3 l9 U# `軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。. B+ O+ \7 i5 B) p
點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)
5 }& ~1 n3 ]% v" ~, Y; B- m( N1 i. e6 W( m
歡迎轉(zhuǎn)載+ m6 d- j& C$ |) s k$ G
& t2 i& z, |1 t2 t; A
轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!/ c; D+ x; Y. g8 o, t) A9 @* h
9 S* c2 z& @3 ?
& F& d4 r& `, O' e! }0 h. j. |. P4 F
3xfam3wcrst64076736532.gif (16.04 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
3xfam3wcrst64076736532.gif
2 小時(shí)前 上傳
( P6 q8 k, O% h! P
$ ^4 x* }4 `1 Z. K; Z6 z: {2 H" v關(guān)注我們
/ a4 j6 Y1 y1 C& l% _
- R5 [' |! M8 M: |$ L; b% E" w5 M4 Z1 q- w7 u; P* d. T4 v
vodpuva2mj564076736632.png (31.33 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
vodpuva2mj564076736632.png
2 小時(shí)前 上傳
; k/ @, ~) M2 n0 d1 H! u1 k+ I |
# y1 W8 w$ q) b8 h) F \0 M7 Q
u5is0s3sr5f64076736732.png (82.79 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
u5is0s3sr5f64076736732.png
2 小時(shí)前 上傳
& u& C8 D/ m7 h; u- q1 X
| # d" c4 L5 k: ^5 M- w, c) E
txrhkjadsy064076736832.png (21.52 KB, 下載次數(shù): 0)
下載附件
保存到相冊(cè)
txrhkjadsy064076736832.png
2 小時(shí)前 上傳
8 L4 E& ~: {3 w. X7 Q1 H) D
|
+ V1 d% G/ R% ^4 ]: M
( h) T: q- C% I3 N; U9 ~% Q0 d
# c" c' p2 ~' N" E2 X5 q; Q
3 {5 V5 X6 X) N9 j- c關(guān)于我們:
/ G, W4 \2 S6 ?* p深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
# V9 H/ F' m; I! h) ] G" a
& {+ c" m7 A3 P8 R _( ehttp://www.latitudeda.com/
4 ~# ?! C" p% ?# ^" `" F& L+ Y5 U- N(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容) |
|