電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 55|回復(fù): 0
收起左側(cè)

經(jīng)濟(jì)可持續(xù)的AI擴(kuò)展:硬件挑戰(zhàn)和光學(xué)解決方案分析

[復(fù)制鏈接]

552

主題

552

帖子

4418

積分

四級(jí)會(huì)員

Rank: 4

積分
4418
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-11-5 08:03:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
引言
+ `5 g: F) ?2 T+ B. l大型語言模型(LLM)的出現(xiàn)推動(dòng)了AI能力的快速發(fā)展。然而,這些進(jìn)步的經(jīng)濟(jì)可持續(xù)性取決于解決關(guān)鍵的硬件限制。本文基于 Ayar Labs CEO在"The Economics of AI are Failing, But We Can Fix It (With Lasers)"的見解,探討了AI擴(kuò)展面臨的經(jīng)濟(jì)障礙,特別是從以用戶為中心向基于代理的工作流轉(zhuǎn)變,以及光學(xué)互連在塑造可行未來中的作用[1]。
. C# F, k- c  H5 [8 d- K, T4 n7 q, Q6 j5 e1 l; b
當(dāng)前AI經(jīng)濟(jì):盈利困境2 i- v  _3 R, Y
盡管AI生態(tài)系統(tǒng)從芯片制造到軟件開發(fā)都有大量投資,但許多參與者仍難以實(shí)現(xiàn)盈利。這一困境源于當(dāng)前以計(jì)算為中心的硬件設(shè)計(jì),難以滿足LLM不斷增長(zhǎng)的需求。這些模型需要龐大的內(nèi)存容量、強(qiáng)大的計(jì)算能力和高內(nèi)存帶寬。結(jié)果,公司不得不購買更多硬件,主要是內(nèi)存控制器,僅僅為了容納不斷擴(kuò)大的模型規(guī)模,從而增加了成本。0 k, y+ r; W  o# R* X" l

) F; d; d+ `  }- ?. A更復(fù)雜的是現(xiàn)有互連技術(shù)如以太網(wǎng)和專用Fabric技術(shù)(如Infinity Fabric和NVLink)的限制。這些技術(shù)雖然提供高帶寬,但在距離和可擴(kuò)展性方面受到限制。這使得高效連接大量芯片變得困難,阻礙了更強(qiáng)大、更高效AI系統(tǒng)的發(fā)展。
0 r! i( E: X! W5 [0 p. ~
  y- k' d0 a# t3 J; x
# i) P: Y+ u! o6 M0 Z從以用戶為中心到基于代理的AI:范式轉(zhuǎn)變3 U1 s( a  U, L1 S- L" ?
AI工作負(fù)載從用戶-模型交互向代理-代理交互的演變對(duì)現(xiàn)有硬件基礎(chǔ)設(shè)施提出了重大挑戰(zhàn)。在用戶-模型工作流中,用戶與單一模型交互。這種工作流在硬件資源分配方面相對(duì)簡(jiǎn)單。然而,代理-代理交互(多個(gè)模型相互通信以滿足用戶請(qǐng)求)引入了新的復(fù)雜性。這種基于代理的方法雖然提供了更大的靈活性和潛在的更好結(jié)果,但大大增加了對(duì)內(nèi)存、計(jì)算資源和互連帶寬的需求。3 e, R: z* G$ s) \. [; e

' p/ z7 y% z  K. [' A' v隨著代理鏈中模型數(shù)量的增加,處理所需的token總數(shù)成倍增長(zhǎng),直接影響成本和延遲。此外,鏈的整體延遲必須保持在用戶可接受的限度內(nèi),這進(jìn)一步給系統(tǒng)帶來壓力。
7 D0 b& q9 A; [/ v2 T5 Q( p+ q0 L4 F  v& {2 \- d
例如,三個(gè)模型的菊花鏈?zhǔn)顾璧膖oken總數(shù)增加三倍,導(dǎo)致成本和延遲增加三倍。這凸顯了迫切需要能夠高效處理日益復(fù)雜的基于代理工作流需求的硬件解決方案。% Q$ P8 P% V% q7 Q3 y$ l

/ Z8 `1 |7 a! u3 V$ Y0 s- g% [9 c7 o; s: Q8 ^
光IO:可擴(kuò)展性和效率的途徑
$ m! v; [* e8 r* [  T% R) j' {目前基于銅的互連的局限性突顯了更可擴(kuò)展、更高效解決方案的需求。光學(xué)IO作為一種有希望的替代方案出現(xiàn),利用光速進(jìn)行數(shù)據(jù)傳輸。這種技術(shù)提供了顯著優(yōu)勢(shì):
  • 更高帶寬:光IO超越了當(dāng)前以太網(wǎng)和Fabric技術(shù)的能力。
  • 更高密度:這種技術(shù)能在給定空間內(nèi)實(shí)現(xiàn)更高的帶寬集中度。
  • 更低延遲:光IO減少了數(shù)據(jù)傳輸相關(guān)的時(shí)間延遲。
    0 L$ m( R6 X. c* L% B0 E  }[/ol]
    4 M% T7 ?2 L# I. }' @通過用光互連替代銅鏈路,可以將AI系統(tǒng)擴(kuò)展到單個(gè)機(jī)架之外,以全連接配置連接數(shù)百甚至數(shù)千個(gè)芯片。這實(shí)現(xiàn)了更高效的資源利用,促進(jìn)了更大、更復(fù)雜的基于代理AI系統(tǒng)的發(fā)展。
    ( k) S0 m- O$ Q3 A0 E, l
    1 y0 ~, {6 J) Z6 V
    8 \. k, t7 b; x1 N- ~5 `+ Z# k超越計(jì)算:平衡硬件設(shè)計(jì)方法
      s4 L- U7 ^# a: e5 V, LAI硬件設(shè)計(jì)中對(duì)計(jì)算能力的主要關(guān)注需要與更多關(guān)注內(nèi)存帶寬和連接性取得平衡。這種觀點(diǎn)的轉(zhuǎn)變需要從簡(jiǎn)單增加內(nèi)存轉(zhuǎn)向開發(fā)優(yōu)化計(jì)算、內(nèi)存和互連相互作用的架構(gòu)。( V. A6 q! `  L5 n6 ^$ a

    # D5 ?" K$ H; \: N一種有希望的方法涉及將光IO直接集成到芯片設(shè)計(jì)中,創(chuàng)建更緊密耦合和高效的系統(tǒng)。這可以通過光電共封裝和硅基光電子等技術(shù)實(shí)現(xiàn),允許芯片和內(nèi)存模塊之間進(jìn)行高帶寬通信。
    ( Y/ _" D7 ^4 r( z5 R5 Y) R* d
    " o3 p1 L  T* n0 v. M1 j- s0 M示例說明" X  \7 G- U; W0 y! G$ l3 c# L
    Ayar Labs示例,其中標(biāo)準(zhǔn)ASIC配備8個(gè)HBM模塊,并增加了10個(gè)光IO chiplet。這些chiplet可以連接到1TB內(nèi)存庫,有效擴(kuò)展了ASIC的內(nèi)存容量。這種方法為ASIC提供了快速HBM和高帶寬光學(xué)連接到大量外部?jī)?nèi)存的訪問。5 t& U+ q% ~) n3 ~: \! j, u
    ; v! e! A4 j7 r4 ^8 N
    * u5 R1 i+ \1 h% T5 e6 ?  Q% Y7 d: y9 l
    這種方法解決了目前阻礙AI系統(tǒng)擴(kuò)展的內(nèi)存瓶頸,使其能夠處理復(fù)雜AI工作負(fù)載不斷增長(zhǎng)的需求。! x6 W" D) G4 W
    ( x3 i" @8 v4 o
    上圖展示了傳統(tǒng)互連和光學(xué)IO在關(guān)鍵性能指標(biāo)上的比較,光IO在帶寬、延遲、密度和可擴(kuò)展性方面都具有顯著優(yōu)勢(shì)。" H  d, |  |5 j
    ' J. {8 G( ?9 {! s
    塑造可持續(xù)AI未來:整體視角
    0 l; Q1 S: X* b* K! h) p實(shí)現(xiàn)AI的變革潛力并確保其經(jīng)濟(jì)可行性需要一種涵蓋整個(gè)AI生態(tài)系統(tǒng)的整體方法。這包括硬件設(shè)計(jì)、軟件開發(fā)和服務(wù)交付。
    9 i  ?0 h7 F, X* y+ m
    ! I7 [; c8 l/ o關(guān)注的主要領(lǐng)域:
  • 高效和可擴(kuò)展的硬件架構(gòu):從以計(jì)算為中心的方法轉(zhuǎn)向平衡設(shè)計(jì),集成高帶寬連接和充足的內(nèi)存容量。
  • 優(yōu)化的軟件框架:開發(fā)能夠高效管理多個(gè)模型之間通信和數(shù)據(jù)流的框架,最小化基于代理工作負(fù)載中的延遲并最大化吞吐量。
  • 靈活和可擴(kuò)展的云基礎(chǔ)設(shè)施:實(shí)現(xiàn)動(dòng)態(tài)資源分配和重新配置,以適應(yīng)推理工作負(fù)載的波動(dòng)需求。0 _2 w% Q* D: V4 g1 v
    [/ol]
    , q  ~5 a. Z" k6 }8 M/ S& h: d當(dāng)前AI經(jīng)濟(jì)狀況既帶來挑戰(zhàn)也提供機(jī)遇,F(xiàn)有硬件基礎(chǔ)設(shè)施的限制突顯了創(chuàng)新和架構(gòu)范式根本轉(zhuǎn)變的迫切需求。采用光IO等技術(shù)并采取更平衡的硬件設(shè)計(jì)方法可以克服當(dāng)前阻礙先進(jìn)AI系統(tǒng)發(fā)展的可擴(kuò)展性和效率障礙。7 U5 t8 ]3 W1 X# ]# V

    : h1 H4 E3 w, y, P6 ~) p* _8 x+ C從用戶-模型到代理-代理交互的轉(zhuǎn)變雖然要求很高,但展示了AI的未來。復(fù)雜和互連系統(tǒng)將為廣泛應(yīng)用提供動(dòng)力。解決與這一轉(zhuǎn)變相關(guān)的經(jīng)濟(jì)挑戰(zhàn)對(duì)于釋放AI的全部潛力并培育更可持續(xù)和有益的技術(shù)環(huán)境至為重要。
    2 z# B+ E9 A' ~
    * F; [; k% T) I+ t& h# M參考文獻(xiàn); p! i3 m# e" G) y8 W# l6 u* i
    [1] TechTechPotato, "The Economics of AI are Failing, But We Can Fix It (With Lasers)," YouTube, Sep. 25, 2024. [Online]. Available: https://www.youtube.com/watch?v=gsW4dLYb55c.7 Q1 J+ W8 T: A5 q% q
    END
    / t- P* T# U: V- L; U
    * V7 z6 |7 s8 N$ i, o$ H
    " N$ d+ H. P" G; Y. r0 l: }
    軟件申請(qǐng)我們歡迎化合物/硅基光電子芯片的研究人員和工程師申請(qǐng)?bào)w驗(yàn)免費(fèi)版PIC Studio軟件。無論是研究還是商業(yè)應(yīng)用,PIC Studio都可提升您的工作效能。: y7 Y6 V8 E5 V% X/ c- \5 Z
    點(diǎn)擊左下角"閱讀原文"馬上申請(qǐng)" v9 l) K9 `/ l0 J+ q+ M9 e

    . s0 f9 K% m4 ~, A5 g/ c歡迎轉(zhuǎn)載
    7 }$ y* D5 x7 [$ A2 s3 @
    + x+ Y0 b# E8 h+ E: K轉(zhuǎn)載請(qǐng)注明出處,請(qǐng)勿修改內(nèi)容和刪除作者信息!0 E9 M/ Q9 H# d$ _

    2 w6 u. X, O* x. `: D  g/ e  R: g- {6 Z1 w/ E
    ! w* e% q4 w! y& P% K1 C- m/ @8 z( e

    ! Z9 v. J6 y9 N" L
    ) k+ n; f4 d* O# N5 S3 c) J關(guān)注我們" }- U4 D( U1 ~! F9 I

    4 X/ i+ g$ h9 g  _( `

    $ w. l' n' G% `8 s 0 i9 x6 N( A9 c9 S3 z
    + [3 v/ J; q& h" U4 l( j

    ! i1 b+ _& r  i, z

    4 L7 z+ K) Q: X! p . i! F4 ?- R! s9 `- C: J: u1 v7 l$ ~
                         
    : S4 b7 h# S( Q" S
    & o: e3 H! I8 N
    * m" R+ P9 |) a. a( s; |
    ( Z9 R& V0 I8 J. j+ c
    關(guān)于我們:$ T" @5 a5 h* b- J) E4 G* e/ g! L
    深圳逍遙科技有限公司(Latitude Design Automation Inc.)是一家專注于半導(dǎo)體芯片設(shè)計(jì)自動(dòng)化(EDA)的高科技軟件公司。我們自主開發(fā)特色工藝芯片設(shè)計(jì)和仿真軟件,提供成熟的設(shè)計(jì)解決方案如PIC Studio、MEMS Studio和Meta Studio,分別針對(duì)光電芯片、微機(jī)電系統(tǒng)、超透鏡的設(shè)計(jì)與仿真。我們提供特色工藝的半導(dǎo)體芯片集成電路版圖、IP和PDK工程服務(wù),廣泛服務(wù)于光通訊、光計(jì)算、光量子通信和微納光子器件領(lǐng)域的頭部客戶。逍遙科技與國(guó)內(nèi)外晶圓代工廠及硅光/MEMS中試線合作,推動(dòng)特色工藝半導(dǎo)體產(chǎn)業(yè)鏈發(fā)展,致力于為客戶提供前沿技術(shù)與服務(wù)。
    - G4 M& b) `0 L! s1 _* O4 I& A6 r' V/ E; I; {% y" L
    http://www.latitudeda.com/
    , |, c- h+ ~* Z' ]. o) v8 F(點(diǎn)擊上方名片關(guān)注我們,發(fā)現(xiàn)更多精彩內(nèi)容)
  • 發(fā)表回復(fù)

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表