電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 93|回復(fù): 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復(fù)制鏈接]

563

主題

563

帖子

3385

積分

四級會員

Rank: 4

積分
3385
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |倒序?yàn)g覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
! X: R& n6 @* H' ^: n  l5 b0 R2 `
0 U5 t  Y( B& v3 F   `0 ~3 ^8 _6 s( r' h$ a* _2 C9 s
那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?8 n5 j7 u- w1 G5 i7 \& X

8 T- _8 l6 j1 c% q0 [; U11 y8 C0 H- S8 [+ g
AI會產(chǎn)生什么樣的幻覺?
2 o* Y/ m8 A* @' W7 U$ @6 p) y1 d4 n; e2 J9 I1 T+ J/ f
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實(shí)也沒這么簡單,AI幻覺主要有兩類。/ P* N8 n  e# d. L$ ^: [
事實(shí)幻覺:“假新聞制造機(jī)”
6 _0 ?) h' F# q- u. b) d( BA:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾
: G2 V6 k# M, b$ s  @! z# ~
; v  r5 @/ |& x  r" b1 A當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。6 k- Y" h) @# ^1 Z
B:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容
' J: k% K* d+ U* ^9 r
  c# v1 i' K  U1 Z4 e) ?

" O) d; c4 P4 \  G: ]如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。$ w7 v9 `! K- g5 E. e  S' ]' v
忠誠度幻覺:“指令迷失”
  S1 f# G8 ~+ Y* v9 A5 |A:指令不一致:AI的回答偏離用戶的要求8 J4 }# o1 z7 j' X6 F$ w( `" @
3 d8 E$ g, H7 m4 ~
# u! N$ ]* C8 t: o4 y1 y
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。1 T/ P0 k$ H+ w0 n+ z/ I9 m: K4 e$ |# {
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
! T0 n# f8 q* b1 U! |
' h. ]1 b+ `1 B假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個回答是正確的,符合春節(jié)的基本情況。$ W  s% {( B2 h; m7 `
然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。
& w6 t, x& O5 _C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾  K# z  I3 t4 y4 b1 X
開頭的9.11大于9.9就是一個典型的數(shù)值計(jì)算邏輯混亂的例子……,AI把自己繞蒙了~
) o8 r& o2 f, }9 P$ o9 ]: C0 A! J5 f0 y( R" o. k% I0 ?
2
8 H" P/ W# I; AAI幻覺有哪些特點(diǎn)2 K" q, @/ j$ T
7 d4 J; ?! r) ]' n9 Y) V
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測性 :很難預(yù)測AI何時會產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個與昨天相同的夢。: `8 C" y3 n" E4 K
    3; I" P' d1 N: `0 v* x
    AI幻覺的“幕后黑手”
    + J" _& e* ~2 k" K' z8 o
    $ w( w- q% c8 ~0 Q: _5 FAI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”4 J) E+ R! e) @% I& R6 @
    ( W& k: a# D( f7 D$ `3 A
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學(xué)習(xí),課本是錯的,考試自然無法答對。
  • 缺乏實(shí)時更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時獲取最新信息。考試要根據(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
    & h" |# [- j+ I
    1 M8 K' G( e$ {1 {" ^/ l5 [
    / Q$ C7 N* \1 {1 p+ `" m5 E8 P
    訓(xùn)練過程的“小插曲”. X1 Z+ C/ g" i8 k+ V; z# C
    6 N( i3 ^$ p: M' i+ c7 i, X  C0 i- }
    8 P( i. k% I9 r/ h
  • 過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯誤。就像我們學(xué)習(xí)時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個復(fù)雜信息點(diǎn),或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。. y; O0 h+ w4 i& n0 f( |
    , V0 M' _0 Y& S6 [) V. ?7 {& W
    模型本身的“小缺陷”
    ' `4 v' [6 `! f, w0 @5 n$ S3 g6 g

    % ?) K0 T' g! }& L! h  {模型結(jié)構(gòu)限制:AI通過統(tǒng)計(jì)模式預(yù)測,但可能無法真正理解信息。“你以為他真的懂你,其實(shí)也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”) m  ?0 F5 }# J8 }
    4/ W% H& M7 C% `

    2 k0 P6 V$ I+ X4 B' @如何避免AI幻覺?
    1 Q6 ~# s/ v! m* M; n8 Y0 s
    ' `* F: Z& N, ]* M3 \  s避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。
    ; w- x' X, Q/ \8 PA. 檢索增強(qiáng)生成(RAG)技術(shù)/ U! Z5 S6 A7 W  \

    8 I& V' `7 F# f: ]0 D6 S1 JRAG技術(shù)通過引入外部知識來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:
      q2 `3 f  z: C2 w; H$ {生成前檢索:在內(nèi)容生成前,系統(tǒng)會預(yù)檢索相關(guān)背景信息,為生成過程打下堅(jiān)實(shí)的基礎(chǔ)。
    - ]* e! @0 l* `$ E  X生成過程中檢索:在生成過程中,系統(tǒng)實(shí)時檢索并整合外部知識,確保內(nèi)容的時效性和深度。
      F, z# e* b4 N9 O9 O生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。
    ' \8 J9 c, _  l0 g$ b

    # R8 C4 P5 j8 [8 H2 R例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。
    # u$ D# O2 W# a; v! a( j: V+ p
    6 g; o( G0 Q& H$ x2 a* ~B. 基于反饋和推理的自我改進(jìn)機(jī)制
    4 D' v+ B+ Z* s0 I* h5 R& }% J9 V這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。8 {$ d1 ^. C( s8 p
    1 |# [- z; N! d- ~) H" o# f7 t
    : \6 X) }% f& e# I7 U
    AI在生成答案后,會進(jìn)行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”3 k% W: `0 V8 [5 x. D2 E' a
    C. 提示詞的精細(xì)化調(diào)優(yōu)
    & c. U6 s0 z* F1 [6 r7 l通過精心設(shè)計(jì)的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    5 m; q1 G9 @$ r% }$ k5 @& u' D' ?1 {9 m7 N
    2 C, O6 {! D( t/ i# D3 X
    例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    & ]0 t9 C$ B1 J這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。. T$ P' s: f. F4 C7 ~5 M
    $ p  Y  D7 u: D: m( e; {* T8 y7 z
    ! a! l% d. [6 m5 `
    二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。* {# _1 J) |; e9 P2 |
    3 q+ D' K1 Q+ o8 m5 v5 \; G; ?8 q
    A. 創(chuàng)新解碼技術(shù)
      [$ U$ f5 R' F9 p  Y/ ]采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。
    3 N/ s1 [$ M/ p* o1 N
    $ N. c' L( c4 S# J" B. T$ P這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識。# `8 K& D: i6 `  A, i

    ) O3 p, d- |% R1 ]例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    * l& X: c, d$ H0 b' {, o
    ' W% Y9 Y% q% v5 `
    5 U# T! s- T3 Q, t; ]
    B. 知識圖譜的應(yīng)用, [" i6 d% O7 D
    通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準(zhǔn)確和有深度。. k  J1 H- @7 L: N
    7 T9 p1 p3 p2 Q3 k$ F
    想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實(shí)體,比如人、地點(diǎn)、事物或者概念。
    2 x, p7 o. [. C6 g' n
    ' J9 x" k) u2 I$ H: c/ ]* C3 ^- i它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
      m3 {5 \/ o3 a0 f2 \. W' [) F; [% ?' h
    舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。. b: z8 n9 @+ n: Z  v3 ?& F/ a
    4 }% d" h; Z& {8 F% t
    7 Y) J+ c/ U% Z
    C. 基于忠實(shí)度的損失函數(shù)
    ) E& l* C/ ]0 s4 y引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。3 k) Z1 U" [# v5 d+ D% z) [
    8 o( M& d2 ^  U( h/ x, v
    1 K) L) c! x4 ^/ B& B+ T
    舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。6 C. y' ~( a, r

    , c# h! _. R$ m- o( U! o
    - H, |4 O) V# v, V
    D. 監(jiān)督微調(diào)
    * ^  N: q, T& D2 L5 l' |$ c* p通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。
    1 v, }. n, t" H
    & X" W  }* i8 h5 r& S& [
    $ ]& ?1 [% _& x4 f舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    / w" R6 |: ]  B6 j1 @+ K5 E4 a5 \比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。
    ' N/ |$ ]- G, a# T2 X! Y
    & x' d3 i) T9 u7 |/ D三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準(zhǔn)確的信息。
    9 D" U  W7 K. |+ xA. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。
    2 k2 q/ \# u) }PAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。! W1 M6 A) j" P. v! H
    - q; p9 Y* X+ `  q2 w! a; c
    舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水!毕到y(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進(jìn)一步的交互。3 O$ [  `6 G, U

    . M) ]5 L1 Y7 t  j8 P( | / T( @1 ~7 n" u" {5 e  f
    B. ReAct(Reasoning and Acting,推理與行動):3 C( l  T* r2 ^6 U
    ReAct技術(shù)強(qiáng)調(diào)AI對上下文的理解,以及基于這種理解進(jìn)行的推理和決策。1 T. u0 z6 a+ s; \5 H; M# D, \3 ~

    $ Q# g" ^4 j# J* Z5 k5 ~$ f4 zReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。# X; y! o: H3 f9 }: O7 W

    5 o: ^. N9 N$ w( ~8 l, _7 U% x舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準(zhǔn)備一份報(bào)告!盧eAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報(bào)告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報(bào)告。
    , {5 K( k: P$ S+ V2 e% j
    ( b3 Q# F, a9 x, h- A
    " y/ r( y1 L- f# `4 \& S" K1 Q8 _& K. ]# \% m1 L
    END
    + C9 w9 [: V6 Q1 Z* R/ W& t文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
    $ R1 G# [7 Z. D/ T/ c5 ^. {) ^- M2 f7 l
    2 O! p5 P6 ^9 t, R( C# Z所以下次當(dāng)你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
    * ?& x; o. G3 ?7 r其實(shí),AI也是在學(xué)習(xí)中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)( Z% l, z3 f, Y0 f9 f2 o
    . d  F1 l, S+ X( K# _2 X2 Q5 F& z
    ~~~) P/ `( p( [" i
    2 k6 t/ g( F- @; c( U1 Z
    小問答7 k. m: o% X3 L- @0 t" l
    請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢
    ; ?  c1 e- H+ c1 Y. l1 S; e6 ~/ b- b/ c+ m. c4 |( t
    ?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~
    6 [% r5 l) ]  j" o. o$ \1 T0 O
    ' C' h) Q4 Z6 Z8 {( I4 V* ]+ ?
    , D* l8 F  n0 K: [3 t8 T
  • 發(fā)表回復(fù)

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表