電子產(chǎn)業(yè)一站式賦能平臺

PCB聯(lián)盟網(wǎng)

搜索
查看: 25|回復: 0
收起左側(cè)

ChatGPT為什么會“胡說八道”?

[復制鏈接]

563

主題

563

帖子

3385

積分

四級會員

Rank: 4

積分
3385
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎勵 |正序瀏覽 |閱讀模式
AI幻覺,簡單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢話”一樣~
) m' Y: a5 F  y& [# O, i( I; h. K5 X# w8 k

. p% e+ M- f! {- Q6 Q7 e! s6 P那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們該如何避免AI幻覺呢?0 F% c9 e9 v  W3 U0 \4 ?, P, k

' S% \% r: _' B! M. k1
6 ?% m0 y" D& P! ?AI會產(chǎn)生什么樣的幻覺?0 ^& r6 J/ u0 ~7 b. `7 f
, D$ W+ h/ ]: J, C% M
可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實也沒這么簡單,AI幻覺主要有兩類。8 W9 j  p6 e6 p& R
事實幻覺:“假新聞制造機”
9 g$ K2 V* ^2 f) V& E  T# yA:事實不一致:AI生成的內(nèi)容與現(xiàn)實世界事實相矛盾
+ {% C9 F. C1 j1 {9 Y2 w
* j6 K! ?; D/ i# d- }: q0 Q/ z當被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰。”這就是一個事實不一致的例子,因為塘朗山坐落于廣東省深圳市,海拔430米遠低于珠穆朗瑪峰8848.86米,這個回答與現(xiàn)實世界的事實相矛盾。; O4 w) J" c' h1 {. X3 ?3 k- p2 K- g1 Z
B:事實捏造:AI生成完全虛構(gòu)的內(nèi)容
- d, N, @* l7 ~" |/ q+ H) D

* ?' ?' k7 s; r+ r& s/ r 4 q! J& \0 d: c, ]
如果AI描述說“2024年,考古學家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。4 z3 n5 x9 B- M
忠誠度幻覺:“指令迷失”5 h- W/ T0 V% [1 V+ Q6 R
A:指令不一致:AI的回答偏離用戶的要求
6 q$ _) a; o. z* d( {6 \0 h+ E

& F% d/ s- U& q! ~) s* o, R( I
. w5 ^  {8 U$ E. b3 C4 Q如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學” ,這就完全偏離了原始的問題。5 R1 ]/ p( e" W( D; b/ F5 T+ o  |
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符% s/ e+ I# X  {4 C

4 ~& O3 i4 c( h: }假設(shè)在一個討論中國傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時候?”AI回答:“春節(jié)是中國農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個回答是正確的,符合春節(jié)的基本情況。
7 j1 R: ?& b7 ^' u. i% L然而,如果AI接著說:“春節(jié)是紀念屈原的節(jié)日,人們會吃粽子和賽龍舟。”這就是上下文不一致的例子,因為AI的回答與春節(jié)的背景信息不符。0 t/ k1 Y  n& \; J* a. t. w
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
3 P, J0 ?) l; q( A$ k開頭的9.11大于9.9就是一個典型的數(shù)值計算邏輯混亂的例子……,AI把自己繞蒙了~
" S4 G% @2 H, `. @  Z
6 V1 Y# S# C1 J: ]3 D0 S2. k& q) k% K  }" W' @" F! a3 i
AI幻覺有哪些特點( a& j: p' J) A3 M

! ^% O  Y# P  [8 O
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預測性 :很難預測AI何時會產(chǎn)生幻覺,可能幻覺也很難復現(xiàn),就像人很難在今天做一個與昨天相同的夢。
    & R/ W  _3 \5 L% Y" F" T8 R
    3& ?' @; k, i* F" u
    AI幻覺的“幕后黑手”
    : @% [7 T& x& I8 P! N% I3 U, X7 s- _  E# D: Y4 S- N. |
    AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”) o/ |3 y5 D1 F7 E

    % R: v( p+ `' J' L% @1 f
  • 訓練數(shù)據(jù)局限:AI訓練數(shù)據(jù)可能包含錯誤、偏見或過時信息。就像教小朋友學習,課本是錯的,考試自然無法答對。
  • 缺乏實時更新:AI通;陟o態(tài)數(shù)據(jù)訓練,無法及時獲取最新信息?荚囈鶕(jù)最新的資料復習,拿一本82年的教材是考不了24年的高考的~
    5 S5 j. w& h' B, [ + d6 |! _9 f2 E% o) A% L) l( f, R/ s

    + b4 l& q: p2 h$ i訓練過程的“小插曲”# `3 E1 h1 Y0 p; F

    ; v# r4 y* E6 @7 j7 N4 n2 Z - E: z: f' {' j6 ^
  • 過度泛化 :模型可能過于依賴某些模式,導致在新情況下推導錯誤。就像我們學習時候只記住了公式,卻不會靈活變通。
  • 上下文理解不足:AI可能無法完全把握復雜的上下文關(guān)系。在處理多個復雜信息點,或者在推理時容易出錯。就像我們的大腦有時也會短路一樣。
    ) k0 Z! P, B7 Y- x0 Y/ g" K

    * T+ j0 n4 V2 Z- E1 W9 M% E模型本身的“小缺陷”
    4 d7 i0 t  b3 g' @7 r: F* \$ f8 m4 _0 P6 T8 G! W- z

    % i9 s% r, h* A0 z* Q) Q模型結(jié)構(gòu)限制:AI通過統(tǒng)計模式預測,但可能無法真正理解信息!澳阋詾樗娴亩,其實也不過是基于復雜算法的數(shù)學而已~”
    5 t9 ]6 q3 M3 I7 b4
      ?+ }5 Z  l/ i; t, T; o
    , `' A9 m; e( l) N% F
    如何避免AI幻覺?
    - d$ ^" ^4 t4 F) i) k. v  ~: ^/ }
    , E+ A  H& b  X# j避免AI幻覺有以下幾個“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準確。
    5 S& M# N, f: d, J' @# `$ f2 rA. 檢索增強生成(RAG)技術(shù)( c9 Y6 o: h. o( B
    ' ~& {9 P/ T- K
    RAG技術(shù)通過引入外部知識來幫助AI生成更準確的內(nèi)容。主要方法包括:
    & I, k' \! `8 M生成前檢索:在內(nèi)容生成前,系統(tǒng)會預檢索相關(guān)背景信息,為生成過程打下堅實的基礎(chǔ)。
    9 w& {4 v) x6 @# d7 C生成過程中檢索:在生成過程中,系統(tǒng)實時檢索并整合外部知識,確保內(nèi)容的時效性和深度。
    % G+ ?$ v/ p/ c4 V8 \生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進行對比,驗證生成內(nèi)容的準確性。
    4 a5 `  ]6 f$ D( s# ^0 \

    ' Q+ @" F5 a+ I7 i9 S# J例如,當AI被問到“2024年登月的宇航員有哪些?“時,RAG系統(tǒng)會先檢索最新的新聞信息,然后基于檢索到的準確信息生成回答。6 ?+ c6 U% B1 x$ L% e3 @
    * X) F8 Z2 d1 h4 ~
    B. 基于反饋和推理的自我改進機制% B1 u) M- L+ s: d0 ^' y
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。
    2 f8 k7 `2 W* `4 ?
    : K6 W$ F! W, _; A3 Q$ M
    - S8 @9 U* I& rAI在生成答案后,會進行自我審視,提出疑問:“這個答案是否全面?是否有關(guān)鍵信息被忽略?”3 \( U6 d5 {; U$ p: v
    C. 提示詞的精細化調(diào)優(yōu)( C+ x9 p. Z% l- J
    通過精心設(shè)計的提示詞,引導AI生成更可靠、更精確的內(nèi)容。
    1 A/ a1 J5 n+ `( y7 q, ]4 ?# j! s
    2 s5 N. F" l, g5 z" W. k
    : y" K. \$ O+ ^( f! `- R例如,在地圖導航的AI應(yīng)用中,使用“請根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。. X1 i7 w6 B5 y& s8 c! r0 ]
    這種方法不僅提升了信息的全面性,也增強了AI回答的針對性。(這不僅是我們最容易實現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
    ; u! R/ P( H" G/ V4 p4 f" g( ]9 _ 1 s" X- h0 p, k
    0 t9 R/ s- x9 o. Q
    二. 模型開發(fā)不能停AI模型與訓練過程的不斷進化是減少幻覺產(chǎn)生的關(guān)鍵。6 x2 o8 s5 y  Q) p4 X/ H% ^8 y+ U
    0 V6 N7 h! O# K2 f- ]
    A. 創(chuàng)新解碼技術(shù)5 h& N2 Z( e: Y! x7 c) a. O+ F( `
    采用新的解碼策略,以便更精準地處理語言上下文,例如上下文感知解碼(CAD)。0 b0 h% v% L( v1 _
    " Z( I2 \4 m/ O
    這種方法通過在解碼過程中引入上下文信息,鼓勵模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預訓練階段學到的知識。5 Y: _6 S% k  M8 ~6 E6 u

    , a9 A! ^# M! d0 v: J, _例子:在翻譯一部科幻小說時,傳統(tǒng)模型可能會直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。! v, I; k9 U* B( ~3 `

    0 i" l5 p7 c: a! l

      r" C4 Q: @1 qB. 知識圖譜的應(yīng)用
    4 h( `& B( Q  `$ |! |通過知識圖譜,我們能夠豐富AI的知識庫,讓生成的內(nèi)容更加準確和有深度。7 J* I  S: i$ W7 F% i6 |
    2 G+ K" q, ]' T' B$ Y# T
    想象一下,知識圖譜就像一個巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個“用戶”在這個網(wǎng)絡(luò)中都是一個實體,比如人、地點、事物或者概念。% P4 V9 D, i+ c6 ~2 L
    & ~* d' L3 v7 u9 W- Y
    它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識圖譜通過這種方式組織信息,就像一個超級學霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    8 V! ^7 w: l+ t' \$ G. L# e
    . w+ x  r7 d% d% [3 X. }6 f0 S; \3 r舉個例子,如果你在知識圖譜中查找“蘋果”,它不僅會告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。2 @, n; E( h8 U" A0 U
    7 Y: s4 a2 W* _5 a+ l

    . H" r$ h  }* F/ sC. 基于忠實度的損失函數(shù)3 d; p/ n) ^6 h7 K9 p
    引入新的損失函數(shù),對偏離原始數(shù)據(jù)的生成內(nèi)容進行懲罰,以減少不準確的信息,從而把AI從幻覺中“掐醒”。
    6 C/ E* y( q8 \8 Z& q7 Q) W4 U7 w% ^4 C, ]: Q3 S2 ^6 V/ I. @
    : w& _7 g7 z9 N4 H: u
    舉個例子,AI在生成文章摘要時,如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會提高懲罰,確保模型學習到生成與原文相符的內(nèi)容。
    & v# y* y1 x. ?3 a1 r  F. t4 S, \  S2 P) T
    - [1 {8 Y8 q1 G; V* \$ ?
    D. 監(jiān)督微調(diào)( g& F2 k! ~7 r
    通過特定領(lǐng)域的數(shù)據(jù)進行微調(diào),提升模型在特定任務(wù)上的準確性。
    0 n7 S# J- A# Y( ~# J5 ]) v
    ! S/ r% j. H: n) E* l+ O  L
    6 V' O& L7 r! r7 \' ?( I! L舉個例子,一個通用的語言模型可能對通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進行訓練微調(diào),可以顯著提高模型在通信領(lǐng)域的準確性。
    : \; ~: ^5 a5 h. g# \$ f比如,它可以更準確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。6 Z1 }4 x1 ]" _2 S! j7 u# Y
    1 H( s2 v, G$ q9 O3 D5 U
    三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復雜的任務(wù),減少在生成文本時出現(xiàn)的錯誤或不準確的信息。# `% s; q5 w( o$ A3 v, P
    A. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。- M8 a4 ], {1 x8 @  i& W
    PAL技術(shù)像是一個“自動化工具”,它通過內(nèi)置的程序邏輯來指導AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。% s9 L( m: I+ o! ^

    ( O9 M; y1 Q* p舉個例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點提醒我喝水!毕到y(tǒng)會設(shè)置一個自動化的日程提醒,每天按時提醒你,而不需要進一步的交互。
    & ~, C1 I9 [3 L/ {: N. d) V& Q
    ( s7 \7 W4 R) {# ~: j
    5 n3 K6 D+ m7 S+ x# C3 J! W1 iB. ReAct(Reasoning and Acting,推理與行動):$ c* k. k/ J2 l) S/ F9 g  ^$ G! g
    ReAct技術(shù)強調(diào)AI對上下文的理解,以及基于這種理解進行的推理和決策。8 c  c" n1 V8 m" Q3 n

    : P4 m7 N- Q7 |, [) N: r& P* [ReAct技術(shù)更像是一個“智能助手”,它不僅理解用戶的請求,還能夠根據(jù)請求的內(nèi)容進行推理,并采取相應(yīng)的行動。這種技術(shù)的優(yōu)勢在于能夠處理那些需要靈活推理和決策的任務(wù)。
    / \( ]' z; e7 W1 d, V, w" v
      A: m" ~( P; E! o4 `/ L% y5 W舉個例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個會議,需要準備一份報告。”ReAct系統(tǒng)會理解你的請求,然后推理出你需要的信息類型,可能會詢問你報告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準備報告。
    " @9 d5 G' F7 ^2 k' O+ j( v
    / A: g) X' Z3 t1 x" ?8 _1 Q) y
    ) ]% }( Q9 s, ^; A& O, L5 Z2 q+ W$ n% _2 n$ L
    END
    % I* T, y3 t: x' T- \, W& |+ t文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?  @7 {; G, j9 Y; j5 C' P- K3 W
    4 \; O+ Q. {% E5 p) I1 R* z$ i
    所以下次當你的AI應(yīng)用開始“夢話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。' l5 [) o! Z5 V& h4 s1 ?7 ]/ }& e
    其實,AI也是在學習中成長的“小朋友”,它們在努力成長,可能偶爾也會開個小差,做個“白日夢”。只要我們用正確的方法引導它,多用一點耐心教導它,它就能從“夢游”中醒來,為我們提供準確、可靠的服務(wù)
    * `" e0 n: @# y5 y1 j
    5 T! {1 ?: x# A3 u& C. i" D( t# T~~~
    8 I- n! \8 k6 R% w7 ?
    ! ]- Y1 W3 G4 ~+ o# U小問答  i5 d# [+ V+ t# t* h: {/ J  e+ B
    請問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢- v) M: \* f& E6 f+ ~% i' r
    * }% U+ R1 V8 b& K
    ?還有沒有什么典型的AI幻覺的例子?評論區(qū)跟大家分享一下吧~3 b* J. N/ X" i4 l" ^/ B

    ! ~3 A3 G# b/ l. O/ O) d2 _/ e1 u; y  ?! x+ v0 P% M& w, P/ Z
  • 回復

    使用道具 舉報

    發(fā)表回復

    您需要登錄后才可以回帖 登錄 | 立即注冊

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表