電子產(chǎn)業(yè)一站式賦能平臺(tái)

PCB聯(lián)盟網(wǎng)

搜索
查看: 23|回復(fù): 0
收起左側(cè)

ChatGPT為什么會(huì)“胡說(shuō)八道”?

[復(fù)制鏈接]

563

主題

563

帖子

3385

積分

四級(jí)會(huì)員

Rank: 4

積分
3385
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2024-9-13 11:25:00 | 只看該作者 |只看大圖 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式
AI幻覺(jué),簡(jiǎn)單來(lái)說(shuō),是指人工智能系統(tǒng)(自然語(yǔ)言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說(shuō)“夢(mèng)話”一樣~' X/ b+ E' U5 V( g6 F

* t' c9 d4 ]! t7 e; ? 9 D- \  H  j" {8 Q
那么AI幻覺(jué)有哪些?是什么原因產(chǎn)生的?我們?cè)撊绾伪苊釧I幻覺(jué)呢?3 M" [1 V9 f6 t7 d& n
/ ^1 }* p" ?$ [/ `) v: M
10 j: O+ P( V, I( U2 _( P, f: w) {
AI會(huì)產(chǎn)生什么樣的幻覺(jué)?
3 W: X8 n8 U8 p
% D6 ]9 `1 B  R* a可能有的小伙伴說(shuō):“我知道了!AI‘胡說(shuō)八道’就是AI幻覺(jué)唄?”其實(shí)也沒(méi)這么簡(jiǎn)單,AI幻覺(jué)主要有兩類。
- O' _7 P8 T; s4 _7 A  F事實(shí)幻覺(jué):“假新聞制造機(jī)”, O. y' B. r6 u9 ~. z- }
A:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾
' H" o; a5 J- ]* X: P ! Q: R% W2 |/ s: C% H) y. @) B" P1 j
當(dāng)被問(wèn)及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個(gè)事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個(gè)回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。
. l: |- O' E9 D! `% q" i) j6 sB:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容
+ ]% H1 F1 c  P7 z

( j  y* F1 ?6 {' t2 h. I) u. e
, m  {7 F3 }/ h如果AI描述說(shuō)“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒(méi)有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說(shuō)藏有古代法老的寶藏或未知的高科技裝置了。& h5 h- D$ J  m# g) w
忠誠(chéng)度幻覺(jué):“指令迷失”
! O6 e* K$ I, t3 \3 |A:指令不一致:AI的回答偏離用戶的要求! T! a2 f" P: `6 U
0 D* _$ f5 @; B5 m# B7 r5 y& k- T

/ E7 T4 @$ T' c) X  X" X9 o# W6 `# i如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問(wèn)題。% u, i/ C$ b! O9 U5 }5 }
B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符% i+ k, Y6 z5 N, H- J, U$ X

  ?- L9 x4 n3 A1 f5 V假設(shè)在一個(gè)討論中國(guó)傳統(tǒng)節(jié)日的上下文中,用戶問(wèn):“春節(jié)是什么時(shí)候?”AI回答:“春節(jié)是中國(guó)農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個(gè)回答是正確的,符合春節(jié)的基本情況。. M( k1 I6 @5 G  O4 \
然而,如果AI接著說(shuō):“春節(jié)是紀(jì)念屈原的節(jié)日,人們會(huì)吃粽子和賽龍舟!边@就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。
1 G" v2 o: ~, Q7 X7 kC. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾
2 y, e. E- K5 {+ P& m5 Y  l開頭的9.11大于9.9就是一個(gè)典型的數(shù)值計(jì)算邏輯混亂的例子……,AI把自己繞蒙了~
# ?0 w' v# ]+ p! U% k% g$ j. T1 v- j6 `8 j2 L5 b
2
# U3 a- g. q. E- l4 M0 nAI幻覺(jué)有哪些特點(diǎn). u0 A% q7 b. l0 V7 |, X
$ x( e" ]- T3 X, N* p
  • 內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。
  • 表面合理性 :生成的內(nèi)容表面上看起來(lái)可信,給人以“這看起來(lái)很對(duì)”的第一印象,非專業(yè)人士難以辨別。
  • 上下文相關(guān) :AI的幻覺(jué)內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。
  • 不可預(yù)測(cè)性 :很難預(yù)測(cè)AI何時(shí)會(huì)產(chǎn)生幻覺(jué),可能幻覺(jué)也很難復(fù)現(xiàn),就像人很難在今天做一個(gè)與昨天相同的夢(mèng)。
    * g) c1 K& z+ b
    32 b' f7 Y  c( k9 i8 ~% E' T
    AI幻覺(jué)的“幕后黑手”
    . X6 ^1 u( |! |7 N" `! @7 n' a- l) D8 y
    AI幻覺(jué)主要來(lái)自以下方面:數(shù)據(jù)里的“坑”- y6 K8 k8 V  |( G# B2 N

    - y, j0 U$ B6 V8 }5 m; f" \
  • 訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯(cuò)誤、偏見或過(guò)時(shí)信息。就像教小朋友學(xué)習(xí),課本是錯(cuò)的,考試自然無(wú)法答對(duì)。
  • 缺乏實(shí)時(shí)更新:AI通常基于靜態(tài)數(shù)據(jù)訓(xùn)練,無(wú)法及時(shí)獲取最新信息?荚囈鶕(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
    2 t8 w; F" L% I3 a$ G- f 0 Q1 @; T+ v/ |  v! M  v
    & n: s7 @' }* w. L' f/ {
    訓(xùn)練過(guò)程的“小插曲”* n" j9 r; `/ m" T" }5 ^
    : L- i/ Q# E) F& U' P2 U
    " z/ _. _2 s3 Z
  • 過(guò)度泛化 :模型可能過(guò)于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯(cuò)誤。就像我們學(xué)習(xí)時(shí)候只記住了公式,卻不會(huì)靈活變通。
  • 上下文理解不足:AI可能無(wú)法完全把握復(fù)雜的上下文關(guān)系。在處理多個(gè)復(fù)雜信息點(diǎn),或者在推理時(shí)容易出錯(cuò)。就像我們的大腦有時(shí)也會(huì)短路一樣。% F7 p' N! |. o% _, j% N
    7 }- J! u# s- U7 ^$ l3 q- A# d
    模型本身的“小缺陷”# v% l; }/ a6 x2 j+ z% l

    # |  }. [' ~- a
    2 Z/ B3 y/ o9 S* s' a模型結(jié)構(gòu)限制:AI通過(guò)統(tǒng)計(jì)模式預(yù)測(cè),但可能無(wú)法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過(guò)是基于復(fù)雜算法的數(shù)學(xué)而已~”
    / K* `+ ]2 e% q; N) {40 K! ?1 U* x  D3 Z" @2 j
    ' Y% p8 U( |* u' V  Q3 h& J. v
    如何避免AI幻覺(jué)?
    8 V. c: B* F; n7 @/ a. |8 G4 J- N1 H
    4 m$ I3 E  J) g8 }- X) N8 v% x避免AI幻覺(jué)有以下幾個(gè)“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過(guò)優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。6 U" H& G# _1 r) |" |# z
    A. 檢索增強(qiáng)生成(RAG)技術(shù): O  s; I( d+ v' v
    ' m' z$ q# M5 D) t! F) l2 C
    RAG技術(shù)通過(guò)引入外部知識(shí)來(lái)幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:/ }9 h' c/ F$ x; P+ q
    生成前檢索:在內(nèi)容生成前,系統(tǒng)會(huì)預(yù)檢索相關(guān)背景信息,為生成過(guò)程打下堅(jiān)實(shí)的基礎(chǔ)。0 q1 g/ t* C) N7 L" q6 h' Y  {
    生成過(guò)程中檢索:在生成過(guò)程中,系統(tǒng)實(shí)時(shí)檢索并整合外部知識(shí),確保內(nèi)容的時(shí)效性和深度。
    / v& B" X1 X. A* B# M  \生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對(duì)比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。" M, J$ b$ ?" {& o7 A5 p
    2 L  F" I3 U0 D% h/ p8 H
    例如,當(dāng)AI被問(wèn)到“2024年登月的宇航員有哪些?“時(shí),RAG系統(tǒng)會(huì)先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。3 ]/ f7 L" V7 o. Y$ e/ q# A; @

    1 E. {# f6 ^0 l5 `0 f: [. I0 pB. 基于反饋和推理的自我改進(jìn)機(jī)制; `3 e1 w/ z8 ?, s+ G8 Q
    這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。
    0 |. E5 G! h" U7 P
    ( P' Y8 W) ?/ S3 z' T* i
    : f5 h' ^; k5 q. w5 G- S! {. |AI在生成答案后,會(huì)進(jìn)行自我審視,提出疑問(wèn):“這個(gè)答案是否全面?是否有關(guān)鍵信息被忽略?”. I6 W: x5 x7 K+ R' R1 e2 j* c
    C. 提示詞的精細(xì)化調(diào)優(yōu)5 m1 t% N5 x$ `2 Q
    通過(guò)精心設(shè)計(jì)的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。
    " [$ W1 I  M$ k
    4 ]0 |4 J' t/ M9 a+ k- C
    + ?$ C5 k( B- @0 j+ l例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請(qǐng)根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時(shí)推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
    . D! w+ h' D6 k- {+ ?這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對(duì)性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。
      s9 p8 A% \8 m( ~
    ' j5 Q7 P( }  A. z- {2 \
    ) @5 P  S! C9 o' F$ X. @' e二. 模型開發(fā)不能停AI模型與訓(xùn)練過(guò)程的不斷進(jìn)化是減少幻覺(jué)產(chǎn)生的關(guān)鍵。& K0 E% B! f* e  K

    . c! O5 v; B: _+ x) \6 a$ X& k1 q6 WA. 創(chuàng)新解碼技術(shù)
    ' B3 ~3 d8 ]8 H; M) `" N采用新的解碼策略,以便更精準(zhǔn)地處理語(yǔ)言上下文,例如上下文感知解碼(CAD)。) C$ R" Q0 R9 E

    9 y, Y% u) l/ V; S. A這種方法通過(guò)在解碼過(guò)程中引入上下文信息,鼓勵(lì)模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)。% D/ n: Q( i# R  {
    & M+ H6 p, I6 }/ V- ], W  u
    例子:在翻譯一部科幻小說(shuō)時(shí),傳統(tǒng)模型可能會(huì)直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會(huì)理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
    ' y& N: j0 V6 ]5 L. h0 F/ S8 D( N  @- P: w: Q8 m# Q

    ( u1 |/ @/ r9 \0 C3 m8 M# l' aB. 知識(shí)圖譜的應(yīng)用" i  @. U5 o8 `2 ]
    通過(guò)知識(shí)圖譜,我們能夠豐富AI的知識(shí)庫(kù),讓生成的內(nèi)容更加準(zhǔn)確和有深度。
    ' f" {" L% ?% U7 X! N, ~5 L, F
    9 o; |3 A& F, C& x想象一下,知識(shí)圖譜就像一個(gè)巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個(gè)“用戶”在這個(gè)網(wǎng)絡(luò)中都是一個(gè)實(shí)體,比如人、地點(diǎn)、事物或者概念。
    ( w( M" [# A; ]# U7 ?* c2 x7 |0 z$ R7 ^1 i+ P' y
    它們通過(guò)各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識(shí)圖譜通過(guò)這種方式組織信息,就像一個(gè)超級(jí)學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。
    ) D2 p: \, n. V; E" p" S! b; \5 Y8 w8 P2 d0 y
    7 ?! z3 C: m3 ~3 [2 X+ G+ J舉個(gè)例子,如果你在知識(shí)圖譜中查找“蘋果”,它不僅會(huì)告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會(huì)告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬(wàn)有引力。8 f8 C# c# g$ h5 I

    . O% @! r+ Q8 p+ t% n

    & r- l0 B# Z' F7 {; S/ N0 mC. 基于忠實(shí)度的損失函數(shù)
    - g2 w) ^  U2 W8 H. G: M8 ]引入新的損失函數(shù),對(duì)偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺(jué)中“掐醒”。
    9 Q2 R6 S) _* `9 y* x4 i' }( I. `# m5 k8 o

    9 k: e5 z: @$ @! S2 I/ Z舉個(gè)例子,AI在生成文章摘要時(shí),如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會(huì)提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。
    * j0 M# H' K- s5 R$ a$ b5 A# s6 {/ N: [  W; N) B
    1 i. T2 |1 {& G8 s5 v$ O. j' [
    D. 監(jiān)督微調(diào)
    2 V# e) i3 N7 {& W+ S2 M通過(guò)特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。! e9 i/ o% o' _# S% V2 S/ T7 j7 i5 P, \4 h
    2 O: C1 n0 }7 G( a# l7 m( ~6 g
    * H& L4 L& S8 E1 F7 a+ b4 l
    舉個(gè)例子,一個(gè)通用的語(yǔ)言模型可能對(duì)通信術(shù)語(yǔ)理解有限。通過(guò)使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
    $ [, ^5 k. a2 O0 G比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語(yǔ)的區(qū)別,如EBGP和IBGP。+ c+ s* z4 d1 R6 G/ S
    # ^" r! u: R% Y* s+ o, E0 q: W. D
    三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過(guò)這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時(shí)出現(xiàn)的錯(cuò)誤或不準(zhǔn)確的信息。6 f. [! x3 B8 }6 d9 v7 ^
    A. PAL(Program-Aided Language Models,程序輔助語(yǔ)言模型):PAL技術(shù)通過(guò)將程序化邏輯嵌入到語(yǔ)言模型中,使得AI能夠執(zhí)行特定的程序或算法來(lái)完成任務(wù)。
    : L3 o9 P1 B, d% i0 R+ wPAL技術(shù)像是一個(gè)“自動(dòng)化工具”,它通過(guò)內(nèi)置的程序邏輯來(lái)指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。
    ) X- E' W8 a$ r- u" g5 J3 w & N, j' M3 r4 W% X5 K- S! h5 ]
    舉個(gè)例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水!毕到y(tǒng)會(huì)設(shè)置一個(gè)自動(dòng)化的日程提醒,每天按時(shí)提醒你,而不需要進(jìn)一步的交互。1 c4 U5 Z' ~2 r5 d. B3 ^  P! I
    ( S( h& L3 E& Q% x

    % K7 y+ U: @( _6 L) T1 E: dB. ReAct(Reasoning and Acting,推理與行動(dòng)):9 C5 d9 _" `: w0 @; f; l0 r1 _
    ReAct技術(shù)強(qiáng)調(diào)AI對(duì)上下文的理解,以及基于這種理解進(jìn)行的推理和決策。
    ; i! y7 r' {3 J  Z- B0 c
    1 o0 c1 }5 o4 S5 nReAct技術(shù)更像是一個(gè)“智能助手”,它不僅理解用戶的請(qǐng)求,還能夠根據(jù)請(qǐng)求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動(dòng)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些需要靈活推理和決策的任務(wù)。
    7 p1 L# E, z% `) G$ \9 _* u* T( }4 {, k" A5 L" |% T( h6 D, s8 N
    舉個(gè)例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個(gè)會(huì)議,需要準(zhǔn)備一份報(bào)告!盧eAct系統(tǒng)會(huì)理解你的請(qǐng)求,然后推理出你需要的信息類型,可能會(huì)詢問(wèn)你報(bào)告的具體內(nèi)容和格式,然后根據(jù)這些信息來(lái)幫助你準(zhǔn)備報(bào)告。1 ]4 s/ G6 |+ k: S: P' @. y
    ) s' U1 m4 ?7 G/ G, t

    1 m/ S0 i1 J, l  J$ }' f# c
    5 O  X+ s* \+ x1 u& T5 W* nEND* `" w  z" _$ }% ^1 M- s& j5 r5 O
    文檔君的AI幻覺(jué)就介紹到這啦!是不是秒懂了“AI幻覺(jué)”?
    1 V8 l: @, _# u
    , S  Z1 W. X; @所以下次當(dāng)你的AI應(yīng)用開始“夢(mèng)話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。  {7 s" Y) {3 X/ b; ?0 r
    其實(shí),AI也是在學(xué)習(xí)中成長(zhǎng)的“小朋友”,它們?cè)谂Τ砷L(zhǎng),可能偶爾也會(huì)開個(gè)小差,做個(gè)“白日夢(mèng)”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢(mèng)游”中醒來(lái),為我們提供準(zhǔn)確、可靠的服務(wù)7 ~* V! G  ]- Y
    6 d4 o8 b  H' D" Q: E/ q2 g. j0 L/ ^" c
    ~~~0 J0 u: m/ C  N1 O" \5 b9 o
    3 K- c2 ^3 G/ @& N2 p8 d4 @
    小問(wèn)答% l: ?, f6 B! L' A2 {. U% f+ B
    請(qǐng)問(wèn)“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺(jué)呢2 I7 g; H4 r+ y0 r
    . m8 j7 f7 C6 W* ?4 ^, p) v
    ?還有沒(méi)有什么典型的AI幻覺(jué)的例子?評(píng)論區(qū)跟大家分享一下吧~& m+ b/ b7 M+ X* Y
    $ W/ M5 o# L8 ^) J. q* {7 W3 q2 Z
    8 q2 |4 C! e6 D/ B+ S/ k2 V1 i
  • 發(fā)表回復(fù)

    本版積分規(guī)則


    聯(lián)系客服 關(guān)注微信 下載APP 返回頂部 返回列表