|
AI幻覺,簡(jiǎn)單來說,是指人工智能系統(tǒng)(自然語言處理模型)生成的內(nèi)容與真實(shí)數(shù)據(jù)不符,或偏離用戶指令的現(xiàn)象,就像人類說“夢(mèng)話”一樣~9 ^( F& N% b' f! X; h6 ?. W
- ?' `3 @ u7 O) V! ?
syimypeif4j6401183011.png (83.82 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
syimypeif4j6401183011.png
2024-9-15 09:49 上傳
, m: G. x5 w% x( S9 Y那么AI幻覺有哪些?是什么原因產(chǎn)生的?我們?cè)撊绾伪苊釧I幻覺呢?9 }% L( T- I! R' L- w0 P
3gsfhzuwk0e2_121183111.png (4.55 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
3gsfhzuwk0e2_121183111.png
2024-9-15 09:49 上傳
/ t6 L" v. |7 h* V( h3 K
1& R, v. P- w7 l$ F
AI會(huì)產(chǎn)生什么樣的幻覺?
/ k/ @! H- k% B: @ h( P; D8 ?
1 F m+ b. ]) c# y; s/ w! p可能有的小伙伴說:“我知道了!AI‘胡說八道’就是AI幻覺唄?”其實(shí)也沒這么簡(jiǎn)單,AI幻覺主要有兩類。9 n3 S2 T! s4 r& U
事實(shí)幻覺:“假新聞制造機(jī)”
8 w, N0 Z' F) V2 `! P6 ?A:事實(shí)不一致:AI生成的內(nèi)容與現(xiàn)實(shí)世界事實(shí)相矛盾
! y' r* o2 B( P$ ^$ k1 n5 R
gdfcldtlg506401183211.png (84.98 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
gdfcldtlg506401183211.png
2024-9-15 09:49 上傳
" B" S; P0 m: l8 M; s當(dāng)被問及“世界上最高的山峰是哪座?”,如果AI回答“深圳塘朗山是世界上最高的山峰!边@就是一個(gè)事實(shí)不一致的例子,因?yàn)樘晾噬阶溆趶V東省深圳市,海拔430米遠(yuǎn)低于珠穆朗瑪峰8848.86米,這個(gè)回答與現(xiàn)實(shí)世界的事實(shí)相矛盾。
* i% o; k. l6 J/ E2 k0 ?B:事實(shí)捏造:AI生成完全虛構(gòu)的內(nèi)容
4 M Z( O$ {1 Q4 |; f2 O6 B" i |9 U$ a
uygn1c3fw4l6401183311.png (83.78 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
uygn1c3fw4l6401183311.png
2024-9-15 09:49 上傳
3 T( ?4 T' U# C8 e如果AI描述說“2024年,考古學(xué)家在埃及金字塔內(nèi)發(fā)現(xiàn)了一座隱藏的密室,里面藏有古代法老的寶藏和未知的高科技裝置!边@就是完全虛構(gòu)的信息,截至目前沒有考古發(fā)現(xiàn)或科學(xué)證據(jù)表明埃及金字塔內(nèi)存在未被發(fā)現(xiàn)的密室,更不用說藏有古代法老的寶藏或未知的高科技裝置了。: u4 k- c9 K, T" n
忠誠(chéng)度幻覺:“指令迷失”# C: ? J" m+ {- D- T) m# q7 C
A:指令不一致:AI的回答偏離用戶的要求
J6 |, Q/ W6 P! E0 q2 L/ S T9 a. E
ubopicvgtbw6401183411.png (111.32 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
ubopicvgtbw6401183411.png
2024-9-15 09:49 上傳
; G& P. i6 V( G) q+ A) P
如果用戶要求AI“講解一下龍飛鳳舞”,但AI回答了“老鐵,我給你搜了幾段舞蹈教學(xué)” ,這就完全偏離了原始的問題。
4 o# A5 E' ]/ D( Y" `B:上下文不一致:AI生成的內(nèi)容與提供的背景信息不符
( R1 H( I% r: `1 V5 p2 c1 T
hvgdukm530p6401183511.png (107.1 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
hvgdukm530p6401183511.png
2024-9-15 09:49 上傳
8 v0 l4 ^( r6 ~( X* l2 n
假設(shè)在一個(gè)討論中國(guó)傳統(tǒng)節(jié)日的上下文中,用戶問:“春節(jié)是什么時(shí)候?”AI回答:“春節(jié)是中國(guó)農(nóng)歷新年,通常在每年的1月或2月慶祝!边@個(gè)回答是正確的,符合春節(jié)的基本情況。, b4 B8 O/ \, f1 }4 T0 v
然而,如果AI接著說:“春節(jié)是紀(jì)念屈原的節(jié)日,人們會(huì)吃粽子和賽龍舟。”這就是上下文不一致的例子,因?yàn)锳I的回答與春節(jié)的背景信息不符。9 X! U: j( q/ w% T, ]8 S6 V
C. 邏輯不一致:AI的輸出存在內(nèi)在邏輯矛盾: R, Q1 d, K" T" @# x
開頭的9.11大于9.9就是一個(gè)典型的數(shù)值計(jì)算邏輯混亂的例子……,AI把自己繞蒙了~
$ I9 c e' E, W6 w* [8 U# k: |4 j8 w# H. w8 Y( M, m
2
8 [3 a. p' U2 w! o' yAI幻覺有哪些特點(diǎn)2 p- o2 O( U( S/ R
, \# h. H" ~* A$ q內(nèi)容流暢性:盡管內(nèi)容可能有誤,AI生成的文本通常仍然連貫流暢。表面合理性 :生成的內(nèi)容表面上看起來可信,給人以“這看起來很對(duì)”的第一印象,非專業(yè)人士難以辨別。上下文相關(guān) :AI的幻覺內(nèi)容并非憑空出現(xiàn),它們通常與特定的上下文情境緊密相關(guān)。不可預(yù)測(cè)性 :很難預(yù)測(cè)AI何時(shí)會(huì)產(chǎn)生幻覺,可能幻覺也很難復(fù)現(xiàn),就像人很難在今天做一個(gè)與昨天相同的夢(mèng)。, r; [, h5 r! ]% G- t2 F: ?1 X
3$ ^9 L) z" G5 v7 U+ g; @: K- _* s
AI幻覺的“幕后黑手”9 x; Q" M( i, e
/ ~# `! K# u* L9 b3 e$ t
AI幻覺主要來自以下方面:數(shù)據(jù)里的“坑”
; d2 E6 T8 v' Q
vchgejyketw6401183611.png (76.24 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
vchgejyketw6401183611.png
2024-9-15 09:49 上傳
1 n8 E; G2 D3 U1 D3 t* v/ B
訓(xùn)練數(shù)據(jù)局限:AI訓(xùn)練數(shù)據(jù)可能包含錯(cuò)誤、偏見或過時(shí)信息。就像教小朋友學(xué)習(xí),課本是錯(cuò)的,考試自然無法答對(duì)。缺乏實(shí)時(shí)更新:AI通;陟o態(tài)數(shù)據(jù)訓(xùn)練,無法及時(shí)獲取最新信息。考試要根據(jù)最新的資料復(fù)習(xí),拿一本82年的教材是考不了24年的高考的~
! Z6 n; G4 j; F8 s" X v
3qvu3przvht2_051183711.png (5.36 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
3qvu3przvht2_051183711.png
2024-9-15 09:49 上傳
* X+ k' Q, t, e6 m7 @4 j+ g3 v
4 @" T/ Q: m5 t2 j7 L; P- ]3 {訓(xùn)練過程的“小插曲”
! X% a) I/ d* Q! Q) K" d3 j( v; q6 d4 H
wzwd2pdnth06401183812.png (76.77 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
wzwd2pdnth06401183812.png
2024-9-15 09:49 上傳
+ P0 W* ]4 l. [6 O) H. t
過度泛化 :模型可能過于依賴某些模式,導(dǎo)致在新情況下推導(dǎo)錯(cuò)誤。就像我們學(xué)習(xí)時(shí)候只記住了公式,卻不會(huì)靈活變通。上下文理解不足:AI可能無法完全把握復(fù)雜的上下文關(guān)系。在處理多個(gè)復(fù)雜信息點(diǎn),或者在推理時(shí)容易出錯(cuò)。就像我們的大腦有時(shí)也會(huì)短路一樣。4 u7 I9 x. x: C
1 c) l+ M$ ~$ |2 @2 _0 H" y模型本身的“小缺陷”6 Z, ?' n. v% B C
' k3 [$ s v z
j3zyrqy1vwi6401183912.png (95.42 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
j3zyrqy1vwi6401183912.png
2024-9-15 09:49 上傳
& \. H1 V* q* A# Z( q9 L4 y5 g6 u, M f
模型結(jié)構(gòu)限制:AI通過統(tǒng)計(jì)模式預(yù)測(cè),但可能無法真正理解信息!澳阋詾樗娴亩,其實(shí)也不過是基于復(fù)雜算法的數(shù)學(xué)而已~”
' ]7 y' J/ f( D43 L2 a% Z1 C0 f' ^
4 n% N6 c3 O+ z* F& Z2 P; N8 V
如何避免AI幻覺?
, D8 d8 q! _- O8 U! a% ^$ t6 v3 E! R# B. q* ?0 s1 Y* z
避免AI幻覺有以下幾個(gè)“絕招”,各位少俠看“自身功力”,酌情修煉~一. 提示工程有策略提示工程通過優(yōu)化AI的輸入提示,使生成的內(nèi)容更準(zhǔn)確。
" {8 p& Y' D1 f2 Y5 g3 S* n" I; RA. 檢索增強(qiáng)生成(RAG)技術(shù)8 E" f) v3 |' _% ]" R
h45y1b2e0eg6401184012.png (2.32 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
h45y1b2e0eg6401184012.png
2024-9-15 09:49 上傳
1 ~8 w) l. _ v+ D# w0 m, H$ k. f( ?
RAG技術(shù)通過引入外部知識(shí)來幫助AI生成更準(zhǔn)確的內(nèi)容。主要方法包括:
9 g! R& ?1 C( P生成前檢索:在內(nèi)容生成前,系統(tǒng)會(huì)預(yù)檢索相關(guān)背景信息,為生成過程打下堅(jiān)實(shí)的基礎(chǔ)。# b7 _1 H, Y! q, T$ b0 w
生成過程中檢索:在生成過程中,系統(tǒng)實(shí)時(shí)檢索并整合外部知識(shí),確保內(nèi)容的時(shí)效性和深度。
2 S' {% X q6 G生成后檢索 :生成后,系統(tǒng)再次檢索,與現(xiàn)有證據(jù)進(jìn)行對(duì)比,驗(yàn)證生成內(nèi)容的準(zhǔn)確性。
4 \( J9 Z2 v/ O- U+ ]6 @9 {
" N0 L5 z: P5 }8 y# E! Y例如,當(dāng)AI被問到“2024年登月的宇航員有哪些?“時(shí),RAG系統(tǒng)會(huì)先檢索最新的新聞信息,然后基于檢索到的準(zhǔn)確信息生成回答。. P* J- N1 u5 g" A1 V/ H! H. c
( p( W8 N& h/ F; J+ h$ r: r( cB. 基于反饋和推理的自我改進(jìn)機(jī)制
2 Z8 H. Z! n$ e: ^9 ^. q+ R8 V( s這種方法賦予AI自我反思的能力,使其能夠不斷優(yōu)化生成的內(nèi)容。1 f' |- h# y; O- [( N5 O
5 G8 y, x" D. P e/ @
4zbhv33auoi6401184112.png (99.05 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
4zbhv33auoi6401184112.png
2024-9-15 09:49 上傳
; I7 p0 L r9 q- b' u& wAI在生成答案后,會(huì)進(jìn)行自我審視,提出疑問:“這個(gè)答案是否全面?是否有關(guān)鍵信息被忽略?”4 p/ [7 Z9 I& H, b# n
C. 提示詞的精細(xì)化調(diào)優(yōu)7 ]+ G9 U5 U. j5 N b
通過精心設(shè)計(jì)的提示詞,引導(dǎo)AI生成更可靠、更精確的內(nèi)容。7 f) _: J7 h2 |2 t- z
, o7 m2 E& x$ p! i8 J* |
1btyypediar6401184212.png (92.14 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
1btyypediar6401184212.png
2024-9-15 09:49 上傳
: H5 P/ V$ L* d9 X" [例如,在地圖導(dǎo)航的AI應(yīng)用中,使用“請(qǐng)根據(jù)最新的交通管制政策、路況信息、天氣情況,提供明天上午九點(diǎn)到深圳灣公園的路線推薦,分別提供駕車與公共交通的路線信息,用時(shí)推薦等”具體提示,代替籠統(tǒng)的“如何去深圳灣公園”。
( r9 t& `/ i* A q這種方法不僅提升了信息的全面性,也增強(qiáng)了AI回答的針對(duì)性。(這不僅是我們最容易實(shí)現(xiàn)的策略,也是最直觀有效的方法,能夠顯著改善內(nèi)容生成的質(zhì)量和深度。/ |+ G" V+ V s1 E* p$ K' ~
ewbmml5gfhp2_061184312.png (5.05 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
ewbmml5gfhp2_061184312.png
2024-9-15 09:49 上傳
6 w2 A/ D, r8 C8 W' p. ?
)0 t3 @9 Z1 N+ i; A" m
二. 模型開發(fā)不能停AI模型與訓(xùn)練過程的不斷進(jìn)化是減少幻覺產(chǎn)生的關(guān)鍵。( r2 e8 R( b/ N! E
4 P) f2 B: y0 U# h3 _A. 創(chuàng)新解碼技術(shù)9 m n# @1 ^( a' T1 M' n" e
采用新的解碼策略,以便更精準(zhǔn)地處理語言上下文,例如上下文感知解碼(CAD)。) o' F, y4 d; n h
pevsu2leeyk6401184412.png (2.22 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
pevsu2leeyk6401184412.png
2024-9-15 09:49 上傳
$ ~, l% l ^- B0 D$ C9 E
這種方法通過在解碼過程中引入上下文信息,鼓勵(lì)模型更多地關(guān)注所提供的上下文,而不是僅僅依賴于模型在預(yù)訓(xùn)練階段學(xué)到的知識(shí)。
, h. h4 I7 A* F: f i* A W; t- R8 K* q6 V! O
例子:在翻譯一部科幻小說時(shí),傳統(tǒng)模型可能會(huì)直譯“Beam me up”為“把我光束上去”,而應(yīng)用CAD的模型會(huì)理解這是一句要求傳送的指令,正確翻譯為“把我傳送上去”。
6 X' n7 X& X* ?
7 _, m* f k* @$ @ y5 }# h* a
5 b. z/ {4 Z. c1 n/ gB. 知識(shí)圖譜的應(yīng)用& O4 Y b: \! W3 n' h: |
通過知識(shí)圖譜,我們能夠豐富AI的知識(shí)庫(kù),讓生成的內(nèi)容更加準(zhǔn)確和有深度。
V( W& v* z6 I+ M
edekxjzhbnz6401184512.png (1.79 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
edekxjzhbnz6401184512.png
2024-9-15 09:49 上傳
, _4 y c% C# ~9 k: E9 A' n
想象一下,知識(shí)圖譜就像一個(gè)巨大的、互聯(lián)的“社交網(wǎng)絡(luò)”,但它不是連接人,而是連接各種信息和概念。每個(gè)“用戶”在這個(gè)網(wǎng)絡(luò)中都是一個(gè)實(shí)體,比如人、地點(diǎn)、事物或者概念。
; f& r J$ {$ ~6 ~- s3 L2 g) F5 k0 O$ g v% n& e; ~
它們通過各種“關(guān)系”相互連接,就像社交軟件上的好友關(guān)系一樣。知識(shí)圖譜通過這種方式組織信息,就像一個(gè)超級(jí)學(xué)霸幫助AI快速找到信息,并且理解不同信息之間的聯(lián)系。# t. h0 _! n+ [& I- R/ V4 ^
7 o' j/ @" {0 \( L$ V舉個(gè)例子,如果你在知識(shí)圖譜中查找“蘋果”,它不僅會(huì)告訴你蘋果是一種水果,還可能告訴你蘋果公司是一家科技公司,甚至還會(huì)告訴你牛頓被蘋果啟發(fā)發(fā)現(xiàn)了萬有引力。
( ]# u4 d# v+ @$ r/ R# q; ]& h2 k3 _( v- S9 L& Z3 U4 {8 D- N4 d7 f [* b
9 I* A1 Y' z: w, KC. 基于忠實(shí)度的損失函數(shù)
7 j9 u3 W# s- O, `& g引入新的損失函數(shù),對(duì)偏離原始數(shù)據(jù)的生成內(nèi)容進(jìn)行懲罰,以減少不準(zhǔn)確的信息,從而把AI從幻覺中“掐醒”。" f( a: X) a* b3 x4 h/ K/ t! ~
) Z3 M0 d! p( b) k7 K t' ^. b( U1 X
2eklg21dwbl6401184612.png (90.68 KB, 下載次數(shù): 3)
下載附件
保存到相冊(cè)
2eklg21dwbl6401184612.png
2024-9-15 09:49 上傳
& {2 n( C9 [; K2 w" y
舉個(gè)例子,AI在生成文章摘要時(shí),如果回答中添加了原文中未提及的內(nèi)容,損失函數(shù)會(huì)提高懲罰,確保模型學(xué)習(xí)到生成與原文相符的內(nèi)容。' [5 H l" d0 I& t7 t& c
7 \% ^; Y, S* z, ?( l, n' y$ G. U$ Z. v4 D
D. 監(jiān)督微調(diào)8 n2 o) M: U0 p2 L/ B/ i1 `
通過特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),提升模型在特定任務(wù)上的準(zhǔn)確性。
/ {/ I7 T# {" b- ?6 h- f( G- |0 O$ @: F% b% V3 l1 M
xulkj4si3tn6401184713.png (126.48 KB, 下載次數(shù): 2)
下載附件
保存到相冊(cè)
xulkj4si3tn6401184713.png
2024-9-15 09:49 上傳
/ f# X' k$ K4 ?3 h" ?舉個(gè)例子,一個(gè)通用的語言模型可能對(duì)通信術(shù)語理解有限。通過使用大量通信行業(yè)資料進(jìn)行訓(xùn)練微調(diào),可以顯著提高模型在通信領(lǐng)域的準(zhǔn)確性。
4 a, j2 X& @1 L% I0 L2 ^比如,它可以更準(zhǔn)確地區(qū)分相似通信術(shù)語的區(qū)別,如EBGP和IBGP。
8 B! e( `% h1 L- F0 \" d" C
$ c' F& _' t; u三. AI Agent為模型加BuffAI Agent有特定的能力可以提高模型的可靠性,通過這種方式,AI Agent能夠更好地理解和處理復(fù)雜的任務(wù),減少在生成文本時(shí)出現(xiàn)的錯(cuò)誤或不準(zhǔn)確的信息。
; i- o% u- R9 bA. PAL(Program-Aided Language Models,程序輔助語言模型):PAL技術(shù)通過將程序化邏輯嵌入到語言模型中,使得AI能夠執(zhí)行特定的程序或算法來完成任務(wù)。
$ K& |$ [1 g) c. t& ~PAL技術(shù)像是一個(gè)“自動(dòng)化工具”,它通過內(nèi)置的程序邏輯來指導(dǎo)AI系統(tǒng)如何完成任務(wù)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些規(guī)則明確、步驟固定的任務(wù)。
, E: A( {4 B2 H
rs2ki3x1ihf6401184813.png (40.31 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
rs2ki3x1ihf6401184813.png
2024-9-15 09:49 上傳
3 }& T$ K' [9 X. N舉個(gè)例子,如果你告訴基于PAL技術(shù)的AI系統(tǒng):“我需要在每天下午3點(diǎn)提醒我喝水!毕到y(tǒng)會(huì)設(shè)置一個(gè)自動(dòng)化的日程提醒,每天按時(shí)提醒你,而不需要進(jìn)一步的交互。9 W/ B4 Y# m' m2 n5 L6 s8 N% z
6 N8 j+ u" h l3 h/ y
obthtznez0z6401184913.png (109.53 KB, 下載次數(shù): 4)
下載附件
保存到相冊(cè)
obthtznez0z6401184913.png
2024-9-15 09:49 上傳
: I# a+ t/ Y1 \& m5 V* x- J' |B. ReAct(Reasoning and Acting,推理與行動(dòng)):6 K& l d3 X+ ?' x, I
ReAct技術(shù)強(qiáng)調(diào)AI對(duì)上下文的理解,以及基于這種理解進(jìn)行的推理和決策。+ _ Z! N! c# N7 G w( [0 o
5 ^4 s4 \5 z& `( t
ReAct技術(shù)更像是一個(gè)“智能助手”,它不僅理解用戶的請(qǐng)求,還能夠根據(jù)請(qǐng)求的內(nèi)容進(jìn)行推理,并采取相應(yīng)的行動(dòng)。這種技術(shù)的優(yōu)勢(shì)在于能夠處理那些需要靈活推理和決策的任務(wù)。
+ d5 E t3 i" a4 M$ ^/ c, h4 R z+ [5 b( X! z1 E
舉個(gè)例子,如果你告訴基于ReAct算法的AI系統(tǒng):“我明天有個(gè)會(huì)議,需要準(zhǔn)備一份報(bào)告。”ReAct系統(tǒng)會(huì)理解你的請(qǐng)求,然后推理出你需要的信息類型,可能會(huì)詢問你報(bào)告的具體內(nèi)容和格式,然后根據(jù)這些信息來幫助你準(zhǔn)備報(bào)告。5 ^5 y$ n3 o: V5 L P* D0 `
( B) X- e& t4 ^2 O
+ ?) n% h/ g- g! }& M7 Q# t6 u `# m5 x% F) N$ U
END/ r7 e: k8 Z/ F! j: P
文檔君的AI幻覺就介紹到這啦!是不是秒懂了“AI幻覺”?
3 I2 v: b& _! }2 H4 l4 ?2 o& d d* a' k0 t/ K
所以下次當(dāng)你的AI應(yīng)用開始“夢(mèng)話連篇”,不要“嘲笑”它,也不要急于按下“重啟”鍵。
& n. X4 |* b- v( q# F4 G其實(shí),AI也是在學(xué)習(xí)中成長(zhǎng)的“小朋友”,它們?cè)谂Τ砷L(zhǎng),可能偶爾也會(huì)開個(gè)小差,做個(gè)“白日夢(mèng)”。只要我們用正確的方法引導(dǎo)它,多用一點(diǎn)耐心教導(dǎo)它,它就能從“夢(mèng)游”中醒來,為我們提供準(zhǔn)確、可靠的服務(wù)
& c5 n' B6 v; x& t4 r4 v
; a3 J. K8 E: A/ r k~~~$ }6 ?% H+ f1 S6 t0 q+ F- H. Z: O
& V6 p3 Y6 i3 K* c( N; E9 L
小問答
* O4 l! |2 }7 A9 s u& t: T請(qǐng)問“林黛玉倒拔垂楊柳”屬于AI的哪一種幻覺呢+ V% R: G2 R" u6 o
% K7 G7 s7 N6 y W, F3 t% i# v?還有沒有什么典型的AI幻覺的例子?評(píng)論區(qū)跟大家分享一下吧~
) l$ F/ h4 w. T4 w, O1 x5 [8 n6 w# [: J$ G0 V x
6 W/ M7 x8 O+ D1 v& A$ O4 B3 I' { |
|