日日噜噜噜夜夜爽爽狠狠22_中文字幕在线不卡_久久久伦理_久久综合激情网_曰批免费视频播放免费_狠狠做五月爱婷婷综合

總編輯圈點|用AI生成數據訓練AI或導致模型崩潰,原始內容9次迭代后成了“胡言亂語”

2024-07-25 19:47:49 來源: 科技日報 點擊數:

科技日報記者?張夢然

《自然》24日正式發表的一篇研究論文指出了一個人工智能(AI)嚴重問題:用AI生成的數據集訓練未來幾代機器學習模型,可能會嚴重“污染”它們的輸出,這被稱為“模型崩潰”。研究顯示,原始內容會在9次迭代以后,變成不相關的“胡言亂語”(演示中一個建筑文本最終變成了野兔的名字),這凸顯出使用可靠數據訓練AI模型的重要性。


研究模型測試。
圖源:《自然》

生成式AI工具越來越受歡迎,如大語言模型等,這類工具主要用人類生成的輸入進行訓練。不過,隨著這些AI模型在互聯網不斷壯大,計算機生成內容可能會以遞歸循環的形式被用于訓練其他AI模型或其自身。

包括英國牛津大學在內的聯合團隊一直在進行相關研究,并在去年論文預印本中提出這一概念。在正式發表的論文中,他們用數學模型演示了AI可能會出現的“模型崩潰”。他們證明了一個AI會忽略訓練數據中的某些輸出(如不太常見的文本),導致其只用一部分數據集來自我訓練。

團隊分析了AI模型會如何處理主要由AI生成的數據集。他們發現,給模型輸入AI生成的數據,會減弱今后幾代模型的學習能力,最終導致了“模型崩潰”。他們測試的幾乎所有遞歸訓練語言模型,都容易出現問題。比如,一個用中世紀建筑文本作為原始輸入的測試,到第9代的輸出已經是一串野兔的名字。

團隊指出,用前幾代生成的數據集去訓練AI,崩潰是一個不可避免的結局。他們認為,必須對數據進行嚴格過濾。與此同時,這也意味著依賴人類生成內容的AI模型,或許能訓練出更高效的AI模型。

總編輯圈點:

對AI來說,“模型崩潰”就像癌癥一樣,甚至分早期與晚期。在早期時,被“喂”了生成數據的AI會開始失去一些原始正確數據;但在晚期,被“喂”了生成數據的AI會“口吐狂言”——給出完全不符合現實,也和底層數據一點不相關的結果,就像本文中的例子一樣。更可怕的是,“模型崩潰”的AI極其固執,錯誤幾乎難以矯正。它會持續強化,最終把錯誤結果認為是正確的。這一問題值得所有關注生成式AI的人們警惕,因為它等于是在“毒化”AI對真實世界的認知。

責任編輯:常麗君

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級,繼續瀏覽

繼續瀏覽
主站蜘蛛池模板: 国产成人AV片在线观看 | 亚洲综合无码明星蕉在线视频 | 欧美黑人又粗又大又爽免费 | 伊人久久大香线蕉AV综合 | 午夜精品久久久久久久久久久久 | 亚洲日韩一区精品射精 | 天堂va欧美ⅴa亚洲va | 欧美一区二区三区日韩 | 国产高清露脸孕妇系列 | 娇妻被别人玩弄至高潮视频 | 在线观看亚洲 | 国产成人AV综合久久视色 | 亚洲乱码无码永久不卡在线 | 久久久久久A亚洲欧洲AV冫 | 国产亚洲精品久久久美女 | 私人影院午夜在线观看 | 高清无码午夜福利视频 | 在教室伦流澡到高潮H免费视频 | 国产精品成年片在线观看 | 国产乱国产| 国产精品久久自在自线青柠 | 欧美成人性a片免费观看办公室 | 国产在线精品亚洲第一区香蕉 | 国产精品久久久999 亚洲大尺度无码无码专线一区 | 两个人的www免费高清视频 | 国产精品宾馆在线精品酒店 | 在线视频观看一区二区 | 日韩欧美亚 | 国产成人亚洲综合色 | 日韩视频一区二区三区在线观看 | 无码H黄肉动漫在线观看 | 国产超爽人人爽人人做人人爽 | 亚洲色偷偷偷网站色偷一区 | 亚洲色无码综合图区手机 | 成人免费播放视频777777 | 啊灬啊灬啊灬快灬高潮少妇a片 | 午夜无码福利伦利理免 | 国产亚洲人成无码网在线观看 | 热の无码热の有码热の综合 | 狠狠综合久久AV一区二区 | 成年女人喷潮视频免费观看 |