如何讓 AI 像人類一樣存有大量記憶?
【CSDN 編者按】專家通過數(shù)據(jù)研究,睡眠可防止 AI 失憶。
神經(jīng)網(wǎng)絡(luò)可以在很多任務(wù)上有超越人類的表現(xiàn),但如果要求一個 AI 系統(tǒng)吸收新的記憶,它們可能會突然忘記之前所學(xué)的內(nèi)容。
現(xiàn)在,一項新的研究揭示了神經(jīng)網(wǎng)絡(luò)經(jīng)歷睡眠階段,并幫助預(yù)防這種健忘癥的新方法。
人工神經(jīng)網(wǎng)絡(luò)面臨的一個主要挑戰(zhàn)是“災(zāi)難性遺忘”(catastrophic forgetting)。當(dāng)它們?nèi)W(xué)習(xí)一項新任務(wù)時,會有一種不幸的傾向,即突然完全忘記他們以前學(xué)到的東西。本質(zhì)上,新學(xué)到的知識會覆蓋過去的數(shù)據(jù)。
相比之下,人類的大腦能夠終身學(xué)習(xí)新任務(wù),而不會影響其執(zhí)行先前記憶的能力。在早有的研究表明,當(dāng)一輪又一輪的學(xué)習(xí)穿插著睡眠時,人腦的學(xué)習(xí)效果最好。睡眠顯然有助于將近期經(jīng)歷融入長期記憶中。
“重組記憶實際上可能是生物體需要經(jīng)歷睡眠階段的主要原因之一,”加州大學(xué)圣地亞哥分校的計算神經(jīng)科學(xué)家 Erik Delanois 說道。
那 AI 是否可以睡覺呢?此前的一些研究試圖通過讓 AI 模擬睡眠來解決災(zāi)難性遺忘。例如,當(dāng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)一項新任務(wù)時,一種被稱為交錯訓(xùn)練的策略會同時向機(jī)器提供它們之前學(xué)習(xí)過的舊數(shù)據(jù),以幫助它們保留過去的知識。這種方法之前被認(rèn)為是在模仿大腦在睡眠時的工作方式,不斷重播舊的記憶。
然而,科學(xué)家們曾假設(shè)交錯訓(xùn)練需要在神經(jīng)網(wǎng)絡(luò)每次想要學(xué)習(xí)新事物時,為其提供最初用于學(xué)習(xí)舊技能的所有數(shù)據(jù)。這不僅需要大量的時間和數(shù)據(jù),而且似乎也不是真正的大腦在真正的睡眠中所做的事情——生物既不會保留學(xué)習(xí)舊任務(wù)所需的所有數(shù)據(jù),睡覺時也沒有時間重播所有這些內(nèi)容。
在一項新研究中,研究人員分析了災(zāi)難性遺忘背后的機(jī)制,以及睡眠對于預(yù)防這種遺忘中的效果。研究人員沒有使用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),而是使用了一種更接近模擬人腦的“脈沖神經(jīng)網(wǎng)絡(luò)”。
在人工神經(jīng)網(wǎng)絡(luò)中,被稱為神經(jīng)元的組件被輸入數(shù)據(jù),并共同解決一個問題,例如識別人臉。神經(jīng)網(wǎng)絡(luò)反復(fù)調(diào)整突觸(神經(jīng)元之間的聯(lián)系),并觀察由此產(chǎn)生的行為模式是否能更好地找到解決方案。
隨著時間的推移(不斷訓(xùn)練),網(wǎng)絡(luò)會發(fā)現(xiàn)哪些模式最適合計算結(jié)果。最后,它采用這些模式作為默認(rèn)模式,這被認(rèn)為是部分模仿了人腦的學(xué)習(xí)過程。
此圖代表了抽象突觸空間中的記憶及其在睡眠和不睡眠時的演化
在大多數(shù)人工神經(jīng)網(wǎng)絡(luò)中,神經(jīng)元的輸出是隨著輸入的變化而不斷變化的數(shù)字。這大致類似于生物神經(jīng)元在一段時間內(nèi)可能發(fā)出的信號數(shù)量。
相比之下,在脈沖神經(jīng)網(wǎng)絡(luò)中,一個神經(jīng)元只有在給定數(shù)量的輸入信號后,才會產(chǎn)生輸出信號,這一過程是對真正生物神經(jīng)元行為的真實再現(xiàn)。由于脈沖神經(jīng)網(wǎng)絡(luò)很少發(fā)射脈沖,因此它們要比典型的人工神經(jīng)網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)更少,原則上也需要更少的電力和通信帶寬。
正如預(yù)期的那樣,當(dāng)脈沖神經(jīng)網(wǎng)絡(luò)學(xué)會在網(wǎng)格中發(fā)現(xiàn)水平粒子對,然后被訓(xùn)練去尋找網(wǎng)格中垂直粒子對時,它顯示出災(zāi)難性的遺忘。然而,在之后的幾輪學(xué)習(xí)后,研究人員讓脈沖神經(jīng)網(wǎng)絡(luò)經(jīng)過一段時間間隔,參與學(xué)習(xí)第一個任務(wù)的神經(jīng)元集合被重新激活。這更接近神經(jīng)科學(xué)家目前認(rèn)為的睡眠過程。
簡單來說就是,脈沖神經(jīng)網(wǎng)絡(luò)使得之前學(xué)習(xí)過的記憶痕跡能夠在離線處理睡眠期間自動重新激活,并在不受干擾的情況下修改突觸權(quán)重。
該研究使用帶有強(qiáng)化學(xué)習(xí)的多層脈沖神經(jīng)網(wǎng)絡(luò)來探索將新任務(wù)訓(xùn)練周期與類睡眠自主活動周期交錯,是否可以避免災(zāi)難性遺忘。值得注意的是,該研究表明,可以通過周期性地中斷新任務(wù)中的強(qiáng)化學(xué)習(xí)(類似睡眠階段的新任務(wù))來預(yù)防災(zāi)難性遺忘。
捷克科學(xué)院計算機(jī)科學(xué)研究所的計算神經(jīng)科學(xué)家 Pavel Sanda 表示“有趣的是,我們沒有明確地存儲與早期記憶相關(guān)的數(shù)據(jù),以便在睡眠期間可以人為地重放它們,以防止遺忘。”
科學(xué)家們發(fā)現(xiàn),他們的策略有助于防止災(zāi)難性的遺忘。在經(jīng)歷了類似睡眠的階段后,脈沖神經(jīng)網(wǎng)絡(luò)能夠執(zhí)行這兩項任務(wù)。他們認(rèn)為,此項策略有助于保存與新舊任務(wù)相關(guān)的突觸模式。
“我們的工作展現(xiàn)了開發(fā)受生物學(xué)啟發(fā)的解決方案的實用性”Delanois 說道。
研究人員指出,他們的發(fā)現(xiàn)不僅限于脈沖神經(jīng)網(wǎng)絡(luò)。Sanda 表示,即將開展的工作表明,類似睡眠的階段可以幫助“克服標(biāo)準(zhǔn)人工神經(jīng)網(wǎng)絡(luò)中的災(zāi)難性遺忘”。
該研究于 11 月 18 日發(fā)表在《 PLOS Computational Biology 》雜志上。
參考鏈接:https://spectrum.ieee.org/catastrophic-forgetting-deep-learning
本文來自微信公眾號“CSDN”(ID:CSDNnews),36氪經(jīng)授權(quán)發(fā)布。
