我們真的永遠也理解不了人工智能嗎?
美國科學雜志nautil.us《鸚鵡螺》作家Aaron M. Bornstein發表了針對人工智能時代下神經網絡模型的深度報道。從語音識別到語言翻譯,從下圍棋的機器人到自動駕駛汽車,各行各業都在該人工智能的驅動下出現了新的突破。雖然現代神經網絡的表現令人激動,但也面臨一個棘手的問題:沒人理解它們的運行機制,這也就意味著,沒人能預測它們何時可能失靈。正因為如此,許多人遲疑不前、不敢對神秘莫測的神經網絡下注。

在神經網絡中,數據從一層傳遞到另一層,每一步都經歷一些簡單的轉變。在輸入層和輸出層之間還隱藏著若干層,以及眾多節點組和連接。其中往往找不出可被人類解讀的規律,與輸入或輸出也沒有明顯的聯系。“深度”網絡便是隱藏層數量較多的神經網絡
以下為文章全文:
作為IBM的一名研究科學家,迪米特里·馬里奧托夫其實不太說得上來自己究竟打造了什么。他的部分工作內容是打造機器學習系統、解決IBM公司客戶面臨的棘手問題。例如,他曾為一家大型保險公司編寫了一套程序。這項任務極具挑戰性,要用到一套十分復雜的算法。在向客戶解釋項目結果時,馬里奧托夫更是大傷腦筋。“我們沒辦法向他們解釋這套模型,因為他們沒受過機器學習方面的培訓。”
其實,就算這些客戶都是機器學習專家,可能也于事無補。因為馬里奧托夫打造的模型為人工神經網絡,要從特定類型的數據中尋找規律。在上文提到的例子中,這些數據就是保險公司的客戶記錄。此類網絡投入實際應用已有半個世紀之久,但近年來又有愈演愈烈之勢。從語音識別到語言翻譯,從下圍棋的機器人到自動駕駛汽車,各行各業都在該技術的驅動下出現了新的突破。
雖然現代神經網絡的表現令人激動,但也面臨一個棘手的問題:沒人理解它們的運行機制,這也就意味著,沒人能預測它們何時可能失靈。
以機器學習專家里奇·卡魯阿納和同事們前幾年報告的一起事件為例:匹茲堡大學醫學中心的一支研究團隊曾利用機器學習技術預測肺炎患者是否會出現嚴重并發癥。他們希望將并發癥風險較低的患者轉移到門診進行治療,好騰出更多床位和人手。該團隊試了幾種不同的方法,包括各種各樣的神經網絡,以及由軟件生成的決策樹,后者可總結出清晰易懂、能被人類理解的規則。

在現代機器學習算法中,可解釋性與精確度難以兩全其美。深度學習精確度最高,同時可解釋性最低
神經網絡的正確率比其它方法都要高。但當研究人員和醫生們分析決策樹提出的規則時,卻發現了一些令人不安的結果:按照其中一條規則,醫生應當讓已患有哮喘的肺炎病人出院,而醫生們都知道,哮喘患者極易出現并發癥。
這套模型完全遵從了指令:
從數據中找出規律。它之所以給出了如此差勁的建議,其實是由數據中的一個巧合導致的。按照醫院政策,身患哮喘的肺炎患者需接受強化護理。而這項政策效果極佳,哮喘患者幾乎從不會產生嚴重并發癥。由于這些額外護理改變了該醫院的患者記錄,算法預測的結果也就截然不同了。
這項研究充分體現了算法“可解釋性”的價值所在。卡魯阿納解釋道:“如果這套以規則為基礎的系統學到了‘哮喘會降低并發癥風險’這一規則,神經網絡自然也會學到這一點。”但人類讀不懂神經網絡,因此很難預知其結果。馬里奧托夫指出,若不是有一套可解釋的模型,“這套系統可能真的會害死人。”
正因為如此,許多人遲疑不前、不敢對神秘莫測的神經網絡下注。馬里奧托夫為客戶提供了兩套模型:一套是神經網絡模型,雖然精確,但難以理解;另一套則是以規則為基礎的模型,能夠用大白話向客戶解釋運作原理。盡管保險公司對精確度要求極高,每個百分點都十分重要,但客戶仍選擇了精確度稍遜的第二套模型。“他們覺得第二套模型更容易理解,”馬里奧托夫表示,“他們非常看重直觀性。”
隨著神秘難解的神經網絡影響力與日俱增,就連政府都開始對其表示關注。歐盟兩年前提出,應給予公民“要求解釋”的權利,算法決策需公開透明。但這項立法或許難以實施,因為立法者并未闡明“透明”的含義。也不清楚這一省略是由于立法者忽略了這一問題、還是覺得其太過復雜導致。
事實上,有些人認為這個詞根本無法定義。目前我們雖然知道神經網絡在做什么(畢竟它們歸根到底只是電腦程序),但我們對“怎么做、為何做”幾乎一無所知。神經網絡由成百上千萬的獨立單位、即神經元構成。每個神經元都可將大量數字輸入轉化為單個數字輸出,再傳遞給另一個、或多個神經元。就像在人腦中一樣,這些神經元也分成若干“層”。一組細胞接收下一層細胞的輸入,再將輸出結果傳遞給上一層。

神經網絡可通過輸入大量數據進行訓練,同時不斷調整各層之間的聯系,直到該網絡計算后輸出的結果盡可能接近已知結果(通常分為若干類別)。近年來該領域之所以發展迅猛,還要歸功于幾項可快速訓練深度網絡的新技術。在深度網絡中,初始輸入和最終輸出之間相隔多層。有一套叫AlexNet的著名深度網絡,可對照片進行歸類,根據照片的細微差別將其劃入不同類別。該網絡含有超過6000萬個“權重”,根據不同權重,神經元會對每項輸入給予不同程度的關注。隸屬于康奈爾大學和AI初創公司Geometric Intelligence的計算機科學家杰森·尤辛斯基指出:“要想理解這個神經網絡,你就要對這6000萬個權重都有一定的了解。”
而就算能夠實現這種可解讀性,也未必是件好事。對可解讀性的要求相當于制約了系統的能力,使模型無法僅關注輸入輸出數據、提供“純粹”的解決方案,從而有降低精確度之嫌。美國國防部高級研究計劃局項目主管戴維·甘寧曾在一次會議上對此進行了總結。在他展示的圖表中,深度神經網絡是現代機器學習方法中最難以理解的一種,而以規則為基礎、重視可解釋性勝過效率的決策樹則是最容易理解的一種。
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













