IBM研制出新型人工智能芯片
在12月初舉辦的NeurIPS會議上,IBM展示了一款新型人工智能芯片。
IBM的研究人員聲稱,他們已開發(fā)出一個更加高效的模型用于處理神經(jīng)網(wǎng)絡(luò),該模型只需使用8位浮點精度進(jìn)行訓(xùn)練,推理(inferencing)時更是僅需4位浮點精度。該研究的成果已于2018年12月初在國際電子元件會議(International Electron Devices Meeting,IEDM)和神經(jīng)信息處理系統(tǒng)大會(Conference on NeuralInformation Processing Systems,NeurIPS)上發(fā)布。
簡而言之,IBM展示了專用于減少精度處理單元的定制硬件,以及能夠利用該硬件進(jìn)行深度神經(jīng)網(wǎng)絡(luò)(DNN)訓(xùn)練和推理的新算法。其主要目標(biāo)在于提高硬件的能效,使其可以應(yīng)用于范圍更廣泛的人工智能解決方案。
下一代人工智能應(yīng)用程序需要更快的響應(yīng)時間、更大的人工智能工作負(fù)載以及來自眾多數(shù)據(jù)流的多模式數(shù)據(jù)。為了釋放人工智能的全部潛能,我們重新設(shè)計了將人工智能考慮在內(nèi)的硬件:從加速器到用于人工智能工作負(fù)載的特定用途硬件(例如我們的新芯片),以及最終用于人工智能的量子計算技術(shù)。使用新的硬件解決方案擴(kuò)展人工智能是IBM研究院(IBM Research)更廣泛努力的一部分,以期從范圍狹窄的人工智能(通常用于處理具體的、界限清楚的任務(wù))轉(zhuǎn)向范圍廣泛的人工智能(跨越各個學(xué)科,可幫助人類解決最迫切的問題)。
具體而言,IBM研究院提出了可提供8位浮點(FP8)精度用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的硬件。8位浮點精度是16位浮點精度(FP16)的一半,而16位浮點精度自2015年以來一直是深度神經(jīng)網(wǎng)絡(luò)工作的事實標(biāo)準(zhǔn)。(提議的硬件將依靠FP16來累積點積,而不是現(xiàn)在使用的FP32。)借助于稍后介紹的新算法技術(shù),IBM的研究人員表示,他們可以跨各種深度學(xué)習(xí)模型保持精確度。事實上,他們記錄在案了使用FP8精度基于圖像、語音和文本數(shù)據(jù)集對深度神經(jīng)網(wǎng)絡(luò)所進(jìn)行的訓(xùn)練,并實現(xiàn)了與基于FP32的訓(xùn)練相當(dāng)?shù)哪P途_度。
降低精度的模型基于三項軟件創(chuàng)新:一種新的FP8格式,讓用于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的矩陣乘法和卷積計算可在不損失精確度的情況下工作;一種“基于組塊的計算”技術(shù),使得只需使用FP8乘法和FP16加法即可處理神經(jīng)網(wǎng)絡(luò)成為現(xiàn)實;并且在加權(quán)更新過程中使用浮點隨機(jī)舍入,允許以16位浮點精度(而不是32位浮點精度)計算這些更新。
IBM展示的硬件是一款基于“新式數(shù)據(jù)流核心”的14納米處理器。該處理器由降低精度的數(shù)據(jù)流引擎、16位浮點精度組塊加法引擎和核心上內(nèi)存及內(nèi)存訪問引擎組成。研究人員聲稱,與現(xiàn)在的平臺相比,這種設(shè)計有可能使訓(xùn)練速度提高2到4倍。其中部分改進(jìn)是用于訓(xùn)練模型的位寬減少了2倍的結(jié)果,但其余改進(jìn)則是因為用于利用降低的精度的軟件技術(shù)。
也許更重要的是,IBM研究院表示,由于其FP8/FP16模型相較標(biāo)準(zhǔn)FP16/FP32模型而言所需的內(nèi)存帶寬和存儲空間更少,并且因為其硬件是為處理這些神經(jīng)網(wǎng)絡(luò)而定制的,能效可提高2-4倍以上。研究人員表示,這將使深度神經(jīng)網(wǎng)絡(luò)模型能夠在一些邊緣設(shè)備上進(jìn)行訓(xùn)練,而不僅僅是在數(shù)據(jù)中心服務(wù)器上進(jìn)行訓(xùn)練。
研究人員還發(fā)表了一篇關(guān)于在多個深度學(xué)習(xí)應(yīng)用程序中使用4位浮點精度推理,而同樣不損失精確度的論文(目前,大部分推理基于使用8位浮點精度或更多位浮點精度的計算)。此處的意義在于,位寬的減小將再次提高吞吐量和能效。對降低精度的需求也使得基于在訓(xùn)練期間優(yōu)化的位精度構(gòu)建用于訓(xùn)練和推理的統(tǒng)一架構(gòu)更加自然。根據(jù)研究人員的說法,由于減少了專用于計算的處理器面積并擁有在內(nèi)存中保留模型和激活數(shù)據(jù)的能力,此類硬件可以帶來推理性能的超線性提升。
相關(guān)研究領(lǐng)域需要與將這種降低精度的模型應(yīng)用于模擬芯片相關(guān),模擬芯片天生不如數(shù)字芯片精確,但能效卻高得多。IBM的研究人員開發(fā)了一種使用相變存儲器(PCM)的8位浮點精度模擬加速器,它可以充當(dāng)用于處理神經(jīng)網(wǎng)絡(luò)的計算基板和存儲介質(zhì)。根據(jù)2018年早些時候發(fā)布的工作成果,IBM研究院已經(jīng)實施了該技術(shù)的創(chuàng)新加成,稱為預(yù)測PCM(Projected PCM,Proj-PCM),它可以減少PCM硬件的一些令人煩惱的不精確性。研究團(tuán)隊認(rèn)為,該設(shè)計可為物聯(lián)網(wǎng)(IoT)和邊緣設(shè)備等功率受限環(huán)境中的人工智能訓(xùn)練和推理提供高性能水平。
盡管所有這些仍處于研究階段,但I(xiàn)BM顯然對構(gòu)建自己的人工智能芯片和加速器并將其交付到客戶手中感興趣。他們計劃如何將該技術(shù)商業(yè)化仍然有待觀察。無論如何,如果降低精度的訓(xùn)練和推理流行起來,IBM將面臨很多競爭。這些競爭不僅僅來自將相應(yīng)調(diào)整自己的處理器平臺的英特爾和英偉達(dá)等行業(yè)巨頭,它們還來自似乎每天都在涌現(xiàn)的人工智能芯片初創(chuàng)公司。在一個如此飛速變化的環(huán)境中,成功將青睞于最靈活變通的參與者。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月30日立即申請試用>> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時免費(fèi)】物理場仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國機(jī)器人產(chǎn)業(yè)大會
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國機(jī)器人行業(yè)年度評選
推薦專題
-
2 華為,重大突破!
- 1 人形機(jī)器人“第一股”來了!宇樹科技即將上會
- 2 全球股市陷AI獨(dú)大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉中國機(jī)器人
- 7 Figure AI 交付突破350臺,陪跑特斯拉會迎來iPhone 時刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報告
- 9 “國產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗
- 10 特斯拉宣布監(jiān)督版FSD登陸中國?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













