IBM取得記憶體計算突破削減人工智慧訓練成本

IBM Research稱，已經開發出了一種記憶體計算新方法，可以為微軟和穀歌尋求的高性能和機器學習應用的硬體加速器提供答案。

在今天Nature Electronics期刊上發表的一篇論文中，

IBM研究人員描述了這種新的“混合精度記憶體計算”方法。

IBM關注傳統計算體系結構的不同看法，在這種體系結構中，軟體需要在單獨的CPU和RAM單元之間進行資料傳輸。

據IBM稱，這種被稱為“馮諾依曼”的體系結構設計，為資料分析和機器學習應用製造了一個瓶頸，這些應用需要在處理單元和記憶體單元之間進行更大的資料傳輸。傳輸資料也是一個耗能的過程。

應對這一挑戰， IBM給出的一種方法是類比相變記憶體（PCM）晶片，該晶片目前還處於原型階段， 500萬個納米級PCM器件組成500×2000交叉陣列。

PCM的一個關鍵優勢是可以處理大多數密集型資料處理，而無需將資料傳輸到CPU或GPU，這樣以更低的能量開銷實現更快速的處理。

IBM的PCM單元將作為CPU加速器，就像微軟用於加速Bing和加強機器學習的FPGA晶片一樣。

據IBM稱，研究表明在某些情況下，其PCM晶片能夠以類比的方式進行操作，執行計算任務，並提供與4位元FPGA記憶體晶片相當的準確度，但能耗降低了80倍。

類比PCM硬體並不適合高精度計算。所幸的是，數字型CPU和GPU是適合的， IBM認為混合架構可以實現更高性能、更高效率和更高精度的平衡。

這種設計將大部分處理留給記憶體，然後將較輕的負載交給CPU進行一系列的精度修正。

根據IBM蘇黎世實驗室的電氣工程師、也是該論文的主要作者Manuel Le Gallo稱，這種設計有助於雲中的認知計算，有助於釋放對高性能電腦的訪問。

Le Gallo表示：“憑藉我們現在的精確度，我們可以將能耗降低到是使用高精度GPU和CPU的1/6。

”

“所以我們的想法是，為了應對模擬計算中的不精確性，我們將其與標準處理器結合起來。我們要做的是將大量計算任務轉移到PCM中，但同時得到最終的結果是精確的。 ”

這種技術更適合於如數位圖像識別等應用，其中誤解少數圖元並不會妨礙整體識別，此外還有一些醫療應用。

“你可以用低精度完成大量計算——以類比的方式， PCM會非常節能——然後使用傳統處理器來提高精度。 ”

對於只有1百萬位元組大小的IBM原型記憶體晶片，現在還處於初期階段。為了適用于現代資料中心的規模化應用，它需要達到千百萬位元組的記憶體量級，分佈在數萬億個PCM中。

儘管如此， IBM認為可以通過構建更大規模的PCM設備或使其中PCM並行運行來實現這一目標。

IBM取得記憶體計算突破 削減人工智慧訓練成本