您的位置:首頁>科技>正文

「智能家居」不一樣的深度學習體驗

家裡的燈泡壞了,

到網上商城買了一個,

然後幾乎每天都會收到

該商城推送的關於燈的資訊;

用手機APP訂餐後,

第二天再次登陸時,

總是向你推送類似的餐飲資訊……

相信有這樣經歷的人不在少數。

其實, 這只是深度學習

最終應用的一個體現,

本文想跟您聊聊深度學習背後的故事。

面向智慧家居的深度學習

近期, 戴爾公司與全球大型家電的第一品牌, 就智慧家居專案中的深度學習達成合作。

深度學習(Deep Learning)是機器學習拉出的分支, 它試圖使用包含複雜結構或由多重非線性變換構成的多個處理層對資料進行高層抽象的演算法。 深度學習是機器學習中一種基於對資料進行表徵學習的方法。 表徵學習的目標是尋求更好的表示方法並創建更好的模型來從大規模未標記資料中學習這些表示方法。

深度學習通過大量的資料分析使用者需求,

並匹配其需要的資訊, 當前很多購物平臺與推薦類APP也是如此, 另外像自動駕駛、照片定位、即時語音翻譯、自動回復電子郵件、臉部識別等都是深度學習的研究範疇。

戴爾助力的這一智慧家居專案, 其主要目的是改善人工智慧深度學習, 研發無集中高性能計算資源的現狀, 建立統一的端到端的人工智慧深度學習高性能計算平臺, 同時用於該集團內部的產品設計、智慧模擬、科普資料庫、集中渲染等業務需求基礎架構平臺, 未來作為該集團內外部用戶共用高性能計算資源的平臺。

為構建此深度學習平臺, Dell 公司提供了靈活的HPC技術框架、產品、服務和專業技能來解決特定用戶在任意擴展性上的挑戰。 平行計算是目前業界較為先進的計算體系,

是融合了計算、存儲、網路和軟體於一體的系統, 是一個成熟的產品和技術。

戴爾擁有非常完善的HPC解決方案生態體系架構:

1.客戶化的解決方案:

自信地選擇何時、何處、如何將新的HPC環境添加或替換現有的HPC環境;

2.預先定制的解決方案:

無需很多專家及支持即可在幾天或幾周內快速部署、高效、集成化的HPC基礎架構;

3.雲就緒的解決方案:

從裸設備部署到按需的雲部署, 戴爾能夠説明您應對任何規模的雲計算部署的挑戰;

4.完善的支援服務體系:

利用可靠靈活的戴爾服務説明您更簡便地部署和管理您的HPC集群;

5.強大的硬體支撐平臺:

PowerEdge Servers + Dell Storage + Dell Networking + Dell software + Dell Services.

深度學習方案的重要組成

智慧家居專案中深度學習方案拓撲架構圖

1.CPU+GPU集群工作模式

戴爾高性能運算解決方案利用CPU+GPU集群工作模式, 採用胖節點、瘦節點、GPU節點三種結合的方式來為使用者提供資料處理。

▶ 胖節點

採用戴爾專為最嚴苛的企業應用程式而設計, 具有行業領先的內部存儲和記憶體可擴展性, 可以優化應用程式性能的R930伺服器。

▶ GPU節點

採用C4130,在1U空間內配置4塊NVIDIA Tesla K80 GPU卡,提供雙精度浮點計算能力達12.8TFlops。

▶ 瘦節點

採用1U機架式伺服器R630,在1U外形規格中提供雙倍的機架密度,並降低電力、冷卻和空間成本,提供一種24個1.8英寸全固態硬碟配置,以顯著提高性能(最多提高240%),可選擇各種RAID選項,包括可實現更高性能的雙PERC選項 ,支援最多4個超快NVMe Express Flash PCIe設備。

2.高速InfiniBand網路互連

在大規模平行計算和機群等高性能計算系統中,處理器之間或計算節點之間的快速互聯網路的重要程度並不亞於處理器本身,在早期的大型計算系統中,處理器之間的通信一直被所採用的互聯網路(通常是乙太網),延時大、頻寬不足等因素所牽制。高性能計算系統的互聯方式有很多種,最初的機群系統是基於LAN技術的,也就是以最普通的乙太網(Ethernet)作為資料交換媒介。其優勢在於可以方便地增加計算節點到集群系統中,但是其缺點也很多,傳送速率較慢,複雜的協議造成非常高的延時,並且限制了擴展性。

Infiniband是一種非常成熟的技術,其技術規格在2001年6月完成。從2002年開始,很多製造商開始提供基於Infiniband標準的產品。Infiniband可以用於連接多種系統部件。Infiniband架構由可程式設計交換機連接通道適配器(Channel Adapters,CA)組成。CA能夠被安置在伺服器中(稱為主通道適配器,Host Channel Adapers,HCA),或者是轉換到存放裝置和乙太網的I/O轉換器中(稱為目標通道適配器,Target Channel Adapter,TCA)。基於Infiniband的遠端記憶體存取(RDMA)功能,消息可以從一個HCA/TCA傳遞到另一個HCA/TCA,也就是說,允許從一個HCA/TCA讀/寫另一個HCA/TCA的記憶體。另外,交換機可以用不同級別的網路來堆疊。

本次項目中計算節點間採用高速InfiniBand網路互連,速度可以達到雙向56Gb/s。

3.並行可擴展檔案系統

根據上面的圖表, 2016年11月的統計數字顯示75%的高性能計算存儲使用了Lustre檔案系統,GPFS僅為19%。

Lustre屬於一種分散式檔案系統,同時也是並行檔案系統。它的優勢包括提供單一命名空間;可增加節點數來擴展容量和性能,並支援線上擴展;支持多個用戶端併發讀/寫,通過分散式鎖機制保障資料一致性等。它存在的挑戰之處:架構規劃,設計,概念驗證,網路頻寬、應用設計、應用負載設計、OSS和LUN的負載均衡、故障切換等方面。讓我們看看,戴爾是如何快速有效地解決這些問題的。

本次項目中我們採用的也是並行可擴展檔案系統,基於 Intel Enterprise Edition for Lustre 軟體,Dell HPC Engineering 開發的最佳做法,在 Dell 硬體上提供最佳性能,設計借助動態儲存裝置擴展,每構建塊提供 10.5 GB/s 讀取速

率和 6 GB/s 寫入速率 ,使用 Intel Hadoop Adapter for Lustre (HAL) 的大資料工作負載的解決方案設計,與利用可選 NFS/CIFS 閘道的其它檔案系統共用資料。

口說無憑,那麼咱們看幾個測試結果:

從圖中可以看到Boulder配置的IOzone/IOR性能測試結果中,單一用戶端讀寫性能分別達到0.75G/s和0.63GB/s,24用戶端時的最大性能,讀寫分別達到10.04GB/s和5.68GB/s,完全滿足客戶方案要求的10GB/S的性能要求。

另外在本專案中還配置了Hadoop模組,在Hadoop應用中採用Lustre的優勢有:

★ 無需更改軟體即可提升應用性能

★ 更低的成本,更簡便的管理

★ 更高效的存儲系統

★ 在載入資料或分析結果時沒有額外的資料傳輸開銷

★ 無需區分哪些存儲是用於HPC(Lustre),哪些是用於資料分析(HDFS)

通過這些優勢可以平滑實現Hadoop的分析運算,滿足客戶業務需求

4.領先的BCM集群任務管理

本次專案中採用業界領先的Bright Cluster Manager集群管理軟體。BCM是Intel Cluster Ready的官方認證高性能集群管理軟,採用高性能、高可靠性設計,具有豐富的圖形介面,易於管理使用,包含廣泛的HPC應用套裝軟體,提供HPC集群、Hadoop集群等集群管理功能。

利用戴爾伺服器管理軟體,對伺服器、存儲、網路等產品進行發現、監控、管理、部署以及安裝補丁程式,説明管理員通過單一的管理介面清晰地瞭解伺服器的狀態並進行管理,時時收集磁片IO、輸送量、容量、CPU、記憶體使用率、IO延時、佇列深度、讀寫比例等指標,為用戶提供統一的運維、監控。

5.優質的支撐服務

成功的項目背後離不開一個強大的售後服務體系,為此我們也為客戶提供了優質的服務來支撐本次專案,戴爾最高級別的白金服務,提供24*7全天候售後電話技術支援,專屬的800售後服務熱線,享受人力和備件派遣的最優先派遣,加速解決關鍵問題;配備原廠專屬大客戶經理對緊急報修進行資源協調和報修跟蹤,並且提供每季度不少於一次的上門巡檢服務,提供月度設備運行狀況檢查及性能建議;鑒於資料的安全性所有故障硬碟配置硬碟不返還服務。

那麼,戴爾給智慧家居客戶帶來什麼不一樣的深度學習體驗呢?

1、深度學習研發使用集群GPU+CPU方式進行,可以滿足日益增加的深度學習研發需求;集群後GPU資源可以實現靈活調度,提高利用率。

2、採用Dell/Intel認證的方案架構,方案先進,架構成熟,Dell能夠提供給用戶端到端的整體解決方案。

3、資深的銷售/售前技術支援團隊與完善的售後服務體系保證業務高忱無憂。

▶ GPU節點

採用C4130,在1U空間內配置4塊NVIDIA Tesla K80 GPU卡,提供雙精度浮點計算能力達12.8TFlops。

▶ 瘦節點

採用1U機架式伺服器R630,在1U外形規格中提供雙倍的機架密度,並降低電力、冷卻和空間成本,提供一種24個1.8英寸全固態硬碟配置,以顯著提高性能(最多提高240%),可選擇各種RAID選項,包括可實現更高性能的雙PERC選項 ,支援最多4個超快NVMe Express Flash PCIe設備。

2.高速InfiniBand網路互連

在大規模平行計算和機群等高性能計算系統中,處理器之間或計算節點之間的快速互聯網路的重要程度並不亞於處理器本身,在早期的大型計算系統中,處理器之間的通信一直被所採用的互聯網路(通常是乙太網),延時大、頻寬不足等因素所牽制。高性能計算系統的互聯方式有很多種,最初的機群系統是基於LAN技術的,也就是以最普通的乙太網(Ethernet)作為資料交換媒介。其優勢在於可以方便地增加計算節點到集群系統中,但是其缺點也很多,傳送速率較慢,複雜的協議造成非常高的延時,並且限制了擴展性。

Infiniband是一種非常成熟的技術,其技術規格在2001年6月完成。從2002年開始,很多製造商開始提供基於Infiniband標準的產品。Infiniband可以用於連接多種系統部件。Infiniband架構由可程式設計交換機連接通道適配器(Channel Adapters,CA)組成。CA能夠被安置在伺服器中(稱為主通道適配器,Host Channel Adapers,HCA),或者是轉換到存放裝置和乙太網的I/O轉換器中(稱為目標通道適配器,Target Channel Adapter,TCA)。基於Infiniband的遠端記憶體存取(RDMA)功能,消息可以從一個HCA/TCA傳遞到另一個HCA/TCA,也就是說,允許從一個HCA/TCA讀/寫另一個HCA/TCA的記憶體。另外,交換機可以用不同級別的網路來堆疊。

本次項目中計算節點間採用高速InfiniBand網路互連,速度可以達到雙向56Gb/s。

3.並行可擴展檔案系統

根據上面的圖表, 2016年11月的統計數字顯示75%的高性能計算存儲使用了Lustre檔案系統,GPFS僅為19%。

Lustre屬於一種分散式檔案系統,同時也是並行檔案系統。它的優勢包括提供單一命名空間;可增加節點數來擴展容量和性能,並支援線上擴展;支持多個用戶端併發讀/寫,通過分散式鎖機制保障資料一致性等。它存在的挑戰之處:架構規劃,設計,概念驗證,網路頻寬、應用設計、應用負載設計、OSS和LUN的負載均衡、故障切換等方面。讓我們看看,戴爾是如何快速有效地解決這些問題的。

本次項目中我們採用的也是並行可擴展檔案系統,基於 Intel Enterprise Edition for Lustre 軟體,Dell HPC Engineering 開發的最佳做法,在 Dell 硬體上提供最佳性能,設計借助動態儲存裝置擴展,每構建塊提供 10.5 GB/s 讀取速

率和 6 GB/s 寫入速率 ,使用 Intel Hadoop Adapter for Lustre (HAL) 的大資料工作負載的解決方案設計,與利用可選 NFS/CIFS 閘道的其它檔案系統共用資料。

口說無憑,那麼咱們看幾個測試結果:

從圖中可以看到Boulder配置的IOzone/IOR性能測試結果中,單一用戶端讀寫性能分別達到0.75G/s和0.63GB/s,24用戶端時的最大性能,讀寫分別達到10.04GB/s和5.68GB/s,完全滿足客戶方案要求的10GB/S的性能要求。

另外在本專案中還配置了Hadoop模組,在Hadoop應用中採用Lustre的優勢有:

★ 無需更改軟體即可提升應用性能

★ 更低的成本,更簡便的管理

★ 更高效的存儲系統

★ 在載入資料或分析結果時沒有額外的資料傳輸開銷

★ 無需區分哪些存儲是用於HPC(Lustre),哪些是用於資料分析(HDFS)

通過這些優勢可以平滑實現Hadoop的分析運算,滿足客戶業務需求

4.領先的BCM集群任務管理

本次專案中採用業界領先的Bright Cluster Manager集群管理軟體。BCM是Intel Cluster Ready的官方認證高性能集群管理軟,採用高性能、高可靠性設計,具有豐富的圖形介面,易於管理使用,包含廣泛的HPC應用套裝軟體,提供HPC集群、Hadoop集群等集群管理功能。

利用戴爾伺服器管理軟體,對伺服器、存儲、網路等產品進行發現、監控、管理、部署以及安裝補丁程式,説明管理員通過單一的管理介面清晰地瞭解伺服器的狀態並進行管理,時時收集磁片IO、輸送量、容量、CPU、記憶體使用率、IO延時、佇列深度、讀寫比例等指標,為用戶提供統一的運維、監控。

5.優質的支撐服務

成功的項目背後離不開一個強大的售後服務體系,為此我們也為客戶提供了優質的服務來支撐本次專案,戴爾最高級別的白金服務,提供24*7全天候售後電話技術支援,專屬的800售後服務熱線,享受人力和備件派遣的最優先派遣,加速解決關鍵問題;配備原廠專屬大客戶經理對緊急報修進行資源協調和報修跟蹤,並且提供每季度不少於一次的上門巡檢服務,提供月度設備運行狀況檢查及性能建議;鑒於資料的安全性所有故障硬碟配置硬碟不返還服務。

那麼,戴爾給智慧家居客戶帶來什麼不一樣的深度學習體驗呢?

1、深度學習研發使用集群GPU+CPU方式進行,可以滿足日益增加的深度學習研發需求;集群後GPU資源可以實現靈活調度,提高利用率。

2、採用Dell/Intel認證的方案架構,方案先進,架構成熟,Dell能夠提供給用戶端到端的整體解決方案。

3、資深的銷售/售前技術支援團隊與完善的售後服務體系保證業務高忱無憂。

Next Article
喜欢就按个赞吧!!!
点击关闭提示