華文網

學術界關於HBase應用場景(物聯網/車聯網/交通/電力等)研究大全

引言

HBase在互聯網領域有廣泛的應用,比如:互聯網的消息系統的存儲、訂單的存儲、搜索原材料的存儲、使用者畫像資料的存儲等。得益于HBase海量的存儲量及超高併發寫入讀取量。

HBase在09年就開始在工業界大範圍使用,在學術界,也有非常多的高校、機構在研究HBase應用於不同的行業,本文主要梳理下這些資料(主要是中文資料,有一些是碩士論文期刊),這些很多都在工業界使用了。大家也可以感覺下,HBase應用的方面還是非常多的。大家也可以看下是否的場景是否對應起來。 由於涉及到版權,我提供連結,不提供資源下載,請大家見諒。

HBase最主要的特性

HBase基於HDFS,可以提供廉價的解決方案。在阿裡雲ApsaraDB for HBase會發佈基於D1、I2的物理機方案,存儲成本為0.1元每GB每月左右,且可以線上動態添加節點,增加容量。 無需一次性投入全年的量。

HBase容量可以無限擴容:在100T的資料量上毫無壓力,在1P的資料量上也類似。

HBase提供超高的併發量:主要得益於系統的除了Master之外的所有節點都直接跟用戶端通信,

且系統自動分區。有的系統會有一個路由中心,此會極大的限制併發量及流量

跟Spark、HadoopMR等分析系統結合 關於 阿裡雲HBase產品的優勢見:阿裡雲HBase優勢

行業:

物聯網行業:

基於HBase的大規模無線傳感網路資料存儲系統 : 無線傳感網路(WSN)存在分佈的跨區域性,隨著無線傳感網路的擴張,感測器數目增多,將產生大規模的傳感資料.針對存儲大規模無線傳感網路資料的問題,提出了一個兩層分散式存儲架構,使用分散式資料庫HBase存儲跨區域的無線傳感網路資料和全域資料存儲管理目錄,實現一個近即時的存儲系統.實驗結果證明,該系統有良好的擴展性、存儲和查詢效率.

車聯網:

基於HBase的車聯網傳感資料管理系統設計 :關係型數據庫由於面向行存儲以及無法擴展等原因,已很難滿足大規模車聯網傳感資料的存儲與查詢要求.針對該問題,設計了一個基於非關係型數據庫HBase存儲的車聯網傳感資料管理系統.該系統採用Hadoop與HBase搭建分散式實驗平臺,採用C#語言開發Web網頁端.通過與傳統關係型數據庫SQL Server的存儲與查詢效率進行對比分析,表明HBase在處理大規模車聯網傳感資料方面具有明顯優勢.

基於HBase的交通資料區域查詢方法 :隨著智慧交通的發展,交通資料呈現出指數性增長.為了提升時空區域查詢性能,論文提出了一種基於HBase的交通資料區域查詢方法HRQ.該方法利用交通資料的三維時空特性,採用Geohash演算法將交通資料的經緯度資訊轉為Geohash編碼,然後與時間組合作為HBase行鍵,並設計了相應的查詢演算法.實驗結果表明,與直接組合經緯度和時間作為行鍵的方法相比,在基於時間範圍的區域查詢上HRQ方法的性能要高30%以上,在基於區域範圍的區域查詢上HRQ的性能優勢隨著查詢區域的增大而增加.

交通

基於HBase的交通流資料即時存儲系統 :交通流資料具有多來源、高速率、體量大等特徵,傳統資料存儲方法和系統暴露出擴展性弱和存儲即時性低等問題.針對上述問題,設計並實現了一套基於HBase交通流資料即時存儲系統.該系統採用分散式存儲架構,通過前端的預處理操作對資料進行規範化整理,利用多源緩衝區結構對不同類型的流資料進行佇列劃分,並結合一致性雜湊演算法、多執行緒技術、行鍵優化設計等策略將資料並行存儲到HBase集群伺服器中.實驗結果表明:該系統與基於Oracle的即時存儲系統相比,其存儲性能提升了3~5倍;與原生的HBase方法相比,其存儲性能提升了2~3倍,並且具有良好的擴展性能.

電力

HBase 在智慧電網異構資料同步中的應用 :未來的智慧電網在運行中將會產生海量的多態、異構資料,對這些資料的可靠獲取、即時分析、同步及處理會給電網資訊系統帶來前所未有的壓力。因此,把電網大資料移轉到雲端—資料中心,來實現異構資料的精准、即時同步則顯得尤為必要。以解決未來智慧電網大資料處理問題為出發點,通過對電網資料中心相關功能需求進行細緻分析,對比傳統的關係型數據庫建模基礎,提出了基於Hbase架構的智慧電網資料中心的解決方案。最後通過對比 MySQL 性能進行類比測試,得出所提出的設計方案能夠很好地適用于未來智慧電網資料中心的構建以及異構資料的同步,達到電網大資料的即時共用、監測及準確分析、處理的目的,在未來智慧電網資訊管理系統中具有廣闊的應用前景。

金融

基於HBase的金融時序資料存儲系統 : 設計並實現了1個基於HBase的金融時序資料的存儲系統。設計了基於金融時序資料的HBase預分區策略,可解決HBase存儲熱點的問題;採用了行鍵優化策略和基於時序資料的表設計策略,可解決資料存儲分散的問題;使用了提供非同步處理機制的事件驅動的Netty框架所編寫的中介軟體接收採集器發送的請求,可解決高併發事務的處理問題。實驗結果表明,與HBase原生方法相比,該系統的性能在處理高併發事務時更好。

航空

基於HBase的民用航空發動機大資料管理系統 : 為克服傳統關係型數據庫存儲管理海量航空發動機狀態監控資料的不足,本研究提出了基於HBase的民用航空發動機大資料管理系統.首先分析了該系統的功能需求,給出了系統整體架構與模組設計,並對關鍵技術進行了闡述.最後設計試驗對比HBase與Oracle的搜索效率.試驗結果表明檢索結果集較大時HBase的搜索效率明顯高於Oracle.本研究中提出的航空發動機大資料管理系統為發動機海量資料的存儲管理提供了一種解決方案.

小檔存儲(圖片視頻等)

一種基於HBase的海量圖片存儲技術 針對海量圖片存儲,已有若干個基於Hadoop的方案被設計出來.這些方案在系統層小檔合併、全域名字空間以及通用性方面存在不足.本文基於HBase提出了一種海量圖片存儲技術,成功解決了上述問題.本文將介紹基於HBase海量圖片存儲技術方案,分析其原理及優勢,該方案在城市交通監控中得到應用驗證.

基於 HBase 的小檔高效存儲方法 :基於 Hadoop 平臺的相關系統得到了廣泛應用。Hadoop 分散式檔案系統(Hadoop distributed file system, HDFS)通過分散式的工作方式,負責處理海量檔資料。對 HDFS 而言,海量資料中的小檔存儲問題制約著系統高效工作的能力。針對海量資料中小檔讀寫效率低的情況,提出一種基於 HBase(Hadoop database)的海量小檔高效存儲方法,利用 HBase 的存儲優勢,將小檔直接存儲於 HBase,從而有效減少中繼資料節點伺服器(Name-Node)的負載,並對上層應用系統提供透明的訪問介面。實驗結果表明,該方法可以實現海量小檔的高效存儲,提高 HDFS 環境下小檔的讀寫效率。

基於HBase的交通流資料即時存儲系統 :交通流資料具有多來源、高速率、體量大等特徵,傳統資料存儲方法和系統暴露出擴展性弱和存儲即時性低等問題.針對上述問題,設計並實現了一套基於HBase交通流資料即時存儲系統.該系統採用分散式存儲架構,通過前端的預處理操作對資料進行規範化整理,利用多源緩衝區結構對不同類型的流資料進行佇列劃分,並結合一致性雜湊演算法、多執行緒技術、行鍵優化設計等策略將資料並行存儲到HBase集群伺服器中.實驗結果表明:該系統與基於Oracle的即時存儲系統相比,其存儲性能提升了3~5倍;與原生的HBase方法相比,其存儲性能提升了2~3倍,並且具有良好的擴展性能.

電力

HBase 在智慧電網異構資料同步中的應用 :未來的智慧電網在運行中將會產生海量的多態、異構資料,對這些資料的可靠獲取、即時分析、同步及處理會給電網資訊系統帶來前所未有的壓力。因此,把電網大資料移轉到雲端—資料中心,來實現異構資料的精准、即時同步則顯得尤為必要。以解決未來智慧電網大資料處理問題為出發點,通過對電網資料中心相關功能需求進行細緻分析,對比傳統的關係型數據庫建模基礎,提出了基於Hbase架構的智慧電網資料中心的解決方案。最後通過對比 MySQL 性能進行類比測試,得出所提出的設計方案能夠很好地適用于未來智慧電網資料中心的構建以及異構資料的同步,達到電網大資料的即時共用、監測及準確分析、處理的目的,在未來智慧電網資訊管理系統中具有廣闊的應用前景。

金融

基於HBase的金融時序資料存儲系統 : 設計並實現了1個基於HBase的金融時序資料的存儲系統。設計了基於金融時序資料的HBase預分區策略,可解決HBase存儲熱點的問題;採用了行鍵優化策略和基於時序資料的表設計策略,可解決資料存儲分散的問題;使用了提供非同步處理機制的事件驅動的Netty框架所編寫的中介軟體接收採集器發送的請求,可解決高併發事務的處理問題。實驗結果表明,與HBase原生方法相比,該系統的性能在處理高併發事務時更好。

航空

基於HBase的民用航空發動機大資料管理系統 : 為克服傳統關係型數據庫存儲管理海量航空發動機狀態監控資料的不足,本研究提出了基於HBase的民用航空發動機大資料管理系統.首先分析了該系統的功能需求,給出了系統整體架構與模組設計,並對關鍵技術進行了闡述.最後設計試驗對比HBase與Oracle的搜索效率.試驗結果表明檢索結果集較大時HBase的搜索效率明顯高於Oracle.本研究中提出的航空發動機大資料管理系統為發動機海量資料的存儲管理提供了一種解決方案.

小檔存儲(圖片視頻等)

一種基於HBase的海量圖片存儲技術 針對海量圖片存儲,已有若干個基於Hadoop的方案被設計出來.這些方案在系統層小檔合併、全域名字空間以及通用性方面存在不足.本文基於HBase提出了一種海量圖片存儲技術,成功解決了上述問題.本文將介紹基於HBase海量圖片存儲技術方案,分析其原理及優勢,該方案在城市交通監控中得到應用驗證.

基於 HBase 的小檔高效存儲方法 :基於 Hadoop 平臺的相關系統得到了廣泛應用。Hadoop 分散式檔案系統(Hadoop distributed file system, HDFS)通過分散式的工作方式,負責處理海量檔資料。對 HDFS 而言,海量資料中的小檔存儲問題制約著系統高效工作的能力。針對海量資料中小檔讀寫效率低的情況,提出一種基於 HBase(Hadoop database)的海量小檔高效存儲方法,利用 HBase 的存儲優勢,將小檔直接存儲於 HBase,從而有效減少中繼資料節點伺服器(Name-Node)的負載,並對上層應用系統提供透明的訪問介面。實驗結果表明,該方法可以實現海量小檔的高效存儲,提高 HDFS 環境下小檔的讀寫效率。