您的位置:首頁>科技>正文

Zilliz星爵:離開甲骨文公司,做AI時代的資料庫系統

文/李論 億歐專欄作者

未來幾年, 全球資料量將呈指數級增長。 據IDC統計, 到2020年, 全球資料總量將達到44ZB, 中國資料量將達到8060EB, 占全球資料總量的18%。

資料, 已然對當下的商務、生活乃至方方面面都產生了深遠的影響。 可眾所周知, 各行各業資料生產的速度要遠遠大於資料消化的速度。 資料分析處理的不及時, 必然造成大量具有時效性資料的浪費, 日積月累, 這樣的不匹配性會越來越嚴重。

如何消除這樣的不匹配性?歸根結底, 我們需要一種能夠對更大規模資料做到更即時更迅捷的分析工具。

順勢而生的GPU資料庫

2015年, 已經在甲骨文公司工作了6年的星爵意識到, 傳統的資料庫系統需要革新了。 傳統CPU資料庫的發展主要面臨兩大瓶頸, 一是資料計算速度, 二是資料存取速度。 而負責算力的CPU, 目前停留在數十核的規模, 這已經接近它的物理極限了。 資料庫計算領域,

是時候該添加新鮮血液了。

2013年, 深度學習技術的崛起讓人們看到了GPU的力量。 在這之前, GPU的主要功能是圖片渲染, 通過類比現實場景生成接近於真實景象的圖片, 主要被應用於遊戲領域。 而深度學習技術, 使GPU“大規模平行計算”的能力得以展現, 人們對它的認知終於不再是遊戲機, GPU, 也可以成為像CPU一樣的伺服器。 而星爵, 更是堅定的認為, GPU處理大資料已經成為一種趨勢。 各種深度學習的軟體框架例如TensorFlow, 需要運行在計算設備上, 與CPU相比, GPU更能讓其高效的工作, 在性價比以及計算力上都有較大的優勢。

沒有猶豫, 星爵離開甲骨文, 回國創立了Zilliz, 他要做人工智慧時代的資料庫系統。

星爵認為, 在過去數十年間, 人工智慧因為CPU架構下計算能力的限制而裹足不前,

OLAP資料庫技術也因為同樣的原因而發展緩慢。 就像華岩資本合夥人黃志瑋所認為的, 我們需要一個基於眾核處理器硬體加速的、面向人工智慧的新一代OLAIP(On-Line Analytical and Intellegent Processing)資料庫系統, 而這正是Zilliz在研發的產品。

Zilliz使用眾核處理器上的成千上萬個處理核心進行超大規模並行資料處理, 實現資料庫操作的加速, 同時提供資料庫系統和人工智慧計算框架之間的直接資料通道。 Zilliz將人工智慧處理引擎融合進資料庫執行引擎, 提供集資料存儲、分析、管理、和人工智慧處理與一身的OLAIP資料庫系統。

星爵向億歐介紹, Zilliz基於GPU的資料庫系統可以比CPU資料庫的性能提高100倍, 可大範圍的應用于金融、電信、互聯網以及政府領域。

在商業模式上, Zilliz為各行業的頭部客戶和互聯網公司提供了不同的方案。 對於頭部客戶, Zilliz即可以為其提供私有部署, 同時還有基於一體機的解決方案;對於互聯網公司, 尤其是那些將資料部署在雲端的客戶, Zilliz可以為其提供SaaS的方案, 使用各大雲廠商提供的GPU, 在雲端為客戶提供服務, 從而使客戶無需採購GPU硬體設備便可以使用。

新技術的新“麻煩”

大多數人有這樣一個疑問——

即便GPU資料庫的使用性能和性價比, 與原有系統相比更有優勢, 但是要讓使用者將存儲在CPU伺服器上的資料快速遷移到GPU伺服器中, 可行性有多大?

這關乎到Zilliz的未來, 也是星爵自公司創立之初就在解決的問題。 星爵表示, Zilliz並不是要替代原有的CPU方案, 而是要在大規模資料的即時性分析方面開創一個新的藍海市場。

人工智慧時代下, 資料量將會呈指數型增長。 在這樣的情況下, 各行各業的業務想要得到更好的發展, 即時資料分析能力以及即時資料驅動運營能力將是其核心的競爭力, 因此, Zilliz產品的存在是有其合理性的。

Zilliz投資人雲啟資本執行董事陳昱表示, 在大資料時代, 企業需要一個更大、更快、更強的資料庫, 人工智慧技術的加入, 是一種對傳統資料庫的革新, 使資料庫產生了更高的效率, 這無疑是當下各公司最迫切的需求。

另外, 星爵希望將資料庫軟體做成一個標準件。 作為一個底層的資料庫軟體, 需要對外提供標準化的查詢語言介面, 理想狀態應當是使用者在接入新資料庫的時候, 其業務層面不發生改變。因此Zilliz通過產品化與標準化,為使用者提供標準SQL介面以及各種ETL工具,從而降低用戶在資料移轉過程中的成本,儘量做到“無感遷移”。對於使用者來說,相當於更換了一個資料庫的軟體和引擎,但是其業務層並不會受到影響。

星爵還向億歐透露,為了更加快速的在CPU處理器與GPU處理器之間進行資料交換,Zilliz與IBM合作生產了資料庫一體機,使用NvLink技術,能夠大大提升不同類型處理器晶片之間的資料傳輸速度。

資本認可,行業進入爆發期

目前世界範圍內做OLAP GPU資料庫加速的公司僅有4家:

星爵介紹,在這一領域,國外從2006年就已經開始有所研究,然而,當時的市場認知度不足,用戶對於GPU還停留在遊戲處理器的認知上,且高端GPU的市場存量較少,並沒有基於GPU部署資料庫系統的實力。另一方面,整個生態系統還處於早期的發展狀態,各種相關工具及配套軟體比較缺乏。基於以上兩點原因,國外公司在這一方面並沒有太多優勢。

到2016年,市場認知才有所好轉。從業人員開始意識到GPU也可以做與企業相關的工程(例如深度學習),同時,GPU伺服器已經成為常態,各種GPU的生態體系也逐漸完善,種種原因使得2016年成為GPU資料庫的元年,至此,資本市場逐漸認可這一領域,GPU資料庫進入爆發期。

然而爆發並不意味著競爭,靖亞資本創始人鄭靖偉向億歐介紹,資料庫這樣底層技術的門檻很高,國內少有人研究。產品的研發與驗證都需要一定時間,而對於一般的大型中型公司來說,更換資料庫系統需要進行很多的測試來評估流程,一旦被驗證,很難再次更換資料庫系統提供商。

而2018年,將是GPU資料庫在各行各業應用更為廣泛的一年。

文章版權屬北京億歐網盟科技有限公司所有。文章內容系作者個人觀點,不代表億歐對觀點贊同或支持。

其業務層面不發生改變。因此Zilliz通過產品化與標準化,為使用者提供標準SQL介面以及各種ETL工具,從而降低用戶在資料移轉過程中的成本,儘量做到“無感遷移”。對於使用者來說,相當於更換了一個資料庫的軟體和引擎,但是其業務層並不會受到影響。

星爵還向億歐透露,為了更加快速的在CPU處理器與GPU處理器之間進行資料交換,Zilliz與IBM合作生產了資料庫一體機,使用NvLink技術,能夠大大提升不同類型處理器晶片之間的資料傳輸速度。

資本認可,行業進入爆發期

目前世界範圍內做OLAP GPU資料庫加速的公司僅有4家:

星爵介紹,在這一領域,國外從2006年就已經開始有所研究,然而,當時的市場認知度不足,用戶對於GPU還停留在遊戲處理器的認知上,且高端GPU的市場存量較少,並沒有基於GPU部署資料庫系統的實力。另一方面,整個生態系統還處於早期的發展狀態,各種相關工具及配套軟體比較缺乏。基於以上兩點原因,國外公司在這一方面並沒有太多優勢。

到2016年,市場認知才有所好轉。從業人員開始意識到GPU也可以做與企業相關的工程(例如深度學習),同時,GPU伺服器已經成為常態,各種GPU的生態體系也逐漸完善,種種原因使得2016年成為GPU資料庫的元年,至此,資本市場逐漸認可這一領域,GPU資料庫進入爆發期。

然而爆發並不意味著競爭,靖亞資本創始人鄭靖偉向億歐介紹,資料庫這樣底層技術的門檻很高,國內少有人研究。產品的研發與驗證都需要一定時間,而對於一般的大型中型公司來說,更換資料庫系統需要進行很多的測試來評估流程,一旦被驗證,很難再次更換資料庫系統提供商。

而2018年,將是GPU資料庫在各行各業應用更為廣泛的一年。

文章版權屬北京億歐網盟科技有限公司所有。文章內容系作者個人觀點,不代表億歐對觀點贊同或支持。

Next Article
喜欢就按个赞吧!!!
点击关闭提示