您的位置:首頁>科技>正文

Cloudera 發佈自助式資料科學開發環境 原生支援 R、Python、Scala 和各大開源框架

雷鋒網消息, 在昨日聖約瑟舉行的 Strata+Hadoop World 大會上, 美國大資料服務商 Cloudera 發佈了 Cloudera Data Science Workbench —— 一個運行於 Cloudera Enterprise, 自助式的資料科學開發環境。 目前該全新研發的軟體尚在 beta 內測階段。

雷鋒網獲知, 相關技術來自於 Cloudera 去年收購的資料科學初創公司 Sense.io。 該產品的最大特點是原生支援 Apache Spark、Hadoop 和 R、Python、Scala 等開發語言。 開發者能在 Cloudera 的企業平臺上同時使用這些工具和語言, 這將加速資料分析專案從研發到最終產品的過程。

Cloudera 高級副總裁 Charles Zedlewski 表示:

“Cloudera 專注於提升資料科學和工程團隊的使用體驗, 尤其是想要用 Spark 來協助資料處理和機器學習, 來對分析任務進行擴展的用戶。 對 Sense.io 的收購, 以及其團隊的加入, 為該產品提供了牢固的基石。 Data Science Workbench 向我們的客戶, 提供了開展大規模自助式資料科學工作的能力。 ”

Charles Zedlewski (中)

那麼, Cloudera Data Science Workbench 具體能夠帶來什麼?

對於資料科學家:

能在多個開源軟體庫和框架上使用 R, Python 和 Scala。 可以直接在流覽器使用。

使用 Spark 和 Impala, 能直接從十分安全的 Hadoop 資料簇獲取資料。

與團隊分享經驗。

對於 IT 管理者:

給你的資料科學團隊更高的工作靈活性

服從完整的 Hadoop 安全方案, 尤其是 Kerberos

既能在本地運行, 也能在雲端。

現在, 正是資料科學開源浪潮一浪高過一浪, 不但席捲 Python 和 R語言生態, 還吸納進各個深度學習框架(比如 Tensorflow、Microsoft Cognitive Toolkit、MXnet、BigDL 等)的時候。

資料科學團隊需要將這些工具應用於 Hadoop 環境下的資料。 Cloudera Data Science Workbench 便是為此而設計。

雷鋒網消息, 在大會上 Charles Zedlewski 進一步解釋道:

“我們的 IT 企業客戶往往對於怎麼讓資料科學家在分享環境下工作十分頭疼。 這是由於, 資料科學家們的需求十分多樣, 尤其是涉及到開源工具。 這經常導致重複工作、有限的安全性和管理, 以及 analytic silos。 同時, 資料科學家一直在尋找, 把他們的工作擴展到更大的資料集和更強大計算平臺上的方法。 通過 Data Science Workbench, Cloudera 説明 IT 團隊和資料科學家相互協作, 把更多用戶帶到共用的環境中。 我們的方案既保證靈活性, 又在關鍵的安全環節不妥協。 ”

詳情:https://www.cloudera.com/products/data-science-and-engineering/data-science-workbench.html

via globe news wire

Next Article
喜欢就按个赞吧!!!
点击关闭提示