Cloudera 發佈自助式資料科學開發環境原生支援 R、Python、Scala 和各大開源框架

雷鋒網消息，在昨日聖約瑟舉行的 Strata+Hadoop World 大會上，美國大資料服務商 Cloudera 發佈了 Cloudera Data Science Workbench —— 一個運行於 Cloudera Enterprise，自助式的資料科學開發環境。目前該全新研發的軟體尚在 beta 內測階段。

雷鋒網獲知，相關技術來自於 Cloudera 去年收購的資料科學初創公司 Sense.io。該產品的最大特點是原生支援 Apache Spark、Hadoop 和 R、Python、Scala 等開發語言。開發者能在 Cloudera 的企業平臺上同時使用這些工具和語言，這將加速資料分析專案從研發到最終產品的過程。

Cloudera 高級副總裁 Charles Zedlewski 表示：

“Cloudera 專注於提升資料科學和工程團隊的使用體驗，尤其是想要用 Spark 來協助資料處理和機器學習，來對分析任務進行擴展的用戶。對 Sense.io 的收購，以及其團隊的加入，為該產品提供了牢固的基石。 Data Science Workbench 向我們的客戶，提供了開展大規模自助式資料科學工作的能力。 ”

Charles Zedlewski (中)

那麼， Cloudera Data Science Workbench 具體能夠帶來什麼？

對於資料科學家：

能在多個開源軟體庫和框架上使用 R, Python 和 Scala。可以直接在流覽器使用。

使用 Spark 和 Impala，能直接從十分安全的 Hadoop 資料簇獲取資料。

與團隊分享經驗。

對於 IT 管理者：

給你的資料科學團隊更高的工作靈活性

服從完整的 Hadoop 安全方案，尤其是 Kerberos

既能在本地運行，也能在雲端。

現在，正是資料科學開源浪潮一浪高過一浪，不但席捲 Python 和 R語言生態，還吸納進各個深度學習框架（比如 Tensorflow、Microsoft Cognitive Toolkit、MXnet、BigDL 等）的時候。

資料科學團隊需要將這些工具應用於 Hadoop 環境下的資料。 Cloudera Data Science Workbench 便是為此而設計。

雷鋒網消息，在大會上 Charles Zedlewski 進一步解釋道：

“我們的 IT 企業客戶往往對於怎麼讓資料科學家在分享環境下工作十分頭疼。這是由於，資料科學家們的需求十分多樣，尤其是涉及到開源工具。這經常導致重複工作、有限的安全性和管理，以及 analytic silos。同時，資料科學家一直在尋找，把他們的工作擴展到更大的資料集和更強大計算平臺上的方法。通過 Data Science Workbench， Cloudera 説明 IT 團隊和資料科學家相互協作，把更多用戶帶到共用的環境中。我們的方案既保證靈活性，又在關鍵的安全環節不妥協。 ”

詳情：https://www.cloudera.com/products/data-science-and-engineering/data-science-workbench.html

via globe news wire

Cloudera 發佈自助式資料科學開發環境 原生支援 R、Python、Scala 和各大開源框架

Cloudera 發佈自助式資料科學開發環境原生支援 R、Python、Scala 和各大開源框架