華文網

躋身資料科學領域的五條職業規劃道路

授權轉載自THU數據派(ID:datapi)

翻譯 | 盧苗苗、梁傅淇 校對 | 呂豔芹

作者 | Matthew Mayo

---------------

手把手輔導,教會為止

距離課程開始僅一周

用雲實驗環境

完成第1個資料科學專案:

美國大選資料分析與視覺化

電商銷量預測

海量文本分析

3月18日開課 小班輔導

名額有限 欲報從速

詳情見文末

---------------

最近有許多人聯繫我(大部分都是通過領英)尋求著手資料科學和/或大資料的建議。這些人普遍對切入這個“領域”感興趣,並且需要些關於如何切入方面的指導。

然而,我懷著極大的尊重來說這個話,

這些請求的中心含義體現出請求者對自己所要求的事情其實並不理解。是的,不論在學習什麼,每個人都需要從某個地方開始。我不會再一個個去回答這些相似的問題,這篇文章會列出和資料科學和/或大資料職業道路相關的一些基本的概念,並且,很希望提供一點如何切實參與到這個複雜領域的建議。

預備閱讀

在我們繼續深入之前,

讀一讀這些文章。我是說真的,讀,這些,文章。

第一篇文章概覽資料科學中一些最主要的概念,而第二篇文章則是今年早些時候對這些概念的更新。第三篇文章更深入地解析了資料科學和大資料之中的概念。最後一篇文章對比了一些其他術語,對“資料科學”這個術語的複雜性和微妙性進行了簡短的探討。

我將眾多的職業可能性拆分成五條能夠輕鬆掌控的道路。雖然可能有很多人強烈反對這種角色劃分並且因此感到恐慌,

但它確實對技能和職業責任進行了高度的分類。因此,我相信接下來的內容能有效地説明新來者在這個專業領域中所存在的令人混淆和迷惑的無數機會之中確認方向。

資料管理專員

這本質上是一個IT職業,類似于資料庫管理員。資料管理專員被認為和管理資料以及支援資料管理的設施有關。這個職位和資料分析只有很少關聯,也類似Python和R語言的使用也不是很必要。可能會用到SQL語言,以及和Hadoop相關的查詢語言,比如Hive和Pig。

Apache Hadoop和它的生態系統

Apache Spark和它的生態系統

SQL以及關聯式資料庫

NoSQL資料庫

資料工程師

這是一條非分析大資料職業道路。記得在剛剛的職業道路之中提到的資料設施嗎?是的,

它們需要被設計和執行,資料工程師就承擔了這部分工作。如果說資料管理專員是汽車修理師,那麼資料工程師就是汽車工程師。不過不要搞錯了,這兩個角色都對你的汽車的行駛和持續工作至關重要,對你從A點駕駛到B點同樣重要。

說句實話,資料工程師和資料管理專員所需要的技術和技能是相似的,然而,他們各自在不同的層次理解和使用同樣的概念。我不會重複之前一種職業中所提到的那些資訊(所有這些資訊對資料工程師都很重要),但我會專門給資料工程師補充延伸閱讀的清單。

商業分析師

在本文裡,商業分析師指的是與資料分析和資料呈現緊密相關的角色。包括報告,儀錶板和任何被稱為“商業智慧”的東西。 這種角色通常要求與關聯式資料庫和非關聯式資料庫以及大資料框架的交互(或查詢)。

雖然前兩種角色與設計基礎設施來管理資料以及實際管理資料有關,但商業分析師主要關注從那些或多或少存在的資料中提取資訊。 這與以下兩個角色(機器學習研究者/從業者和以資料為導向的專業人員)形成對比,兩者都側重於從資料或資料以外已知的一些表面資訊中獲得洞察力。 因此,商業分析師需要在所呈現的這些角色中具有獨特的技能。

SQL和關係型數據庫

NoSQL資料庫

經常會用到商業報告和儀錶盤封裝技術

報告從本質來講是沒有固定模式的,快速掌握工具的使用是關鍵

資料倉庫

關鍵技術以及需要關注的技能:

我不會重複之前一種職業中所提到的那些資訊(所有這些資訊對資料工程師都很重要),但我會專門給資料工程師補充延伸閱讀的清單。

商業分析師

在本文裡,商業分析師指的是與資料分析和資料呈現緊密相關的角色。包括報告,儀錶板和任何被稱為“商業智慧”的東西。 這種角色通常要求與關聯式資料庫和非關聯式資料庫以及大資料框架的交互(或查詢)。

雖然前兩種角色與設計基礎設施來管理資料以及實際管理資料有關,但商業分析師主要關注從那些或多或少存在的資料中提取資訊。 這與以下兩個角色(機器學習研究者/從業者和以資料為導向的專業人員)形成對比,兩者都側重於從資料或資料以外已知的一些表面資訊中獲得洞察力。 因此,商業分析師需要在所呈現的這些角色中具有獨特的技能。

SQL和關係型數據庫

NoSQL資料庫

經常會用到商業報告和儀錶盤封裝技術

報告從本質來講是沒有固定模式的,快速掌握工具的使用是關鍵

資料倉庫

關鍵技術以及需要關注的技能: