躋身資料科學領域的五條職業規劃道路
授權轉載自THU數據派(ID:datapi)
翻譯 | 盧苗苗、梁傅淇 校對 | 呂豔芹
作者 | Matthew Mayo
---------------
手把手輔導,教會為止
距離課程開始僅一周
用雲實驗環境
完成第1個資料科學專案:
美國大選資料分析與視覺化
電商銷量預測
海量文本分析
3月18日開課 小班輔導
名額有限 欲報從速
詳情見文末
---------------
最近有許多人聯繫我(大部分都是通過領英)尋求著手資料科學和/或大資料的建議。這些人普遍對切入這個“領域”感興趣,並且需要些關於如何切入方面的指導。
然而,我懷著極大的尊重來說這個話,
預備閱讀
在我們繼續深入之前,
第一篇文章概覽資料科學中一些最主要的概念,而第二篇文章則是今年早些時候對這些概念的更新。第三篇文章更深入地解析了資料科學和大資料之中的概念。最後一篇文章對比了一些其他術語,對“資料科學”這個術語的複雜性和微妙性進行了簡短的探討。
我將眾多的職業可能性拆分成五條能夠輕鬆掌控的道路。雖然可能有很多人強烈反對這種角色劃分並且因此感到恐慌,
資料管理專員
這本質上是一個IT職業,類似于資料庫管理員。資料管理專員被認為和管理資料以及支援資料管理的設施有關。這個職位和資料分析只有很少關聯,也類似Python和R語言的使用也不是很必要。可能會用到SQL語言,以及和Hadoop相關的查詢語言,比如Hive和Pig。
Apache Hadoop和它的生態系統
Apache Spark和它的生態系統
SQL以及關聯式資料庫
NoSQL資料庫
資料工程師
這是一條非分析大資料職業道路。記得在剛剛的職業道路之中提到的資料設施嗎?是的,
說句實話,資料工程師和資料管理專員所需要的技術和技能是相似的,然而,他們各自在不同的層次理解和使用同樣的概念。我不會重複之前一種職業中所提到的那些資訊(所有這些資訊對資料工程師都很重要),但我會專門給資料工程師補充延伸閱讀的清單。
商業分析師
在本文裡,商業分析師指的是與資料分析和資料呈現緊密相關的角色。包括報告,儀錶板和任何被稱為“商業智慧”的東西。 這種角色通常要求與關聯式資料庫和非關聯式資料庫以及大資料框架的交互(或查詢)。
雖然前兩種角色與設計基礎設施來管理資料以及實際管理資料有關,但商業分析師主要關注從那些或多或少存在的資料中提取資訊。 這與以下兩個角色(機器學習研究者/從業者和以資料為導向的專業人員)形成對比,兩者都側重於從資料或資料以外已知的一些表面資訊中獲得洞察力。 因此,商業分析師需要在所呈現的這些角色中具有獨特的技能。
SQL和關係型數據庫
NoSQL資料庫
經常會用到商業報告和儀錶盤封裝技術
報告從本質來講是沒有固定模式的,快速掌握工具的使用是關鍵
資料倉庫
關鍵技術以及需要關注的技能:
我不會重複之前一種職業中所提到的那些資訊(所有這些資訊對資料工程師都很重要),但我會專門給資料工程師補充延伸閱讀的清單。商業分析師
在本文裡,商業分析師指的是與資料分析和資料呈現緊密相關的角色。包括報告,儀錶板和任何被稱為“商業智慧”的東西。 這種角色通常要求與關聯式資料庫和非關聯式資料庫以及大資料框架的交互(或查詢)。
雖然前兩種角色與設計基礎設施來管理資料以及實際管理資料有關,但商業分析師主要關注從那些或多或少存在的資料中提取資訊。 這與以下兩個角色(機器學習研究者/從業者和以資料為導向的專業人員)形成對比,兩者都側重於從資料或資料以外已知的一些表面資訊中獲得洞察力。 因此,商業分析師需要在所呈現的這些角色中具有獨特的技能。
SQL和關係型數據庫
NoSQL資料庫
經常會用到商業報告和儀錶盤封裝技術
報告從本質來講是沒有固定模式的,快速掌握工具的使用是關鍵
資料倉庫
關鍵技術以及需要關注的技能: