華文網

學院公開課|Python爬蟲/Excel實用技能/Spark大資料,2018年開場豪華學習禮包!

▌今天「棕櫚學院」主要內容有三個——

對某門課程超感興趣的可以手動跳躍至相關課程呦~

以下請看詳細內容:

1

Python網路爬蟲找美食

▌人生三大難題之一:今天的晚飯吃啥?

小學

2017年就快沒了,我們抓緊最後的時間去吃點好吃的吧!

小院

哈哈哈約飯理由100分!我們去吃啥呢?

小學

稍等我去看一下點評~你想吃什麼種類?

小院

我都行啊,找家好吃的唄。

小學

火鍋?你看下這個,我收藏好久了。還有這家日料也很好吃。對了之前新開的這個烤魚口碑也很好,

哎還有這個海鮮館……

小院

Emmmm……

10分鐘後……

- 哎好累,評論看得我眼花,不知道去哪個了……

- 評論太兩極分化了,要是能快速篩選就好了。

▌有!學院君再次邀請到你們認真可愛的傑克老師,用Python做一次網路爬蟲,使用美食點評網站上的各類評論、位置、價位、打分、圖片等資料,對美食們做一波「全面徹底、剛正不阿」的大篩選!

本次公開課 爬蟲專案預覽

傑克老師已經身先士卒,用Python大法爬過了Yelp上餐館的資料,

搜集了1000家紐約的美食餐廳資訊。

看再多的文章和演示而不動手去嘗試,知識永遠不會變成你自己的能力。

▌01 傑克老師爬取出的1000家餐館數據

▌02 前方高能!爬取出的1000張美食圖片!

(求學院君沒吃飽飯做這張圖時的心理陰影面積)

▌03 傑克老師編寫成功的爬取代碼

快來和我們傑克老師一起,用Python做美食網站的網路爬蟲吧!我們自己,動手動腦,豐衣足食!

第一,方法有了,我教,你照搬;

第二,美食有了,你約,不會錯!

適合人群

1. 正在學Python,好奇如何玩兒小專案的同學們;

2. 苦惱如何搜集資料來源,科研/學習/工作中不知道第一步如何下手的寶寶;

3. 關注產品評論/大眾輿情/顧客喜好偏向的市場調研猿們;

4. 關注搜尋引擎優化,想要通過爬蟲學習如何更好做內容的從業者;

5. 史詩級選擇困難症,每天都不知道吃啥好的天秤座;

講師介紹

Jack

中國科學技術大學碩士,

馬里蘭大學資訊系統專業PhD,有多項開發資訊系統的經驗,曾獲得過ACM/ICM-Finalist特等獎提名獎。(超級認真超級nice的傑克老師又要和大家見面啦~)

↓↓ 講座知識點預覽 ↓↓

用Python進行網路爬蟲——

尋找最好吃的美食店!

1. 介紹普通網頁的基本結構和佈局

2. 個人電腦設備是如何訪問資料和爬取網路資源的?

3. 爬蟲是怎樣工作的,爬取流程是怎麼樣的?

4. 如何用Python做爬蟲的結構?

5. 兩個常見的Python爬蟲庫:

BeautifulSoup V.S. Scrapy

6. 兩個常見大庫裡,一些小的Library和方法

7. 如何避免爬蟲程式被網站伺服器禁止?

8. 實例演示:以Yelp上餐館的數據為例,爬取了1000家紐約的美食餐廳。同樣的方法也可以用來爬大眾點評噢~

公開課時間&形式

北京時間

1月10日 週三 晚上21:00

線上直播:PPT+視頻語音

提供錄播:無限回看

報名方式

長按識別此二維碼,

回復關鍵字

「 美食 」

即可獲得入群方式

2

Excel實用技能 公開課

▌我吹過的最堂而皇之的牛,就是「本人精通/熟練掌握 Office 辦公軟體!」

有些事兒,比如Excel,你以為你會了,你其實完全不會。

有些事兒,比如Excel,你以為你不會,發現,百度了也沒會……(住口)

● 簡歷上寫著「熟練使用office辦公軟體」,卻被HR幾句話識破?

● 看了無數Excel教程和心得,還是菜鳥一枚?

● 需要製作圖表時,靠著百度經驗一點一點查,折騰半天還是一頭霧水?

● 實習/工作,一碰上資料包表就會變成非自願加班星人?

● Excel到底有多厲害?怎樣才算精通?如何系統學習?有哪些公式/技能是必備的?

……

不會三連

差點意思

感覺不對

我真不會

但其實,這還不是最可怕的。

我們常說,學習是一件有針對性有目標的事情,如果現在讓一隻小白立下「2018年一定要精通Excel」的宏願,Ta的第一個問題一定是——

誒?我不知道從哪裡開始學?我好像也會做一點表啊……

今天,學院踩著2017年的尾巴,專門成立了 Excel 掃黃(手動劃掉)盲小分隊,為大家普及那些工作上常用,而大部分小夥伴卻不知道的 Excel 技能點!(2018年我們要一起成為Excel小能手!)

劃重點:首先,我要告訴你,Excel怎麼才能「物盡其用」~

希望2018年的你,可以這麼說:

適合人群

1.Excel 基礎薄弱,想快速提升自己 Excel 資料處理能力的同學;

2.需要找工作,再也不好意思厚著臉皮說自己精通 Excel 的同學;

3.工作中需要經常使用 Excel 的財務、審計、資料專員們;

4.已將Excel加入「2018年豪華學習禮包」,需要學習方向的小夥伴!

我們人美音甜超級可愛的語洋老師又回來辣~這次帶領大家Excel大掃盲噢~~

1小時不一定能精通Excel(學院君真這麼吹你也不會信呀),但是一定能幫助你2018年有更加清晰的Excel學習計畫!

Yu yang

芝加哥大學金融工程碩士,本科就讀于維吉尼亞大學經濟與數學專業。

曾實習於四大/投行/資產管理公司/保險公司,即將在美國開始投資分析師工作,關注於ABS和CLO等資產證券化產品的投資以及投資組合分析。熟練使用R語言、Excel等各類軟體。

↓↓ 講座大綱概覽 ↓↓

1. Excel基礎知識掃盲:

a.神奇的格式刷

b.變數與非變數

c.首行固定

2. Excel的數據視覺化:

a. 折線圖/柱狀圖/扇形圖

b. 畫圖的“潛規則”是什麼?

c.《華爾街日報》上的複雜圖表是怎麼做的?

3. Excel神奇的公式有哪些?

a.IS Function

b.Conditional

c.Mathemaical

d.Find&Search

e.lookup

f.Logical

4.什麼才算 Excel 的高級應用?

a.VBA

b.Pivot Table

c.統計建模

5. 成功前的Excel:

交圖表給老闆前,需要檢查什麼細節?

6.職業好奇心:

資料科學家和投行分析師都用 Excel 做些什麼?

7. 案例分析Case study:

用Excel 完成信用評級遷移模型的估測

1月7日 周日 晚上21:00

「 Excel 」

即可獲得入群方式

3

Spark大資料 公開課

▌大資料就是很大很大的資料?那到底有多大?

舉個知乎上看見的簡單例子:

你有10個數位需要儲存計算,那你可以直接丟進記憶體再分下類就完事兒。

有1GB的數位需要儲存計算,也可以一把丟進記憶體,前提是你電腦不太破,也勉強完事兒。

有10GB的數位需要儲存計算呢,咋辦?買幾根記憶體條安上??

那100GB呢?你可以選擇直接砸電腦了......

然而100GB也「只是」小資料,往往我們說的大資料都是 TB、PB 級別的,資料大到在一台電腦上不能完成儲存和計算。

世界上第一個發明洗衣機的人一定是個懶人,想要輕便地處理大資料一定有懶人給我們提供的工具。今天,學院君就帶大家學習一款目前大資料處理軟體中的新興網紅——Spark。

Spark 是一款專為大規模資料處理而設計的快速通用的計算引擎,是 UC Berkeley AMP lab 所開源的類似 Hadoop MapReduce 的通用並行框架,可用它來完成各種各樣的運算,包括 SQL 查詢、文本處理、機器學習等。

學院Spark公開課

是的沒錯,學院給大家帶來的「Spark入門公開課」,當然是資源珍貴價值高!

1.介紹Spark軟體:它是如何工作的?為什麼火?

2.與 Hadoop 作比較,為什麼很多人唱衰 Hadoop,看好 Spark?

3.介紹 Spark 的各類強大元件,它怎樣構建出怎樣一個龐大的生態環境。

通過這次公開課,瞭解 Spark 的同時,帶大家一起入門瞭解大資料~

課程適合人群

1.想瞭解大資料,不被時代所拋棄,看看這個行業為啥如此火爆的同學。

2.目前需要做大資料相關論文、學術研究,急需補充大資料相關知識的同學~

3.有電腦科學背景,想往資料分析方向發展,想掌握一種大資料處理手段的同學!

4.我不管!哪行工資高、前景好我就去幹哪行的同學!

公開課指導老師

Muyang

碩士畢業于University of Virginia, Data Science Institute; 本科畢業於University of Virginia 數學專業(金融數學方向)。在校期間曾擔任微積分和常微分方程的課程助教,有豐富的教學經驗。

精通SQL/R/Python和Spotfire,有超過3年的資料統計和視覺化軟體使用經驗;已通過精算概率論(P) / 金融數學(FM)等精算師相關行業考試;現為CFA 二級候選人。

通過在金融行業中多年的積累和觀察,Muyang導師對金融和保險業有著自己獨到的行業洞察力,是資料統計和分析的「小達人」。

↓↓ 講座大綱概覽 ↓↓

1. Need of spark

· Real time Data (即時計算)

· BIG data

2. What is spark

3. How does Spark work

· Foudamental concepts of some important words, as RDD, API

· Spark VS Hadoop

4. Spark Ecosystem(生態環境)

1月2日 晚上22:00

「 Spark 」

即可獲得入群方式

我還能說什麼呢,請看下圖。↓

以下課程報名未截止,歡迎繼續上車一些小的Library和方法

7. 如何避免爬蟲程式被網站伺服器禁止?

8. 實例演示:以Yelp上餐館的數據為例,爬取了1000家紐約的美食餐廳。同樣的方法也可以用來爬大眾點評噢~

公開課時間&形式

北京時間

1月10日 週三 晚上21:00

線上直播:PPT+視頻語音

提供錄播:無限回看

報名方式

長按識別此二維碼,

回復關鍵字

「 美食 」

即可獲得入群方式

2

Excel實用技能 公開課

▌我吹過的最堂而皇之的牛,就是「本人精通/熟練掌握 Office 辦公軟體!」

有些事兒,比如Excel,你以為你會了,你其實完全不會。

有些事兒,比如Excel,你以為你不會,發現,百度了也沒會……(住口)

● 簡歷上寫著「熟練使用office辦公軟體」,卻被HR幾句話識破?

● 看了無數Excel教程和心得,還是菜鳥一枚?

● 需要製作圖表時,靠著百度經驗一點一點查,折騰半天還是一頭霧水?

● 實習/工作,一碰上資料包表就會變成非自願加班星人?

● Excel到底有多厲害?怎樣才算精通?如何系統學習?有哪些公式/技能是必備的?

……

不會三連

差點意思

感覺不對

我真不會

但其實,這還不是最可怕的。

我們常說,學習是一件有針對性有目標的事情,如果現在讓一隻小白立下「2018年一定要精通Excel」的宏願,Ta的第一個問題一定是——

誒?我不知道從哪裡開始學?我好像也會做一點表啊……

今天,學院踩著2017年的尾巴,專門成立了 Excel 掃黃(手動劃掉)盲小分隊,為大家普及那些工作上常用,而大部分小夥伴卻不知道的 Excel 技能點!(2018年我們要一起成為Excel小能手!)

劃重點:首先,我要告訴你,Excel怎麼才能「物盡其用」~

希望2018年的你,可以這麼說:

適合人群

1.Excel 基礎薄弱,想快速提升自己 Excel 資料處理能力的同學;

2.需要找工作,再也不好意思厚著臉皮說自己精通 Excel 的同學;

3.工作中需要經常使用 Excel 的財務、審計、資料專員們;

4.已將Excel加入「2018年豪華學習禮包」,需要學習方向的小夥伴!

我們人美音甜超級可愛的語洋老師又回來辣~這次帶領大家Excel大掃盲噢~~

1小時不一定能精通Excel(學院君真這麼吹你也不會信呀),但是一定能幫助你2018年有更加清晰的Excel學習計畫!

Yu yang

芝加哥大學金融工程碩士,本科就讀于維吉尼亞大學經濟與數學專業。

曾實習於四大/投行/資產管理公司/保險公司,即將在美國開始投資分析師工作,關注於ABS和CLO等資產證券化產品的投資以及投資組合分析。熟練使用R語言、Excel等各類軟體。

↓↓ 講座大綱概覽 ↓↓

1. Excel基礎知識掃盲:

a.神奇的格式刷

b.變數與非變數

c.首行固定

2. Excel的數據視覺化:

a. 折線圖/柱狀圖/扇形圖

b. 畫圖的“潛規則”是什麼?

c.《華爾街日報》上的複雜圖表是怎麼做的?

3. Excel神奇的公式有哪些?

a.IS Function

b.Conditional

c.Mathemaical

d.Find&Search

e.lookup

f.Logical

4.什麼才算 Excel 的高級應用?

a.VBA

b.Pivot Table

c.統計建模

5. 成功前的Excel:

交圖表給老闆前,需要檢查什麼細節?

6.職業好奇心:

資料科學家和投行分析師都用 Excel 做些什麼?

7. 案例分析Case study:

用Excel 完成信用評級遷移模型的估測

1月7日 周日 晚上21:00

「 Excel 」

即可獲得入群方式

3

Spark大資料 公開課

▌大資料就是很大很大的資料?那到底有多大?

舉個知乎上看見的簡單例子:

你有10個數位需要儲存計算,那你可以直接丟進記憶體再分下類就完事兒。

有1GB的數位需要儲存計算,也可以一把丟進記憶體,前提是你電腦不太破,也勉強完事兒。

有10GB的數位需要儲存計算呢,咋辦?買幾根記憶體條安上??

那100GB呢?你可以選擇直接砸電腦了......

然而100GB也「只是」小資料,往往我們說的大資料都是 TB、PB 級別的,資料大到在一台電腦上不能完成儲存和計算。

世界上第一個發明洗衣機的人一定是個懶人,想要輕便地處理大資料一定有懶人給我們提供的工具。今天,學院君就帶大家學習一款目前大資料處理軟體中的新興網紅——Spark。

Spark 是一款專為大規模資料處理而設計的快速通用的計算引擎,是 UC Berkeley AMP lab 所開源的類似 Hadoop MapReduce 的通用並行框架,可用它來完成各種各樣的運算,包括 SQL 查詢、文本處理、機器學習等。

學院Spark公開課

是的沒錯,學院給大家帶來的「Spark入門公開課」,當然是資源珍貴價值高!

1.介紹Spark軟體:它是如何工作的?為什麼火?

2.與 Hadoop 作比較,為什麼很多人唱衰 Hadoop,看好 Spark?

3.介紹 Spark 的各類強大元件,它怎樣構建出怎樣一個龐大的生態環境。

通過這次公開課,瞭解 Spark 的同時,帶大家一起入門瞭解大資料~

課程適合人群

1.想瞭解大資料,不被時代所拋棄,看看這個行業為啥如此火爆的同學。

2.目前需要做大資料相關論文、學術研究,急需補充大資料相關知識的同學~

3.有電腦科學背景,想往資料分析方向發展,想掌握一種大資料處理手段的同學!

4.我不管!哪行工資高、前景好我就去幹哪行的同學!

公開課指導老師

Muyang

碩士畢業于University of Virginia, Data Science Institute; 本科畢業於University of Virginia 數學專業(金融數學方向)。在校期間曾擔任微積分和常微分方程的課程助教,有豐富的教學經驗。

精通SQL/R/Python和Spotfire,有超過3年的資料統計和視覺化軟體使用經驗;已通過精算概率論(P) / 金融數學(FM)等精算師相關行業考試;現為CFA 二級候選人。

通過在金融行業中多年的積累和觀察,Muyang導師對金融和保險業有著自己獨到的行業洞察力,是資料統計和分析的「小達人」。

↓↓ 講座大綱概覽 ↓↓

1. Need of spark

· Real time Data (即時計算)

· BIG data

2. What is spark

3. How does Spark work

· Foudamental concepts of some important words, as RDD, API

· Spark VS Hadoop

4. Spark Ecosystem(生態環境)

1月2日 晚上22:00

「 Spark 」

即可獲得入群方式

我還能說什麼呢,請看下圖。↓

以下課程報名未截止,歡迎繼續上車