您的位置:首頁>正文

陳奕迅是一代歌王!用Python爬取十萬條評論!發現新大陸!

具體欄位如上圖, 會發現表單中需要填兩個資料, 名稱為params和encSecKey。 後面緊跟的是一大串字元, 換幾首歌會發現, 每首歌的params和encSecKey都是不一樣的, 因此, 這兩個資料可能經過一個特定的演算法進行加密過的

3.抓取熱門評論資訊

代碼塊如下:

二、資料視覺化

在獲得相關評論資料後, 我們將其做成圖表與詞雲圖, 將讓人看起來更直觀。

接下來需要在自己電腦上安裝需要相關的安裝包: pyecharts(圖表包)、matplotlib(繪圖功能包)、 WordCloud(詞雲包)

其中, pyecharts 是一個用於生成 Echarts 圖表的類庫。 Echarts 是百度開源的一個資料視覺化 JS 庫, 主要用於資料視覺化, 同時pyecharts 相容 Python2 和 Python3。 安裝非常簡單, 只需:

pip install pyecharts

接下來就是代碼的實現:

利用之前獲得評論用戶名和對應的點贊數, 將其製作成圖表圖:

from pyecharts importBar

由此可以看出,獲得最高贊數(95056)評論是:

結果圖:

從圖中可以看出,很多人感慨,後來只有你我,再無我們。

注明:所有資料,是屬於當時所爬取的資料。

由此可以看出,獲得最高贊數(95056)評論是:

結果圖:

從圖中可以看出,很多人感慨,後來只有你我,再無我們。

注明:所有資料,是屬於當時所爬取的資料。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示