您的位置:首頁>正文

神級程式師用Python對上萬首唐詩進行資料分析!此乃神級程式師也

中國是一個歷史悠久的強國!他的文化自然也是悠遠流長!唐詩我想大家都學過, 沒人是沒有學過的, 這些東西小編不希望大家隨著科技的更新而被遺忘, 希望大家都能謹記!

一個人自學很有可能因為動力不足而中途放棄, 可以嘗試加入一個或幾個適合自己的網路群體(QQ、 微信、 社區等),尋找志同道合的學習夥伴, 相互交流、相互促進.如果大家想要學習交流歡迎給我私信, 私信關鍵字: 01.02.03.04 都會得到不一樣的資料!系統堅持到關鍵字會自動發送。 分開發送!01或者02

2.2 萬紫千紅一片綠——《全唐詩》中的色彩

筆者在這裡找了51個古語中常用的顏色的單字(注意是古漢語語境中的顏色稱謂),其中以紅色系(紅、丹、朱、赤、絳等)、黑色系(暗、玄、烏、冥、墨等)、綠色系(綠、碧、翠、蒼等)及白色系(白、素、皎、皓等)為主,這些顏色及其對應的字頻如下表所示:

以下是TOP200的共現雙字詞:

下面,筆者選取一些單字進行字向量關聯分析,展示如下:

注意,在這裡得到的情緒相關字,筆者將收集整理它們,製成情緒詞典,用於後面的詩詞情緒分類。

為了取得更好的效果,筆者採用最新的NestedLSTM+Conv1D的深度學習模型來做情緒判斷,它能較好的提煉文本裡的特徵和語序資訊,記住更長的語義依賴關係,做出較為精確的情緒判斷。其網路結構如下所示:

接著,來試試實際的效果:

以“春雨”打頭,生成500字的詩詞,結果如下:

再看看筆者較為欣賞的2句名句,機器很好的捕捉到了它們之間的相似語義關係,即使詞彙不盡相同,但仍能從語義上檢索相似詩句。

預處理後是這樣的形式:

用Semiotic Squares進行分析的結果如下圖所示(點擊即可放大顯示):

作者:蘇格蘭折耳喵

希望大家都能不忘初心!謝謝閱讀!

2.2 萬紫千紅一片綠——《全唐詩》中的色彩

筆者在這裡找了51個古語中常用的顏色的單字(注意是古漢語語境中的顏色稱謂),其中以紅色系(紅、丹、朱、赤、絳等)、黑色系(暗、玄、烏、冥、墨等)、綠色系(綠、碧、翠、蒼等)及白色系(白、素、皎、皓等)為主,這些顏色及其對應的字頻如下表所示:

以下是TOP200的共現雙字詞:

下面,筆者選取一些單字進行字向量關聯分析,展示如下:

注意,在這裡得到的情緒相關字,筆者將收集整理它們,製成情緒詞典,用於後面的詩詞情緒分類。

為了取得更好的效果,筆者採用最新的NestedLSTM+Conv1D的深度學習模型來做情緒判斷,它能較好的提煉文本裡的特徵和語序資訊,記住更長的語義依賴關係,做出較為精確的情緒判斷。其網路結構如下所示:

接著,來試試實際的效果:

以“春雨”打頭,生成500字的詩詞,結果如下:

再看看筆者較為欣賞的2句名句,機器很好的捕捉到了它們之間的相似語義關係,即使詞彙不盡相同,但仍能從語義上檢索相似詩句。

預處理後是這樣的形式:

用Semiotic Squares進行分析的結果如下圖所示(點擊即可放大顯示):

作者:蘇格蘭折耳喵

希望大家都能不忘初心!謝謝閱讀!

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示