華文網

R和Python?到底該如何抉擇呢?看完這波案例我找到了我的語言!

日期與時間格式資料處理通常在資料過程中要相對複雜一些,因為其不僅涉及到不同國家表示方式的差異,本身結構也較為複雜,在R語言和Python中,存在著不止一套方法來處理日期與時間,

因而做一個清洗的梳理與對比將會很有價值。

這是本文的主題!在給大家分享之前呢,我介紹一下我弄的一個學習交流群,有什麼不懂的問題,都可以在群裡踴躍發言,需要啥資料隨時在群檔裡面獲取自己想要的資料。這個python群就是:330637182 小編期待大家一起進群交流討論,講實話還是一個非常適合學習的地方的。各種入門資料啊,進階資料啊,框架資料啊 爬蟲等等,

都是有的,風裡雨裡,小編都在群裡等你。

本文針對R語言與Python中常用日期與時間函數進行簡要對比介紹,力求簡單明瞭,覆蓋常用的處理方法。

----------

R

---------------

在R語言中,涉及到日期與時間處理的函數主要有以下四套:

as.Date()函數:

POSIXt/POSIXct函數:

chron包:

lubridate包:

前兩個是R語言的base包內置函數,as.Date主要用於處理常用的日期資料(無時間),POSIXt/POSIXct函數則可以用於處理日期時間資料(同時控制時區)。lubridate包和chron包(無法控制時區)則不僅包含常用的日期與時間資料處理函數,

還完善了一些日期日期計算與時區時區轉換的若干函數。

以上三個函數是R的內建日期函數,之後的案例會頻繁用到。

as.Date()

日期與時間變數的格式通常在檔導入之後就丟失了(有些特殊檔案格式確實會有保留機制),導入之後會統一還原為字串,需要我們自行根據其格式進行日期與時間格式的轉換。

R語言預設的日期格式按照識別優先順序,

分別是”%Y-%m-%d” 或者 “%Y/%m/%d”,倘若你導入之前的日期是此種格式,那麼在使用as.Date()格式進行日期轉換時,便無需顯式聲明該日期的原始格式,軟體會自動按照優先順序進行匹配轉換。

除了這兩種可自動識別的日期寫法格式之外,剩餘的日期格式均需要做格式聲明:

可以看到,只要正確聲明了原始的日期格式,as.Date()都可以完美的解析出標準日期並輸出。

當你已經獲得了一個標準日期格式之後,你可以通過format(date,format=) 函數進行日期元素的提取,比如你可以從標準日期中提取出年份、月份、具體日期、季度、星期、周度等。當然base包中也提供了一套簡單調用函數:

直接使用內置函數提取日期:

重點關注其中的前四個參數,start表示日期起點,end表示日期終點,periods表示日期長度,freq表示日期的頻率。(四個參數必須滿足其中三個方可輸出時間序列,freq有默認為天的從參數)。

當然Python序列處理的函數在Python中無處不在,這裡僅介紹以上幾個經常會用到的高頻函數。想要深入瞭解Python中的時間序列處理模式,還是需要深入研究其來源文件。

謝謝閱讀,原文連結

如有侵權請聯繫小編刪除!

重點關注其中的前四個參數,start表示日期起點,end表示日期終點,periods表示日期長度,freq表示日期的頻率。(四個參數必須滿足其中三個方可輸出時間序列,freq有默認為天的從參數)。

當然Python序列處理的函數在Python中無處不在,這裡僅介紹以上幾個經常會用到的高頻函數。想要深入瞭解Python中的時間序列處理模式,還是需要深入研究其來源文件。

謝謝閱讀,原文連結

如有侵權請聯繫小編刪除!