隨著觀測手段的不斷進步和長期觀測資料的不斷積累,
加上資料共用機制不斷完善,
生態學研究已經跨入的大資料的時代。
面對巨量的原始資料,
一個生態學者需要運用相當可觀的數學知識和程式設計技巧來把它們轉化成方便處理的有效資料。
因此,
現代生態學研究對研究者的資料分析和處理能力要求更高。
傳統的統計軟體已經很難滿足當前的資料分析需求。
近年來,
R語言以其靈活、開放、易於掌握、免費等諸多優點,
在生態學研究各領域迅速傳播並贏得廣大研究者的青睞和應用。
為了證實這個結論,
我們通過逐篇查閱的方式,
統計近5年來(2012-2016)20種影響因數3以上與生態學SCI雜誌20325篇研究論文(不包括綜述)使用R語言作為資料分析工具的情況(圖1和圖2)。
結果表明,
2012年這20種刊物總發表研究論文數為3845篇,
使用R語言作為資料分析工具的為1309篇,
使用比例為33.9%;2013年總發表論文數為4180篇,
使用R語言為1607篇,
使用比例為38.7%;2014年總發表論文數為4169篇,
使用R語言為1831篇,
使用比例為42.1%; 2015年總發表論文數為4030篇,
使用R語言為1942篇,
使用比例為49.0%;2016年總發表論文數為4101篇,
使用R語言為2206篇,
使用比例為54.2%。
可見近5年來,
生態學研究論文使用R語言作為分析工具比例呈現快速增長趨勢,
並在2016年已經超過50%,
占居半壁江山,
以不爭的事實說明R語言已經成為生態學研究中最主要的資料分析工具(圖2)。
2016年使用R比例最高前三個刊物分別為Ecography(75.6%),
Journal of Ecology(73.8%), Methods in Ecology and Evolution (70.1%),
這三個刊物使用R的論文比例均超過70%。
圖1.近5年來20種SCI生態學雜誌所發表的研究論文使用R語言作為資料分析工具的比例趨勢
圖2. 20種SCI生態學雜誌所發表的研究論文使用R語言作為資料分析工具的平均比例趨勢
以上統計結果表明,
在國際上選擇R語言作為生態學資料分析工具已經成為“標配”。
但相比國際SCI刊物,
國內生態學刊物內論文選擇R作為資料分析工具比例卻比較低。
我們用同樣的方法查閱了4個國內生態學雜誌:《生態學報》、《植物生態學報》、《生物多樣性》和《應用生態學報》近5年來所發論文R語言使用比例。
結果表明,
雖然使用R的比例也正呈現逐年增加的趨勢(圖3),
但是還是處於相當低的水準。
《植物生態學報》和《生物多樣性》這兩個刊物目前已經達到10%以上,
但是《生態學報》和《應用生態學報》這兩個刊物的使用R比例僅有1.3%左右,
跟SCI刊物比相差甚遠。
說明R語言在國內學者和研究生中使用普及率並不高,
可能有幾個方面的原因:1)雖然R語言的設計之初就是避免通過大量程式設計實現統計演算法,
但最基本的程式設計能力還是需要的,
因此對於一般非電腦專業的研究人員來說無疑提高了難度。
2)掌握統計學知識,
提高邏輯分析能力是用好R的非常重要的條件,
但國內研究人員和研究生統計學基礎普遍比國外的同行弱;3)與其他的技能一樣,
學會熟練使用R語言也並非一日之功。
當前國內普遍浮躁的學術氛圍下,
很多研究人員和研究生們不願意花很多時間來學習R語言,
他們更習慣打開一個功能表驅動的統計平臺,
並在幾分鐘內得到結果;4)最後應該歸咎於R語言所有説明系統都為英文版本,
在國內普及起來難度比較大。
總之,在學術界R語言得到廣泛的應用,這已經成為大家公認的事實。如果現在不會R,你沒有優勢可言;如果5年後,你還不會R,那你差不多就可以被淘汰了。當然R畢竟只是程式語言,是程式設計軟體,是解決問題的手段。它猶如降龍十八掌的最後一掌,是前面所有功力的集中體現。掌握統計學知識,提高邏輯分析能力是我們用好R需要修煉的內功。
致謝:感謝中國科學院大學資環學院“植物生態學研討課”所有選課研究生幫忙查閱資料。
總之,在學術界R語言得到廣泛的應用,這已經成為大家公認的事實。如果現在不會R,你沒有優勢可言;如果5年後,你還不會R,那你差不多就可以被淘汰了。當然R畢竟只是程式語言,是程式設計軟體,是解決問題的手段。它猶如降龍十八掌的最後一掌,是前面所有功力的集中體現。掌握統計學知識,提高邏輯分析能力是我們用好R需要修煉的內功。
致謝:感謝中國科學院大學資環學院“植物生態學研討課”所有選課研究生幫忙查閱資料。