您的位置:首頁>正文

資料分析能力的核心是思維

對於業務人, 比如產品或運營, 資料分析能力的核心不在方法和工具, 而在於思維。

大多數人錯誤地理解了資料分析, 把資料分析能力提升的關鍵放在了方法和工具;對於業務人而言,
資料分析的核心思路是, 得到兩個變數之間的「量化關係」, 用以解釋現象;資料分析的步驟, 感知問題、提出假說、選擇表徵、收集資料、分析驗證;提出假說和選擇表徵是很多業務人資料分析做不下去的原因。 資料分析的方法崇拜

在和團隊小夥伴分享的的時候, 發現一個問題:

我問, 你怎麼看資料分析能力?如何評價自己的資料分析能力?

大家的回答主要是這樣的:

運營是基於資料驅動的, 但是拿著很多資料, 不能分析下去, 主要是對於excel的一些陌生的公式、函數都不太會, 我要專門去學一下excel

我感覺導致現在轉化率低低原因是xxx, 最近接觸到很多用戶都是這麼回饋的,

但還沒有找到好的分析方法

產品的資料分析能力還是很重要, 我想去學個R, 能夠去構建量化模型

……

以上, 我覺得太在意資料分析方法和工具, 我覺得都還沒有把握住一個業務人資料分析能力的核心。

業務人考慮的最重要的問題是, 業務結果到底怎麼樣, 出現了什麼問題, 原因是什麼, 可能的解決方案是什麼。

資料分析只是手段, 它的誤區就是, 太在意方法和工具。

而最缺少的, 恰恰是最重要的思維。

資料分析的本質

資料分析最重要的思維就是, 不斷確定業務中兩組變數之間的關係, 用以解釋業務。

收入、轉化、使用者規模、使用者活躍等, 我們稱為現象。 而只有通過資料量化的現象, 我們才能精准感知。 所以, 資料是用來描述現象的,

是被量化的現象。

而資料分析, 就是尋找這些被量化的現象之間的「關係」。 這個關係就是y=f(x)。 找到兩個變數之間的關係, 多找到一種這樣關係, 在實踐中, 就多一種有效手段。

比如, 做社群運營的同學, 常常會想, 到底什麼因素在影響用戶的活躍度。 在實踐的過程中, 我們感覺到, 不同的進入社群的時間點可能是活躍度比較關鍵的影響因素。 於是, 嘗試通過資料定義, 確定x=進群時間點與開群的時間差, y=第一月活躍率。 我們將x變數按天為單位氛圍不同類別, 得到了以下的關係:

*x變數每類樣本N>50, 且基本是同一時間的社群, 排除了其他因素影響

當我們得到以上圖示的關係其實足以指導我們的工作了——做社群運營, 儘量做到及時開群, 不要讓用戶等待, 消耗熱情。

所以, 資料分析最重要的思維就是, 不斷去尋找可能與業務結果有關的變數, 確定這兩個變數之間的關係。 多確定了一種關係, 就多了一種手段, 少了一些瞎幹。

要做到這些, excel的基礎功能, 妥妥解決。 通過統計學方法回歸分析出一個量化模型或論證其信效度。

因為, 對於大部分業務而言, 動作的精度有限, 所以不需要分析的精度太高, 同時, 統計方法的量化模型無法用業務邏輯進行解釋, 只能預測, 對於實操類業務意義不大。

業務中資料分析的一般方法

前面簡單說了資料分析的方法工具誤區和資料分析核心是要去尋找兩組變數之間的關係。

那在業務中, 如何進行有效的資料分析。 我將資料分析歸納為以下五個步驟:

第一步, 感知問題第二步, 提出假說第三步, 選擇表徵第四步, 收集資料第五步, 分析驗證第一步, 感知問題

如果沒有問題, 是不需要資料分析的。

但是, 那是不可能的。 KPI總是差點才達到, 即使達到了, 領導還會問你, 就不能做到更好嗎?

在業務中的問題有這樣兩種,一種是直接找最終結果的問題,比如收入比不上競品,DAU下降了10%等;一種是環節上的問題,拆解漏斗和業務環節,比如通過分析app資料漏斗,發現每日使用一次人數相對於每日打開人數相對於流失了30%等。

記住這樣一句話,但凡有差異,必有問題,但凡有問題,必要尋找原因。

這一步困難的不是有沒有問題,差距、不足總是在那裡。困難的是,能不能找到最重要,也就是最和業務結果相關的問題,優先順序排序是關鍵。

而排序的關鍵就是,基於最重要的結果或KPI的標準進行排序。不斷思考一件事,解決了這個問題能夠對結果有多大的改善?

第二步,提出假說

找到問題,下一步就是找方法解決。

在管理諮詢界有個說法,叫作不要煮沸海洋。說的是,把所有的,可能導致問題的因素全部找出來分析一遍,那是低效也是不可能的。

所以,這裡就需要使用到「假說」的方法。

哪些因素可能影響到收入?哪些因素會導致打開app的人不使用任何功能直接離開?

找到以上問題可能的答案的過程,就是提出假說的過程。

這裡有兩個路徑用來提出假說,一個是歸納的方式,一個是演繹的方式:

什麼是演繹式的,就是根據模型進行推演。比如在app打開不使用直接離開,我們可以根據對使用者行為模型的理解進行拆解,而拆解的有效與否,其實就是關於你模型多少、深度。

結合歸納式和演繹式的方法,我們會得到非常多的可能與結果相關因素。進行整理,並進行重要性排序。

到這裡,我們就找出很多可能、未經確定、未經量化的y=f(x),也就是一對對可能有關係的變數。

第三步,選擇表徵

不可被資料量化,就不能被改變。如前文所說,資料分析,需要將現象量化,得到可以分析的資料。

所以,需要將提出的假說中所選擇的變數,用資料來進行表徵。

在入群時間點對用戶活躍度影響的例子中,我們將入群時間點(x)定義為:入群時間與開群時間差;將活躍度(y)定義為用戶從進入起一周的活躍率,即一月內活躍天數的占比。

在選擇資料表征元素的時候,需要把握的原則就是:

選擇的資料能夠充分代表假說中變數的內涵;

選擇的資料儘量是使用者客觀行為資料而非主觀態度資料;

選擇的資料是有被記錄或容易獲取。

第四步,收集資料

互聯網的很大優勢就是資料驅動的,資料往往是被有效收集的。

但是,也存在資料沒有被記錄情況。支援產品功能的資料,會被記錄,但是很多行為資料只能通過調取介面資料或埋點的方式進行記錄。這就需要業務人能夠提前規劃所需資料,讓工程師將資料記錄在庫。

在收集資料的過程中,需要注意到就是有效資料量不能太小。

第五步,分析驗證

反倒是,分析驗證這個步驟變得不是那麼核心的步驟。

確定好了x與y的含義和資料,剩下的分析就很簡單了。通過資料視覺化的方式,表現出x與y的關係,就能發現其中是否存在有價值的規律。

發現x與y存在某種關係的時候,最好通過資料進行再次驗證。選擇另外一組資料,再次進行分析,看確定的關係是否再次被覆現。

當然,最重要的驗證是在業務實現中體現。

資料分析,一種必備能力

資料分析,是認識事物的重要方式之一,它的特點是定量的非定性的、過去的非未來的、相關的非因果的,有其適用範圍,但一定是所有業務人必須掌握的能力。

對於業務人,不用太崇拜於方法和工具,首先需要錘煉分析思維,尋找兩個變數的關係,真正指導業務才是關鍵。

而在分析的過程中,「提出假說」和「選擇表徵」是關鍵所在,也是很多業務人沒有能夠作出有效分析的關鍵所在。

本文由 @個家 原創發佈于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Pixabay,基於 CC0 協議

就不能做到更好嗎?

在業務中的問題有這樣兩種,一種是直接找最終結果的問題,比如收入比不上競品,DAU下降了10%等;一種是環節上的問題,拆解漏斗和業務環節,比如通過分析app資料漏斗,發現每日使用一次人數相對於每日打開人數相對於流失了30%等。

記住這樣一句話,但凡有差異,必有問題,但凡有問題,必要尋找原因。

這一步困難的不是有沒有問題,差距、不足總是在那裡。困難的是,能不能找到最重要,也就是最和業務結果相關的問題,優先順序排序是關鍵。

而排序的關鍵就是,基於最重要的結果或KPI的標準進行排序。不斷思考一件事,解決了這個問題能夠對結果有多大的改善?

第二步,提出假說

找到問題,下一步就是找方法解決。

在管理諮詢界有個說法,叫作不要煮沸海洋。說的是,把所有的,可能導致問題的因素全部找出來分析一遍,那是低效也是不可能的。

所以,這裡就需要使用到「假說」的方法。

哪些因素可能影響到收入?哪些因素會導致打開app的人不使用任何功能直接離開?

找到以上問題可能的答案的過程,就是提出假說的過程。

這裡有兩個路徑用來提出假說,一個是歸納的方式,一個是演繹的方式:

什麼是演繹式的,就是根據模型進行推演。比如在app打開不使用直接離開,我們可以根據對使用者行為模型的理解進行拆解,而拆解的有效與否,其實就是關於你模型多少、深度。

結合歸納式和演繹式的方法,我們會得到非常多的可能與結果相關因素。進行整理,並進行重要性排序。

到這裡,我們就找出很多可能、未經確定、未經量化的y=f(x),也就是一對對可能有關係的變數。

第三步,選擇表徵

不可被資料量化,就不能被改變。如前文所說,資料分析,需要將現象量化,得到可以分析的資料。

所以,需要將提出的假說中所選擇的變數,用資料來進行表徵。

在入群時間點對用戶活躍度影響的例子中,我們將入群時間點(x)定義為:入群時間與開群時間差;將活躍度(y)定義為用戶從進入起一周的活躍率,即一月內活躍天數的占比。

在選擇資料表征元素的時候,需要把握的原則就是:

選擇的資料能夠充分代表假說中變數的內涵;

選擇的資料儘量是使用者客觀行為資料而非主觀態度資料;

選擇的資料是有被記錄或容易獲取。

第四步,收集資料

互聯網的很大優勢就是資料驅動的,資料往往是被有效收集的。

但是,也存在資料沒有被記錄情況。支援產品功能的資料,會被記錄,但是很多行為資料只能通過調取介面資料或埋點的方式進行記錄。這就需要業務人能夠提前規劃所需資料,讓工程師將資料記錄在庫。

在收集資料的過程中,需要注意到就是有效資料量不能太小。

第五步,分析驗證

反倒是,分析驗證這個步驟變得不是那麼核心的步驟。

確定好了x與y的含義和資料,剩下的分析就很簡單了。通過資料視覺化的方式,表現出x與y的關係,就能發現其中是否存在有價值的規律。

發現x與y存在某種關係的時候,最好通過資料進行再次驗證。選擇另外一組資料,再次進行分析,看確定的關係是否再次被覆現。

當然,最重要的驗證是在業務實現中體現。

資料分析,一種必備能力

資料分析,是認識事物的重要方式之一,它的特點是定量的非定性的、過去的非未來的、相關的非因果的,有其適用範圍,但一定是所有業務人必須掌握的能力。

對於業務人,不用太崇拜於方法和工具,首先需要錘煉分析思維,尋找兩個變數的關係,真正指導業務才是關鍵。

而在分析的過程中,「提出假說」和「選擇表徵」是關鍵所在,也是很多業務人沒有能夠作出有效分析的關鍵所在。

本文由 @個家 原創發佈于人人都是產品經理。未經許可,禁止轉載。

題圖來自 Pixabay,基於 CC0 協議

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示