FacebookTwitterLineHatena


經常有人說,我不是專業的資料分析師,但工作中常常需要分析資料才能推進業務,有沒有一種簡單粗暴的方式可以讓我快速上手資料分析呢?

當然有啊!只需要掌握以下的框架,這些擔憂通通拋到腦後!

一、 資料分析目標:以量化方式來分析業務問題

現代管理學之父彼得·德魯克說過一句很經典的話:

如果你不能衡量它,那麼你就不能有效增長它。

所以,我們做資料分析是為了能以量化的方式來分析業務問題,並得出結論。其中有兩個重點詞語:量化和業務。

1、量化

量化是為了統一認知,並且確保路徑可回溯、可複製。 統一認知後,才能保證不同層級、不同部門的人在平等話語權和同一個方向上進行討論和協作,才能避免公司內的人以「我感覺」、「我猜測」來判斷當前業務的情況。

例如,這個產品功能上線後效果怎麼樣?A方案和B方案哪個更好些呢?諸如此類的問題,都牽涉到一個“標準”的問題,如果標準是這個功能必須有200人以上使用,那只有100人使用都不叫效果好。只有給出真實、可靠、客觀的事實資料,才能對具體的活動作出最真實的評判。

2、業務

只有解決業務問題分析才能創造價值。價值包括個人價值和公司價值。對於公司來講,解決業務問題可以提高收益或者降低成本;對於個人來講,知道怎麼利用資料解決業務問題,對個人的能力成長和職業生涯都有非常大的幫助。

二、一切資料分析的核心是:分析方法

資料分析是基於商業目的,收集、整理、加工和分析資料,提煉有價值資訊,並指導實踐的過程。

在實際應用中,資料分析可説明人們作出判斷,以便採取適當行動。但資料本身其實並沒有任何價值,是分析方法的存在使得原本毫無價值的資料大放異彩。資料分析的三大作用,主要是現狀分析、原因分析和預測分析。

這裡著重說下預測分析:

預測性分析則可以讓分析員在觀察資料分時通過視覺化的分析以及資料得到的結果更加有用,並且能獲得一些預測性的判斷。有一些情況,可以給出建議,比如銀行可根據申請人的基本資訊,包括學歷、收入、是否有車、是否有住房、存款金額、是否有違約記錄等,去建立模型預測其信用違約的風險有多大,進而給出建議是否要給這個申請人發放信用卡,如果要發放,信用卡的額度又該是多少。

預測性分析實戰銷售篇可參考:銷售真的可以精準預測,只要你這樣分析!

三、資料分析的重要基礎:指標體系

1、資料分析的第一步就是建立指標體系

那什麼是指標呢?假設隔壁老王開了一家水果鋪子,你問他每天生意怎麼樣,他可以回答賣的「不錯,很好」、「最近不景氣」。這些都是很「虛幻」的詞,因為他認為賣的不錯也許是賣了50個,而你認為的賣的不錯,是賣了100。老王想要描述生意,他應該使用銷量,這就是他的指標。

互聯網想要描述產品,也應該使用活躍率、使用率、轉化率等指標。

在建立指標體系的過程中,我們知道孤立的指標發揮不出資料的價值,和分析思維的金字塔結構一樣,指標也有固有結構,呈現樹狀。

我們在考慮問題的時候都會遵循一個思路,例如從宏觀到微觀,從全域到局部,資料分析也不例外。例如產品營運中的資料分析指標體系:

需要注意的是,指標體系沒有放之四海而皆準的範本,不同業務形態有不同的指標體系。行動APP和網站不一樣,SaaS和電子商務不一樣,低頻消費和高頻消費不一樣。好比一款婚慶相關的APP,不需要考慮複購率指標;互聯網金融,必須要風控指標;昨日突破了2135億成交額的天貓雙十一,它屬於電子商務,所以賣家和買家的指標也各不一樣。這些需要不同行業經驗和業務知識去學習掌握。

2、不是所有的指標都是好的。

美國矽谷增長駭客專家曲卉提出了產品的「北極星」指標。定義北極星指標有6個標準:

①這個指標可以讓你知道你的使用者體驗到了產品的核心價值嗎?

②這個指標能夠反映用戶的活躍程度嗎?

③如果這個指標變好了,是不是說明整個公司是在向好的方向發展?

④這個指標是不是很容易被整個團隊理解和交流呢?

⑤這個指標是一個先導指標,還是一個滯後指標?

⑥這個指標是不是一個可操作的指標?

北極星指標和公司發展相關聯,是公司在一個階段內的重點方向。記住是一個階段,不同時期的北極星指標不一樣。不同業務的北極星指標也不一樣。

如何用FineReport製作北極星指標,感興趣的朋友多嗎?可以評論回復+1

四、如何保證資料分析全面性:維度分析法

確定了資料分析的核心目標,就可以著手進行分析了。資料分析大體可以分三類:

①利用維度分析資料

②使用統計學知識如數據分佈假設檢驗

③使用機器學習

這裡我著重講下資料分析思路-利用維度分析資料這個方法:

第一類:利用維度分析資料

利用維度分析資料是一種自上而下的思路,這種思路多是用於產品的資料分析體系或者模型的建立,從而保證資料分析的全面性。具體的思路為:

維度是描述物件的參數,在具體分析中,我們可以把它認為是分析事物的角度。銷量是一種角度、活躍率是一種角度,時間也是一種角度,所以它們都能算維度。當我們有了維度後,就能夠通過不同的維度組合,形成資料模型。資料模型不是一個高深的概念,它就是一個資料立方體。可以更多地關注多個資料維度之間的相關關係,透過影響關鍵指標的資料維度間的關聯關係,建立資料分析模型。

我們以營運帆軟社區來說,在社區營運過程中最基本的模型就是使用者的金字塔模型。這個金字塔模型的建立是依據使用者的活躍度和貢獻值來建立的,金字塔模型會將使用者分成幾個層級,層級越往上用戶的價值越大,貢獻值越高。當然這個使用者金字塔模型的建立一定不是固定的,而是根據具體的社區資料情況會在層級劃分和每個層級占比上都會有所不同,並且每個層級的具體需求和營運方式都是不同的。

社區發帖量這一核心資料指標提升,是與整個社區的使用者量,使用者層級比例,使用者層級轉化,每個層級使用者行為,使用者粘性,社區內容品質, 內容展示與推送情況等都存在一定的相關關係。所以在社區的營運過程中就要不斷的促進各個影響維度與社區發帖量的正向關係,那麼社區發帖量與其他資料維度的關聯關係如何建立呢?

我們嘗試著做了一個簡單的梳理,相應的資料維度並未全部包含,此關係圖仍需完善,此處只是給出一種梳理思路,具體如下:

說到看維度,在對某一項業務或者業務的某個模組進行分析時,可以從大小兩個角度去切入分析。

首先站在廣闊的視角去看待一些資料。比如對某個產品(消費品),就要分析在大環境下是一個什麼樣的資料,如市場排名,市場佔有率。還要記錄市場整體波動情況,競品的資料。這些一般可以透過協力廠商調研機構或者行業報告獲得。

然後需要分析針對這個產品你內部關心的資料是什麼。比如每月每週的銷售量,各管道的銷售量,廣告、促銷活動、線下活動、聯合活動等帶來的銷售的提升和品牌知名度的提升。

當瞭解完以上的資料,就應該對這個產品方方面面的情況有個宏觀的瞭解,對需要提升哪些資料指標有了一個清晰的認識。之後就是細化到某個模組維度進一步分析,比如電商管道需要關注的多一些,DAU、WAU、客單價、複購、使用者流失等等,每個模組都可建立漏斗資訊。實際分析時還要關注資料異常,做針對性分析。

發現資料異常,該從哪幾個維度去分析?

有時候總量的角度是無法看出問題的,比如銷售額、UV下降了,我們需要進一步細化去分析。看銷售額總量的時候明顯是下降了,先確定大的市場有沒有波動,競爭對手有沒有動作,需要查看市場總額以及競爭對手每個品類的資料。

然後分析自身,每個管道的銷售額情況監測,每個區域的銷售額情況,每個時間段的銷售情況,把活動時間比如五一的資料扣除擬合,將有問題的標記出來。如果是管道問題優化管道,如果是市場波動,需要全域考慮戰略和市場對策。所以如果是銷售額的分析,需要從管道、活動時間點、地域等情況去深入分析。

比如,是不是因為一場大型活動導致銷量有個明顯的上升趨勢?是不是因為上周搞了促銷活動,導致本周一線業務員有個消極緩衝的時段,整體銷售額低迷。

另外,資料異常也不是什麼壞事,如果再資料分析過程中發現某資料表現極好,比如某管道的銷售增長率很高,是不是可以思考為什麼會這樣,有什麼好的經驗借鑒,甚至是不是要考慮調整管道的投放比率。

掌握這個分析方法,資料分析就學會了一半

說到維度法,我們知道單一的資料沒有分析意義,只有多個資料組合才能發揮出資料的最大價值。在此,我想強調的一個分析的核心思維:對比。

做不同維度的對比大概是新人快速提高分析能力的捷徑之一。比如,過去和現在的時間趨勢對比、不同地區維度的對比、產品類型的區別對比、不同使用者的群體對比等。

對比分析方法,具體可參考這篇文章:掌握這個分析方法,資料分析就學會了一半

第二類:使用統計學知識如數據分佈假設檢驗

使用統計學知識如數據分佈假設檢驗是一種自下而上的思路,這種思路多用在針對已有資料包表中的資料問題發現,具體思路:

第三類:使用機器學習

針對當前生產和生活中面臨的安全事故問題,利用當前發展迅速的DM(Data Mining)技術,透過對事故資訊的多維度分析,實現監測系統的事故預測,提高了監測系統的性能,形成安全預警機制。

五、日常資料分析中需要避開的踩雷

1、控制變數

在做 A/B 測試時沒有控制好變數,導致測試結果不能反映實驗結果。或者在進行資料對比時,兩個指標沒有可比性。

2、樣本

在做抽樣分析時,選取的樣本不夠隨機或不夠有代表性。舉例來講,IT圈的人會發現身邊的人幾乎不看「蘋果日報」,為什麼這 APP 還能有這麼大流覽量?有個類似的概念,叫倖存者偏差。

3、定義

在看某些報告或者公開資料時,經常會有人魚目混珠。「網站訪問量過億」,是指的訪問使用者數還是訪問頁面數?

4、比率

比率型或比例型的指標出現的謬誤以至於可以單獨拎出來將。一個是每次談論此類型指標時,都需要明確分子和分母是什麼。另一方面,在討論變化的百分比時,需要注意到基數是多少。有些人即使工資只漲10% ,那也可能是150萬…

5、因果相關

會誤把相關當因果,忽略仲介變數。比如,有人發現雪糕的銷量和河溪溺死的兒童數量呈明顯相關,就下令削減雪糕銷量。其實可能只是因為這兩者都是發生在天氣炎熱的夏天。天氣炎熱,購買雪糕的人就越多,而去河裡游泳的人也顯著增多。

6.辛普森悖論

簡單來說,就是在兩個相差較多的分組資料相加時,在分組比較中都佔優勢的一方,會在總評中反而是失勢的一方。

六、要點複習

  1. 還記得“如果你不能衡量它,那麼你就不能有效增長它”這句話嗎?我們做資料分析是為了能以量化的方式來分析業務問題。其中有兩個重點詞語:量化和業務。
  2. 資料本身並沒有任何價值,而一切資料分析的核心是分析方法。資料分析的三大作用,主要是現狀分析、原因分析和預測分析。
  3. 資料分析的第一步就是建立指標體系,但是不是所有的指標都是好的,我們需要找到產品的“北極星”指標。除此之外,不同時期的北極星指標不一樣,不同業務的北極星指標也不一樣。
  4. 資料分析大體可以分三類:利用維度分析資料、使用統計學知識如數據分佈假設檢驗、使用機器學習。
  5. 維度分析資料是一種自上而下的思路,這種思路多是用於產品的資料分析體系或者模型的建立,從而保證資料分析的全面性;使用統計學知識如數據分佈假設檢驗是一種自下而上的思路,這種思路多用在針對已有資料包表中的資料問題發現。

免費下載FineReport10.0

獲得帆軟最新動態:數據分析,報表實例,專業的人都在這裡!加入FineReport臉書粉絲團

相關文章:
這7種回歸分析方法,資料分析師必須掌握!

資料分析裡最能掙錢的工具模型是哪個?你可能天天在用呢!

寫給資料分析入門者:一種通用的資料分析思路

10年數據老手建議:從入門到專家,如何規劃資料分析職涯

喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!

熱門文章推薦

立即試用,可獲取更多 報表範本和案例

免費試用