今天的文章中,我們將重點討論在數據科學研究中,數據分析問題的四種類型:描述、診斷、預測和規定。
在與數據科學領域的年輕數據分析師們交談時,我經常問他們,什麼是他們所認為數據科學家最重要的技能,他們給出的答案五花八門。
我告訴他們的答案是,數據科學家最重要的技能是將數據轉化為清晰而且意義明確的見解。這是一個經常被忽視的能力,瑞典統計學家Hans Rosling正是因此而聞名。
談到這個話題有必要談論一下幫助人們理解數據分析在形成有價值的見解過程中的角色的作用的工具。
其中一種工具就是分析的四維範例。
簡單來說,數據分析可以分為四個主要類別,我將在下面做出詳細解釋。
1.描述:發生了什麼事?
這是最常見的數據分析形式。在商業領域,它為分析人員提供了業務中關鍵指標和措施的。
每月損益表正是這樣的一個例子。
類似地,數據分析師可以通過大量的客戶數據,了解客戶的統計信息(例如我們的客戶中30%是個體經營者),這種可以被歸類為「描述性分析」。
利用有效的可視化工具能夠增強描述性分析的信息。
FineReport
2.診斷:為什麼會發生?
數據分析的下一步是解析性描述。
在對描述性數據進行評估時,診斷分析工具將使分析師具備深入分析的能力,從而剝離問題的根本原因。
精心設計的商業智慧信息儀錶板包含讀取時間序列數據(即多個連續時間點的數據),並具有數據過濾和挖掘的能力,可進行此類分析。
比如查看數據地圖,我發現江蘇的市場銷售額較高,想知道是什麼原因?於是點擊該省份,能定位到各類產品的銷售數據和響應的合作客戶數據。
3.預測:將來會發生什麼?
預測分析是為了預報。
無論是將來發生事件的可能性,預測可量化的數量還是估計可能發生事件的時間點,這些都是通過預測模型完成的。
預測模型通常利用各種可變數據進行預測。組件數據的變異性將與可能預測的關係(例如,一個較老的人,他們對心臟病發作的敏感程度越高,我們會說年齡與心臟病發作風險呈線性相關)。然後將這些數據一起編譯成分數或預測。
處在一個巨大不確定性的世界中,預測可以幫助人們做出更好的決定。預測模型是許多領域中最重要的模型。
4.規範:我需要做什麼?
在價值和複雜性方面的下一步是規範性模式。
規範模型利用對發生的事情的理解,為什麼發生了這種情況以及各種「可能發生的」分析,以幫助用戶確定採取的最佳行動方案。
規定性分析通常不僅僅是一個單獨的行動,而且實際上是其他一些行動。
一個很好的例子是交通應用程序能夠幫助您選擇最佳路線回家,並考慮每個路線的距離,每個路上可以行駛的速度,以及當前的交通限制。
另一個例子是製作考試時間表,保證所有學生的時間表不存在衝突。
因此,雖然不同形式的分析可能為企業提供不同數量的價值,但它們都具有自己的用處。
喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!