FacebookTwitterLineHatena

箱型圖(盒鬚圖)是大家在日常工作和科研中經常被使用到的一類圖表。在學習和工作中,大家對長條圖、圓餅圖等基礎圖表類型的製作一定是非常熟悉了,但是要製作出足夠專業的報表,絕對少不了使用像箱型圖這樣更專業實用的圖表。

那麼今天就帶大家來認識一下箱型圖,箱型圖所包含的元素較多,使用起來略微有些複雜。本文就詳細地解讀一下箱型圖的各種元素、以及如何分析、如何製作。

一、什麼是箱型圖(盒鬚圖)?

箱型圖,也叫盒鬚圖、盒狀圖,因為形狀長得像箱子而得名。1977年,美國著名數學家John W. Tukey首先在他的著作《Exploratory Data Analysis》中介紹了箱形圖。

箱型圖主要用於顯示一組連續型資料分佈情況的統計圖,當需要了解資料分佈特徵或需要查看資料中的異常值時,可以使用箱形圖進行資料分析。

箱型圖可以直觀地看出一組資料的分佈情況,能夠快速識別異常值。

二、箱型圖怎麼看?

那箱型圖中的資料要怎麼來分析呢?我們拿一張箱型圖範例來分析一下其中的各個概念。

箱型圖(盒鬚圖)範例
箱型圖範例

箱子的頂端和底端,分別代表了上下四分位數。位於箱子中間的一條線代表了中位數,它將箱子一份為二。

在箱子的外面延伸出去的線條展示了上下四分位數之外的數據。由於這兩根延伸出去的線像是鬍鬚,因此箱形圖也被稱為盒須圖。

有時,箱形圖上也會出現個別的點,在鬍鬚的末端值以外,這代表離群值,也可稱之為異常值。箱形圖是非參數的:它們顯示統計總體樣本的變化,而不對基礎統計分佈做任何假設。框的不同部分之間的間距表示數據中的分散程度(擴散)和偏斜,並顯示異常值。

具體的資料計算方法如下:

  • 最大值:經過計算,用以區分異常值的最大值,不是資料的最大值。最大值=Q3+1.5*IQR。
  • 上四分位數:該樣本中所有數值由小到大排列後第75%的數字。
  • 中位數:該樣本中所有數值由小到大排列後第50%,也就是最中間的數字。
  • 下四分位數:該樣本中所有數值由小到大排列後第25%的數字。
  • 最小值:經過計算,用以區分異常值的最小值,不是資料的最小值。最小值=Q1 – 1.5*IQR。
  • 四分位間距:Q3和Q1的差值,即Q3-Q1,一定程度上反映了資料的集中程度,間距越小說明資料越集中。
  • 異常值:落在最大最小值以外的資料點。

三、箱型圖(盒鬚圖)適合用於什麼時機?

用一句話概括來說,箱型圖適合用於展示频率分布对比关系 。

這種對比關係表示有多少個專案或類別符合一個數字發展的範圍。 比如,我們用一個頻率分佈對比關係來展示我司有多少員工的月薪超過5萬元,有多少員工的月薪處於3-5萬元之間,有多少員工的月薪在1-3萬元區間等,或者有多少員工的年齡小於25歲,25-30歲員工人數有多少、超過30歲的員工人數有多少等。

這種對比關係的關鍵字包括:x到y的範圍、密度、頻率、分佈等。  

箱型圖(盒鬚圖)範例

箱形圖包含的元素雖然複雜,但也正因此,它擁有許多其他圖表無法替代的功能:

1、直觀地識別異常值

箱形圖可以用來觀察資料整體的分佈情況,利用中位數,25/%分位數,75/%分位數,上邊界,下邊界等統計量來描述數據的整體分佈情況。箱體包含了大部分的正常數據,而在箱體上邊界和下邊界之外的,就是異常數據。

2、判斷數據的偏態和尾重

對於標準正態分佈的大樣本,中位數位於上下四分位數的中央,箱形圖的方盒關於中位線對稱。中位數越偏離上下四分位數的中心位置,分佈偏態性越強。異常值集中在較大值一側,則分佈呈現右偏態;異常值集中在較小值一側,則分佈呈現左偏態。

3、比較多组资料的形狀

箱子的上下線,代表了上下四分位數。這說明箱子包含了50%的數據。因此,箱子的寬度在一定程度上反映了數據的波動程度。箱體越扁說明數據越集中,端線(也就是“須”)越短也說明數據集中。

憑藉著這些“絕技”,箱線圖在使用場景上也很不一般,最常見的是用於品質管理、人事測評、探索性分析等統計分析活動

比如下面這張箱型圖範例就體現了某企業員工工資調整前後的情況,工資分布比調整前更加集中,在合適的範圍內既拉開了差距,又不至於差距太懸殊,還針對特殊情況進行了特殊處理。這種工資分布具有激勵員工的作用,可以說調整達到了預期。

箱型圖(盒鬚圖)範例
箱型圖範例

四、如何快速製作一張箱型圖(盒鬚圖)?

在Excel中製作箱型圖是比較麻煩的,而且很難將箱型圖和其他圖表相結合進行報表製作與分析,這個時候就需要用到專業的圖表製作工具

推薦大家一款專業的圖表製作和資料視覺化軟體:FineReport,它內置了資料視覺化所需要的19 種圖表大類和超過 50 種動態圖表樣式,其動態圖表支援豐富的交互效果,讓使用者簡單明了、方便快捷的理解和利用數據資料。

FineReport支援19 種圖表大類和超過 50 種動態圖表樣式
FineReport支援19 種圖表大類和超過 50 種動態圖表樣式

接下來就展示一下如何使用FineReport快速製作一張專業的箱型圖(盒鬚圖):

1、插入圖表

在FineReport的設計器中插入型別為箱型圖的圖表。

FineReport的設計器採用類Excel,非常好上手直接使用,幾乎不需要學習成本。

FineReport插入圖表
插入圖表

2、資料綁定

將資料集和已經插入的箱型圖進行綁定。

箱形圖可使用有兩種資料形式:結果箱形圖和明細箱形圖。結果箱形圖:資料為結果資料,亦即使用直接儲存於資料集的統計資料,作為箱形圖的統計量。明細箱形圖:資料為明細資料,亦即箱形圖的統計量由FineReport根據資料集自動進行計算。

也就是說,如果資料集的數據是已經算好的,FineReport會自動取數,如果是沒算好的,那麼FineReport會自動進行計算。

FineReport資料綁定
資料綁定

3、樣式設定

FineReport支援對圖表進行豐富的樣式設定,比如邊框、顏色等等,還可以設置圖表的正常值與異常值。

FineReport樣式設定
樣式設定

4、圖表預覽

完成樣式設定以後,既可以預覽做好的箱型圖。

箱型圖預覽
箱型圖預覽

五、箱型圖(盒鬚圖)製作要點

最後,為了幫助大家能做出直觀又美觀的圖表,再分享一些製作箱型圖(盒鬚圖)的一些注意點,

1、箱型圖不適用於分組太多的情況

當一張圖表中的分組太多時,如果用了箱型圖,箱型會太多,此時很難從圖中看出資料分佈的情況。

箱型圖範例
箱型圖範例

2、箱型圖不適用於顯示資料的變化

箱型圖能夠直觀地看出一組資料的分佈情況,能夠快速識別異常值,但不適用於顯示資料的變化。

3、箱型圖不適合查看某一組數據的詳細分佈情況

箱線圖只能展示某一組數據的資料概況,要看詳細分佈可以考慮使用小提琴圖

對箱型圖的詳細分析就到這裡,往期的圖表系列文章可以點擊下方鏈接查看>>>

甘特圖詳解與製作

長條圖詳解與製作

折線圖詳解與製作

散佈圖詳解與製作

圓餅圖詳解與製作

雷達圖詳解與製作

點擊下方圖片可以免費下載FineReport最新全功能版本,快來優化你的報表製作之旅吧!

FineReport

喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!

熱門文章推薦

立即試用,可獲取更多 報表範本和案例

免費試用