データドリブンの重要性が高まっている現代社会において、データ分析職の人に限らず、一般のビジネスパーソンも仕事でデータ分析を行う必要があります。
分析方法には様々な種類があります、分析の目的によって、分析方法の選択も変わってきます。データ分析の知識を持っていない方はいざはじめようと思っても、どんな手法を使うか迷うことがよくあるでしょう。本記事はビジネスシーンでよく使われる13選のデータ分析手法をご紹介します。
データ分析とは
データ分析は、通常ビジネスの意思決定に役立つ情報を発見するために、データを処理、変換、およびモデリングするプロセスとして定義されます。
データ分析に必要なデータは、特定のテーマに関するさまざまなソースから収集されます。データを集めたら、仮説を検証したり、調査レポートを作成したりするために、クロス集計やクラスター分析、回帰分析などのデータ分析手法を駆使し、データを整理・分析ます。
ビジネスの様々な場面にデータ分析意識が必要です。データ分析の第一歩は分析の課題を明確にすることです。経営面でのデータ分析なのか、マーケティングデータの分析なのか、それとも販売に関する分析をしたいのかなど、ビジネスニーズと目標感覚を明確します。
データ分析の手法とは
データ分析の手法には目的や分野、データ分析ツール別に様々な種類と方法がありますが、主に定量分析と定性分析という二種類に含まれています。
定量データ分析
定量データ分析とは「数値データ」を元に分析する手法です。具体的にはWebサイトのアクセス数、客単価、純利益など、客観的に事象を評価するものを指します。定量データ分析は人の経験や勘に左右されないメリットがあります。ただし、分析結果の確実性を保証するために、一定よりたくさんのサンプルを集める必要があります。
定性データ分析
一方、定性データ分析とも数字を使わず、「質的データ」を元に分析する手法です。例えば、お客様に対して製品利用の気持ちに関するアンケートを実施する際に、数値だけで表せない情報があります。あるいは、 性別、花の種類、天気(晴れや雨)など。定量データ分析に比べて客観性に欠けるというデメリットがあります。しかし、全体の課題や論点を俯瞰するための大局的な情報を読み取れます。
(画像出典:nurseamygdala.wordpress.com)
定量分析と定性分析はそれぞれの特長を持つので、実際にデータを分析際に、二者を組み合わせることが多いです。このように、両方の効果を最大限に引き出し、分析結果の精度が向上するはずです。
データ分析手法13選
データ分析は、統計学や機械学習、データ可視化を含む様々な分析手法やツールを用い、データ分析の結果をビジネスに有用な情報へと置換する過程です。以下はそれぞれのデータ分析の手法を見ていきましょう。
統計学
1.クロス集計
クロス集計とは、質問項目を掛け合わせて集計するデータ分析手法です。Excelの「ピボットテーブル」という機能を使えば効率よく簡単にできます。
例えば、「当店のサービスに満足しましたか?」というアンケートを取り、集まったデータに基づき、『年代別』と『サービスの満足度』を使ったクロス集計表を作れば、『30代と40代』で『サービスの満足度』はどのくらい違うのかを明らかにすることができます。
2.クラスター分析
クラスター分析は異なる性質のデータが混ざり合った集団から、類似したデータ同士をいくつかのクラスター(グループ)に分類する分析手法です。グループ分けのための計算方法の違いで、大きく2つの方法に分類されます。1つは階層的手法で、似た者同士をまとめていくつかのクラスターにまとめる方法です。もう1つは非階層的手法で、似た者同士が同じクラスターに所属するように全体を分割する方法です。
クラスター分析の応用例として、ユーザーの特性に合わせた内容のダイレクトメール(DM)の配布や商品レコメンドなどがあります。
3.回帰分析
結果となる数値と要因となる数値を解析し、両者間の関係を明確にする分析手法です。要因となる数値は「説明変数」、結果となる数値は「目的変数」といいます。説明変数が1つある場合は単回帰分析、複数ある場合は重回帰分析です。目的変数が0から1の範囲に収まるのはロジスティック回帰分析です。
回帰分析はある変数が他の変数の動作に影響する可能性がある場合に用いられ、事象の予測・シミュレーション、検証、要因分析などに有効です。例えば、物価と需要、家の広さと家賃の高さなど。
4.因子分析
たくさんの変数の背後に潜んでいる共通因子を抽出するデータ分析手法です。因子分析は、心理や経済学などの複雑な課題における変数関係の研究及び、今ビジネスのマーケティングリサーチの分析に使われます。
5.時系列分析
時間の経過に伴い変化するデータ、いわゆる時系列データを分析する手法です。時系列分析によって、長期増加や長期減少、季節性を考慮したデータの変動を予想することができす。 例えば、年々増加する二酸化炭素濃度、春と秋には少なく夏と冬に多いガスの消費量。
6.判別分析
データを分類する手法のひとつです。つまり、グループのわかっているデータがあり、新しいデータの属性値によって、それをどのグループに入れるかを予測します。判別分析は様々な用途別で使われます。例えば、検査結果から病気の有無の判別、顧客の将来的な発注予測など。
データ視覚化
6.チャート
チャートは1つまたは複数のデータセットを視覚化するための最も簡単な手法です。 チャートは、時間の経過に伴う要素間の関係を示す棒グラフや折れ線グラフから、要素が全体に対する割合を示す円グラフまで、多岐にわたります。
7.プロット
プロットは2つ以上のデータセットを2Dまたは3D空間に分散し、これらのセットとプロット上の変数の関係を表示します。 プロットにも様々種類があります。散布図とバブルチャートが最も伝統的です。 ビッグデータに関しては、アナリストはボックスプロットを用い、大量の異なるデータ間の関係を可視化します。
8.地図
地図は多くの業界で広く使用されています。 エリア地図、建物の計画、Webサイトのレイアウトなどに要素を配置することができます一番使う地図は、ヒートマップ、ポイントマップと色塗りマップです。
9.ダイアグラムとマトリックス
ダイアグラムは通常、複雑なデータの関係とリンクを示し、さまざまなタイプのデータを1つの画面に含めたい時に使用されます。階層、多次元、ツリーのようなものとなります。
マトリックスは、複数の常に更新するデータセット間の相関関係を反映できるビッグデータ視覚化の手法です。
AI・機械学習
11.アソシエーション分析
アソシエーション分析はデータの中から意味のある関連性を抽出するデータ分析手法です。マーケティングで「商品Aを買う顧客が商品Bも買う可能性がどのくらいか」の予測に用いられるので、マーケット・バスケット分析とも呼ばれます。
アソシエーション分析の結果は、売れ筋商品と死筋商品を見つけ、売上アップのためのアップセル、クロスセルを実施する上でヒントを与えます。
12.決定木分析
機械学習の手法の一つとして、分類または回帰分析を行う樹木型のモデルです。データセットを小さなサブセットに分割し、同時につながる枝のように展開します。決定木は結果にたどり着く原因を示すために利用されます。
決定木分析が活用される代表的なビジネスシーンとして、顧客別の購買履歴から自社の製品を購入している顧客の特徴の分析や機械の動作ログから故障につながる指標の発見などが挙げられます。
13.ファジー論理
確率ベースのデータ分析手法の1つとして、人間の言語や推論に含まれるあいまい性を一種の確率変数として、1~0間の数で表します。真理値の範囲は完全の真から完全の偽までとなります。値を正確に決定できない変数が含まれている場合、またはこれらの値に高いレベルのノイズが含まれている場合、ファジー論理が適用されます。
どのデータ分析手法が一番いい?
以上はデータ分析の定義、種類と手法を解説しました。こんなに多くのデータ分析の手法に対して、「どの手法が一番いい」と聞きたい方がいるでしょう。データ分析に最適な手法がないといえます。この13の手法はそれぞれの役割、メリットとデメリットがあります。どの手法を使うかは課題とデータの性質により、何種類の手法でデータを分析することがほとんどです。
効率よくデータ分析の手法を活用し、結果を出すには、BIツールと組み合わせた方がいいと思います。例えば、FineReportはデータ分析、可視化及びレポート作成に特化したBIツールです。ドラッグ&ドロップでデータを集計し、チャートとプロット図をキレイに作れます。無料トライアル版を提供するので、ぜひ試してみてください。