コラム|TOPPANクロレ

データマイニングとは?購買行動を販売施策に活かす分析手法|TOPPANクロレ

作成者: クロレDIGITAL|2021/05/17 0:00:00

顧客の購買行動は多種多様。どの行動がより多くの人に当てはまるかを予測することは、店員の長年の勘に頼らざるを得ませんでした。
それを客観的なデータで予測可能にしたのが、「データマイニング(data mining)」です。
データマイニングを理解して、顧客の購買行動から生み出される情報をデータとして蓄積し、それを分析することによって効果的な販売施策に活用しましょう。

目次

データマイニングとは?

データマイニングとは、膨大なデータのなかから特定のパターン、関連性を見つけ出し、問題解決に役立てる分析手法です。

「マイニング(mining)」は日本語で「採掘する」という意味です。鉱山から価値のある鉱物資源を採掘するように、大量のデータから有益な情報を掘り出すことを表しています。

現在のデータマイニングは、膨大なデータ量を効率よく処理するためにビッグデータやAI、IoTと関連づけて語られることが多くなりました。コンピューターは処理速度が日々向上しているので、データマイニングツールによっては解析の自動化、リアルタイム分析、きめ細かな条件設定・変更によるシミュレーションも可能です。

データマイニングで得られる知識

データマイニングを行うことで得られる知識は、下記の4つに分類されます。

データ(Data):収集された未整理の数値や素材

情報(Information):「データ」を整理・カテゴライズしたもの

知識(Knowledge):「情報」を分析して得られた傾向や知見

知恵(Wisdom):「知識」を利用して判断する力


これらは頭文字をとってDIKWモデルと呼ばれていて、下にいくほど有用性が高いといわれています。データマイニングの領域は、データを整理して情報にし、そこから知識を得る3つ目までの部分です。得られた知識の有用性を見極めて正しく判断するのは、扱う人のスキルに依存します。

データマイニングの手法

データマイニングは、分析する目的によって手法も異なります。よく用いられる、代表的な分析手法を紹介します。

クラスター分析(クラスタリング)

ロジスティック回帰分析

データマイニングの3要素

さて、データマイニングをビジネスに生かすには「分類」「相関」「予測」の3要素を上手に利用することが重要です。それらをビジネスのどこに生かすことができるか、順に解説しましょう。

1)分類

  • 市場におけるポジション・セグメントの把握
    データマイニングを活用すれば、市場における商品やサービスのポジションを押さえた適切な施策の設計が可能です。後述のカード・マーケティングやデータベース・マーケティングと組み合わせることで、顧客を分類(グルーピング、クラスタリング)してどのセグメントに属するかを判断します。
  • カード・マーケティング
    商品やサービスの販売の場合、ポイントカード、クレジットカードにひもづいた顧客情報を解析することができます。住所や年齢といった基本情報、家族構成や年収などの属性情報、また、購入場所や品目などの購買履歴によって、グルーピングを行うのです。最近では、流通小売店が発行する電子マネーやユーザー登録が必要なスマホアプリからも、有用なデータを集めることができるようになりました。
  • データベース・マーケティング
    解析のために収集するデータは、顧客にひもづく情報であれば何でも利用できます。顧客に対するアンケート調査を実施することも必要でしょう。回答結果は、すでにある顧客情報と合わせて最新の状態に更新すると同時に、顧客クラスター・セグメントをより精緻化させることができます。

Check

データベースマーケティングに関してはこちらの記事もご覧ください。
データベースマーケティングとは?CRMとの違い、活用事例を紹介

2)相関

  • バスケット分析
    データマイニングを商品・サービスの販売に活用する際に最も身近な方法です。「ある商品を購入する顧客はどんな商品を一緒に購入するか」などを扱います。「1回の来店で購入する数量はどれくらいか」も扱うことができます。
  • 顧客ロイヤルティー解析
    前述のカード・マーケティングと組み合わせ、特定の顧客ターゲットにおける一定期間内での来店数、購入金額、クーポン利用率などを解析します。ロイヤルティーの高低を反映した購買行動・傾向を把握することもできます。

3)予測

  • 施策の策定
    解析結果を基に、未来を予測します。
    ひと口に「予測する」といっても、商品販売の場合、変動要素は「曜日・時間帯」「天候・気温」「価格」「販売場所・棚の位置」「キャンペーンの有無・経過日数」など数多くあります。解析結果を利用して、より効果的な施策を策定します。
  • 仕入れ・製造の検討
    販売予測ができるのであれば、同時に仕入れの予測も可能です。商品の製造に関することであれば、解析結果に基づき効率的なライン稼働計画を策定したり、製造に必要な部材・人員の手配を調整したりすることができます。

データマイニングには統計学の知識が必要?

データを元にレポートを作成する業務を担当されている方であれば、統計学だとは意識せずにやっている事柄もあります。ただ、統計学がわかっていれば、データマイニングの活用範囲が広がるので、知識を身につけるに越したことはありません。ここでは、統計学の代表的な考え方である「記述統計」「推計統計」について見てみましょう。

1)記述統計

データの全体像を把握するために、ExcelやPowerPointを使って表やグラフを作ることがあるでしょう。膨大なデータを分類・整理し、見やすくすることで、データの傾向や性質を把握する。これが記述統計です。具体的には、平均や分散、最大値、最小値、外れ値(データの全体的な傾向から大きく離れた値)も明確にすることを目指します。

2)推計統計

記述統計では、膨大な全データを分析の対象としていました。一方、推定統計では、集められた一部のデータを、「サンプル(標本)」として分析し、データの全体像(母集団)を推測します。推計統計では、変数となる因子を特定する「分散分析」、変数同士に関係があるか、その強さはどれくらいかを判断する「相関分析」、一方の変数からほかの変数を予測する「回帰分析」が利用されます。

相関関係と因果関係の違いとは

「変数同士の関係」といったときに混乱しがちなのが、「相関関係」「因果関係」の違いです。片方の値が変化したとき、もう一方の値も変化するなら、両者には相関関係があるといえます。また、原因があって、その結果が引き起こされている場合は、因果関係があるといえます。もしデータマイニングによって因果関係が発見できれば、原因に対して効果的な施策を実施することで、効果は期待通りに出るでしょう。ただ、注意しなくてはならないのは、相関関係があるからといって、必ずしも因果関係があるとはいえないということです。

なお、変数同士に直接の相関はなくても、あたかもそれがあるかのように見える場合があります。これを「疑似相関」といいます。例えば、「風が吹けば桶屋が儲かる」ということわざがあります。「ある事柄が原因となり、巡り巡って思わぬところに影響する」の意味ですが、風が吹いた時間や風速と桶の売り上げには直接の相関関係はありません。

統計学は奥が深く、学ぶべき項目は多岐にわたります。結果を判断する前に、「相関関係と因果関係を取り違えていないか?」「これは相関があるように見えるが、疑似相関なのではないか?」と疑う癖をつけるといいでしょう。

データマイニングをマーケティングにどう生かすか

データマイニングツールの活用

このように、データマイニングは、データ分析によってデータ同士の重要な関係性、出現頻度を割り出し、マーケティングに活かしていく重要な施策です。一方、作業にかかる時間やコストも気になるところです。
昨今の大企業向けのデータマイニングツールやBI(Business Intelligence)ツールであれば、統計学の専門的な知識がない人でも詳細な解析ができ、時間を節約することができます。事前設定による作業の自動化や、日次・週次などの定期レポートの出力も簡単です。

また、「属性に従って顧客を分類したい」「商品と商品の関連性を発見したい」などといっても、膨大なデータ量が相手では、どこから手をつければいいか分からないですね。データマイニングツールには、解析に役立つさまざまな機能が備わっています。「外れ値」のような不要データを除外して元データを作成する作業や、分析期間の設定、グルーピング・クラスタリングの作成も簡単です。写真やイラスト、ライフスタイルの情報を組み合わせれば、顧客の典型的なイメージをクラスタごとに作成することもできます。

そして、それらの分析結果を踏まえて将来の傾向をシミュレーションすることもできます。販売実績など客観的なデータに基づく結果であれば、施策の検討・実施に対するよい判断基準となるでしょう。

とはいえ、「データマイニングツールの導入はコスト的に難しい」「蓄積したデータはあるが、量が多くない」こともあります。そのような場合は、Excelを利用してみましょう。Excelには統計に利用できる関数やグラフがいくつも準備されているので、それほど多くないデータ量であっても全体の傾向を把握するくらいは可能です。ただし、外れ値の除外など、分析のためのデータの加工は手動で行わなければなりません。

データマイニングには、分析に見合うだけのデータ量が必要

少ないデータ量でデータマイニングを実施してしまうと、本来であれば外れ値に分類されるべき特殊な値をもとに、解析をすることになってしまい、適切な予測を導き出せないことがあります。
データマイニングを実施する際には、蓄積したデータ量と更新頻度のようなデータ品質、ツールの使い方に十分気をつけてください。また、データ量が少ないと判断した場合には、どれくらいのデータ量を集めなければならないか、そのためにどのような施策を実施するかも並行して検討しましょう。
逆に言えば、相当量のデータがあれば、データマイニングに着手し始めることは可能となります。また、社内に蓄積された各種データはデータマイニングだけではなく、様々なマーケティング施策に活用することも可能となります。

データマイニングを活用した解析・予測の具体例

データマイニングは、具体的にどのように活用できるのでしょうか。分野ごとに具体例を見ていきましょう。

天気予報

データマイニングの最も身近な例でしょう。気象庁では過去数十年のデータを蓄積し、それを解析して明日の天気を予測します。民間の天気予報会社では、スマホアプリを提供してユーザーからの情報を募集し、都道府県・地方単位よりももっと細かいデータを集めることで、市区町村単位での天気予報、ゲリラ豪雨といった局所的・突発的な天気を予測できるようにしました。

流通・小売業

販売実績を曜日や時間帯、天候と組み合わせて解析し、商品の仕入れ量を調整できます。スマホアプリの提供と組み合わせ、顧客属性や趣味や好み、履歴に合わせたプッシュ通知やダイレクトメールの配信、クーポンの提供などにも活用できます。

メーカー

製造販売している商品の販売傾向だけでなく、チャネルごと・地域ごと・店舗ごとの傾向も解析できます。特定チャネル・地域で強い競合商品に対してチャネル・地域限定のキャンペーンを展開したい場合にも有益です。

保険

生命保険であれば、性別、年齢、病名、罹患(りかん)率、回復までにかかる日数・費用などが解析対象となります。損害保険であれば、保険の対象品目(火災保険であれば住居や家財道具、自動車保険であれば車種・グレードなど)、火災や事故が起きる確率、居住年数や運転者の年齢、原状回復費用・損害補償額などの関連性も解析できます。同時に、それらは顧客が支払う保険料算出の重要な根拠となります。

銀行・クレジットカード

普段預金の引き出しに利用している支店・ATMの場所や購入した商品と決済金額など、顧客の利用行動を解析すれば、顧客のカード盗難やスキミングによる不正利用の検知に利用できます。問題が発生したら、すぐ顧客に連絡を取って確認するといったようにリスクを回避・軽減する作業にも役立ちます。

教育

生徒それぞれの理解度や、学習の進捗状況をデータで収集し解析することにより、成績のよい生徒をグルーピングしたり、より理解しやすい授業内容を検討したりすることができます。

蓄積されたデータを解析し、施策に役立てよう

データマイニングは、今まで現場の従業員の経験や勘など主観的な判断、古くからの慣習に頼っていた事柄を、顧客行動の蓄積から計算した数値で客観的に把握できるようにする作業といえます。さらに、大規模なデータマイニングツールであれば、Excelでも可能なデータによる将来予測だけでなく、将来のシミュレーションも可能です。それらの結果を踏まえ、より適切な施策をスピーディーに企画、実施しましょう。

TOPPANクロレではデジタルマーケティング支援サービスを提供しています。ECサイトの立ち上げや新規顧客獲得施策の提案から運用のサポートまで幅広く対応いたします。どんなお悩みや疑問も、お気軽にご相談ください。