膨大なデータから明日の一手を読む!データマイニングを活用しよう

マーケティング

私たちが店頭で商品を購入するとき、いつもどんな行動をしているでしょう。

今日の献立を考え、スーパーマーケットの店内を回り、必要な食材を選んで購入する。ところが、それだけではなく、もともと買う予定はなかったのに、自然と近くにあった商品に手が伸びる……。

これはもしかしたら、「ある商品を買う人は、ついでにこの商品を買う確率が高い」というデータを基に、商品棚を近くに置いたり、まとめ買いでお得になるキャンペーンを展開したりといった店舗側の施策の結果かもしれません。

しかし、顧客の購買行動は多種多様。どの行動がより多くの人に当てはまるかを予測することは、店員の長年の勘に頼らざるを得ませんでした。

それを客観的なデータで予測可能にしたのが、「データマイニング(data mining)」です。

商品・サービスの販売の場合、データマイニングでは、顧客の購買行動から生み出される情報をデータとして蓄積し、それを分析することによって関連性を把握します。そして、効果的な施策の策定に活用することもできます。そんなデータマイニングについて、簡単におさらいしてみましょう。

データマイニングは、データから関連性を「採掘する」こと

データマイニングとは、膨大なデータを整理して特定のパターン、関連性を見つけ出し、問題解決に役立てるための一連のプロセスをいいます。「mining」は「採掘する」という意味です。

「おむつとビール(diapers and beer)」という話をご存じでしょうか。

1992年、アメリカのスーパーマーケット「Osco Drugs」の売り上げデータを解析した結果、「おむつの購入者は同時にビールを購入する傾向が高い」ことが分かった、というものです。データマイニングの有用性を世の中に知らしめたエピソードとして今に残っています。

現在のデータマイニングは、膨大なデータ量を効率よく処理するためにビッグデータやAI、IoTと関連づけて語られることが多くなりました。コンピューターは処理速度が日々向上しているので、データマイニングツールによっては解析の自動化、リアルタイム分析、きめ細かな条件設定・変更によるシミュレーションも可能です。

データマイニングの3要素

さて、データマイニングをビジネスに生かすには「分類」「相関」「予測」の3要素を上手に利用することが重要です。それらをビジネスのどこに生かすことができるか、順に解説しましょう。

1)分類

  • 市場におけるポジション・セグメントの把握
    データマイニングを活用すれば、市場における商品やサービスのポジションを押さえた適切な施策の設計が可能です。後述のカード・マーケティングやデータベース・マーケティングと組み合わせることで、顧客を分類(グルーピング、クラスタリング)してどのセグメントに属するかを判断します。
  • カード・マーケティング
    商品やサービスの販売の場合、ポイントカード、クレジットカードにひもづいた顧客情報を解析することができます。住所や年齢といった基本情報、家族構成や年収などの属性情報、また、購入場所や品目などの購買履歴によって、グルーピングを行うのです。最近では、流通小売店が発行する電子マネーやユーザー登録が必要なスマホアプリからも、有用なデータを集めることができるようになりました。
  • データベース・マーケティング
    解析のために収集するデータは、顧客にひもづく情報であれば何でも利用できます。顧客に対するアンケート調査を実施することも必要でしょう。回答結果は、すでにある顧客情報と合わせて最新の状態に更新すると同時に、顧客クラスター・セグメントをより精緻化させることができます。
  • バスケット分析
    データマイニングを商品・サービスの販売に活用する際に最も身近な方法です。「ある商品を購入する顧客はどんな商品を一緒に購入するか」などを扱います。「1回の来店で購入する数量はどれくらいか」も扱うことができます。
  • 顧客ロイヤルティー解析
    前述のカード・マーケティングと組み合わせ、特定の顧客ターゲットにおける一定期間内での来店数、購入金額、クーポン利用率などを解析します。ロイヤルティーの高低を反映した購買行動・傾向を把握することもできます。

2)相関

3)予測

  • 施策の策定
    解析結果を基に、未来を予測します。ひと口に「予測する」といっても、商品販売の場合、変動要素は「曜日・時間帯」「天候・気温」「価格」「販売場所・棚の位置」「キャンペーンの有無・経過日数」など数多くあります。解析結果を利用して、より効果的な施策を策定します。
  • 仕入れ・製造の検討
    販売予測ができるのであれば、同時に仕入れの予測も可能です。商品の製造に関することであれば、解析結果に基づき効率的なライン稼働計画を策定したり、製造に必要な部材・人員の手配を調整したりすることができます。

データマイニングには統計学の知識が必要?

データを元にレポートを作成する業務を担当されている方であれば、統計学だとは意識せずにやっている事柄もあります。ただ、統計学がわかっていれば、データマイニングの活用範囲が広がるので、知識を身につけるに越したことはありません。ここでは、統計学の代表的な考え方である「記述統計」と「推計統計」について見てみましょう。

1)記述統計

データの全体像を把握するために、ExcelやPowerPointを使って表やグラフを作ることがあるでしょう。膨大なデータを分類・整理し、見やすくすることで、データの傾向や性質を把握する。これが記述統計です。具体的には、平均や分散、最大値、最小値、外れ値(データの全体的な傾向から大きく離れた値)も明確にすることを目指します。

2)推計統計

記述統計では、膨大な全データを分析の対象としていました。一方、推定統計では、集められた一部のデータを、「サンプル(標本)」として分析し、データの全体像(母集団)を推測します。推計統計では、変数となる因子を特定する「分散分析」、変数同士に関係があるか、その強さはどれくらいかを判断する「相関分析」、一方の変数からほかの変数を予測する「回帰分析」が利用されます。

相関関係と因果関係の違いとは

「変数同士の関係」といったときに混乱しがちなのが、「相関関係」と「因果関係」の違いです。片方の値が変化したとき、もう一方の値も変化するなら、両者には相関関係があるといえます。また、原因があって、その結果が引き起こされている場合は、因果関係があるといえます。もしデータマイニングによって因果関係が発見できれば、原因に対して効果的な施策を実施することで、効果は期待通りに出るでしょう。ただ、注意しなくてはならないのは、相関関係があるからといって、必ずしも因果関係があるとはいえないということです。

なお、変数同士に直接の相関はなくても、あたかもそれがあるかのように見える場合があります。これを「疑似相関」といいます。例えば、「風が吹けば桶屋が儲かる」ということわざがあります。「ある事柄が原因となり、巡り巡って思わぬところに影響する」の意味ですが、風が吹いた時間や風速と桶の売り上げには直接の相関関係はありません。

統計学は奥が深く、学ぶべき項目は多岐にわたります。結果を判断する前に、「相関関係と因果関係を取り違えていないか?」「これは相関があるように見えるが、疑似相関なのではないか?」と疑う癖をつけるといいでしょう。

データマイニングをマーケティングにどう生かすか

このように、データマイニングは、データ分析によってデータ同士の重要な関係性、出現頻度を割り出し、マーケティングに活かしていく重要な施策です。一方、作業にかかる時間やコストも気になるところです。

昨今の大企業向けのデータマイニングツールやBI(Business Intelligence)ツールであれば、統計学の専門的な知識がない人でも詳細な解析ができ、時間を節約することができます。事前設定による作業の自動化や、日次・週次などの定期レポートの出力も簡単です。

また、「属性に従って顧客を分類したい」「商品と商品の関連性を発見したい」などといっても、膨大なデータ量が相手では、どこから手をつければいいか分からないですね。データマイニングツールには、解析に役立つさまざまな機能が備わっています。「外れ値」のような不要データを除外して元データを作成する作業や、分析期間の設定、グルーピング・クラスタリングの作成も簡単です。写真やイラスト、ライフスタイルの情報を組み合わせれば、顧客の典型的なイメージをクラスタごとに作成することもできます。

そして、それらの分析結果を踏まえて将来の傾向をシミュレーションすることもできます。販売実績など客観的なデータに基づく結果であれば、施策の検討・実施に対するよい判断基準となるでしょう。

とはいえ、「データマイニングツールの導入はコスト的に難しい」「蓄積したデータはあるが、量が多くない」こともあります。そのような場合は、Excelを利用してみましょう。Excelには統計に利用できる関数やグラフがいくつも準備されているので、それほど多くないデータ量であっても全体の傾向を把握するくらいは可能です。ただし、外れ値の除外など、分析のためのデータの加工は手動で行わなければなりません。

データマイニングを活用した解析・予測の具体例

データマイニングは、具体的にどのように活用できるのでしょうか。分野ごとに具体例を見ていきましょう。

天気予報

データマイニングの最も身近な例でしょう。気象庁では過去数十年のデータを蓄積し、それを解析して明日の天気を予測します。民間の天気予報会社では、スマホアプリを提供してユーザーからの情報を募集し、都道府県・地方単位よりももっと細かいデータを集めることで、市区町村単位での天気予報、ゲリラ豪雨といった局所的・突発的な天気を予測できるようにしました。

流通・小売業

販売実績を曜日や時間帯、天候と組み合わせて解析し、商品の仕入れ量を調整できます。スマホアプリの提供と組み合わせ、顧客属性や趣味や好み、履歴に合わせたプッシュ通知やダイレクトメールの配信、クーポンの提供などにも活用できます。

メーカー

製造販売している商品の販売傾向だけでなく、チャネルごと・地域ごと・店舗ごとの傾向も解析できます。特定チャネル・地域で強い競合商品に対してチャネル・地域限定のキャンペーンを展開したい場合にも有益です。

保険

生命保険であれば、性別、年齢、病名、罹患(りかん)率、回復までにかかる日数・費用などが解析対象となります。損害保険であれば、保険の対象品目(火災保険であれば住居や家財道具、自動車保険であれば車種・グレードなど)、火災や事故が起きる確率、居住年数や運転者の年齢、原状回復費用・損害補償額などの関連性も解析できます。同時に、それらは顧客が支払う保険料算出の重要な根拠となります。

銀行・クレジットカード

普段預金の引き出しに利用している支店・ATMの場所や購入した商品と決済金額など、顧客の利用行動を解析すれば、顧客のカード盗難やスキミングによる不正利用の検知に利用できます。問題が発生したら、すぐ顧客に連絡を取って確認するといったようにリスクを回避・軽減する作業にも役立ちます。

教育

生徒それぞれの理解度や、学習の進捗状況をデータで収集し解析することにより、成績のよい生徒をグルーピングしたり、より理解しやすい授業内容を検討したりすることができます。

まとめ

データマイニングは、今まで現場の従業員の経験や勘など主観的な判断、古くからの慣習に頼っていた事柄を、顧客行動の蓄積から計算した数値で客観的に把握できるようにする作業といえます。

さらに、大規模なデータマイニングツールであれば、Excelでも可能なデータによる将来予測だけでなく、将来のシミュレーションも可能です。それらの結果を踏まえ、より適切な施策をスピーディーに企画、実施しましょう。

ひとつ忘れてはいけないことがあります。データマイニングには、分析に見合うだけのデータ量が必要です。少ないデータ量でデータマイニングを実施してしまうと、本来であれば外れ値に分類されるべき特殊な値をもとに、解析をすることになってしまい、適切な予測を導き出せないことがあります。

データマイニングを実施する際には、蓄積したデータ量と更新頻度のようなデータ品質、ツールの使い方に十分気をつけてください。また、データ量が少ないと判断した場合には、どれくらいのデータ量を集めなければならないか、そのためにどのような施策を実施するかも並行して検討しましょう。

参考:

よくわかるIT新発見 第7回 「データマイニングを利用したビッグデータ活用方法」|伊藤忠テクノソリューションズ

データマイニングとは? | SAS

検索