blog

データマイニングとは?意味と手法から活用事例まで、わかりやすくご紹介します!

データマイニングとは、大量のデータの中から有用な情報を統計的手法を用いて抽出することです。現代では、市場における競争力を確保するために、市場や顧客・現場から得られる様々なデータを分析することで、新たなマーケティング戦略を考えることが重要となっていることから、データマイニングへの注目は日に日に高まってきています。

本記事では、AIを研究開発する弊社の視点からデータマイニングに関して
・データマイニングの基礎知識
・データマイニングの代表的な手法
・データマイニングが活躍する事例

についてわかりやすく紹介していきます。

データマイニングとは

データマイニングをしている人のイメージ
大量のデータから有益な情報を見つけ出したり、新たな消費者の行動パターンを見つける事を、鉱石を掘り起こすことに準えてデータマイニングと言います。
データマイニングには、Webマイニングやテキストマイニングなど、取り扱うデータの種類によって多岐にわたりますが、等しく経営戦略や顧客関係管理などで活用されています。

データマイニングの機能

データマイニングには、大きく分けて3つの機能「予測・分類・関連性」があります。
収集したデータから、特定の現象が発生する原因や確率を予測したり、顧客や市場から得られたデータを分類したり、一緒に売れる商品や商品と顧客の行動パターンなどの関連性を見つけ出す事ができます。

これらの機能を活用することで、不良品が発生する割合を下げたり、顧客が一回の買い物で購入する額を増やすことにつなげたりと、売り上げにつながる新しい情報を見つけ出す事ができます。その具体的な活用例については、後ほど紹介していきます。

データマイニングの種類

3つの機能とは別に、データマイニングには2つの種類が存在します。

一つ目は「知識発見」と言われるもの。これはディープラーニングや教師なし学習などでよく使われる種類であり、ビッグデータから新しい発見を見つけ出す事を目的としています。そして、この知識発見に適したデータマイニングの手法として、クラスター分析・マーケット・バスケット分析があります。

もう一つは、「仮説検証」と言われるもの。
検証したい課題に対し、必要なデータを収集することで、顧客の行動や反応を分析しながら、解決する方法を探るためのものです。
この仮説検証には、機械学習の他にも従来の統計分析の手法が使われることもあります。
事前に用意した仮説に結果が左右されるため、分析結果と仮説を読み解きながら、繰り返し分析を行っていくことになります。

代表的なデータマイニング手法

ブロックチェーン
続いて、代表的なデータマイニングの手法について解説していきます。
手法によって、どのような状況において使いやすいのか、そして知識発見・仮説検証のうち、どちらを得意としているかが異なります。

ロジスティック回帰分析

ロジスティック回帰分析とは、とある事象が発生する可能性を予測するのに長けた分析方法です。
例えば、顧客に新商品を紹介するDMを送った時、その商品が購入されるかどうか。
そして、仮に購入される時は、どのような要素が関係しているのかを分析します。

この手法はマーケティングにおいては広く利用されており、他にも患者が病気を発症する確率を予測する医療現場や、金融のリスクを計算することにも使われていたりします。

クラスター分析

クラスター分析とは、「知識発見」に適したデータマイニングの手法になります。
類似するデータをグループ分けすることで、今まで見えてこなかった新たな関係性を見つけ出す事が可能になります。

クラスター分析の中でも、階層クラスタリング・非階層クラスタリングなどがあり、必要なデータ量・人間が前提条件を設定することによる正確性、そして必要な計算量などに差があります。
また、階層クラスタリングはグループ分けをする過程が可視化されるため、理解しやすいのに対して、非階層クラスタリングは定められたグループ数にキッパリと分けてしまうため、なぜそのようなグループ分けがされたのかを理解する難しさがあります。

↓クラスタリングについてのさらに詳しい解説はこちらから!
クラスタリングとは | 分析の手法などをわかりやすく解説!

マーケット・バスケット分析

マーケット・バスケット分析とは、小売店において売上を伸ばす方法を考えたときに、一見して繋がりのわからない、購入されやすい商品の組み合わせを見つけ出すための手法です。
例えば、後ほど詳しく紹介しますが、1992年にウォルマートにおける購買行動の分析結果として、紙おむつとビールが一緒に購入されやすいという事が、米紙「ウォールストリートジャーナル」によって紹介されました。

消費者の行動には見えていない部分が非常に多くあるため、マーケット・バスケット分析を活用することで、最適な商品陳列を行いやすくなります。

機械学習

最近非常に注目されている機械学習ですが、データマイニングにおいても活躍する手法の一つです。

教師あり学習と教師なし学習の二つがあり、教師あり学習では入力するデータと正解とするデータを用意し、入力されたデータを分析した結果がどの程度正解に近づいたかを参考に、内部の処理の仕方を変化させていく学習方法であり、仮説検証に役立つといえます。

対して、教師なし学習とは正解とするデータを利用しないため、問題を解決することに不向きな代わりに、新しいパターンを発見する知識発見に優れているといえます。そして、先ほど紹介したクラスター分析(クラスタリング)も、この教師なし学習の一つに含まれます。

↓機械学習についてのさらに詳しい解説はこちらから!
【入門】機械学習とは?種類やアルゴリズムを簡単に解説!

データマイニングを活用した事例

物流貨物
ここまでデータマイニングが指す意味と、その代表的な手法について紹介していきました。
それを踏まえた上で、データマイニングはどのような状況で活用されるのでしょうか。
続いてはデータマイニングを活用した事例について紹介していきます。

スーパーにおける陳列

先ほど、ウォルマートにおける購買行動の分析結果として、紙おむつとビールに関連性がある事を紹介しましたが、一体なぜこのような結果になったのでしょうか。
その理由として、紙おむつを買ってくる事を指示された父親が、ウォルマートへ行ったついでにビールも一緒に買っていくという行動パターンが、あるのでは無いかと考えられています。

当初、紙おむつは乳幼児用品と一緒に買われるケースが多いと考えられていたのに対して、それとは全く異なる結果が導き出されました。
つまり、どんなに消費者の目線で行動を考えたとしても、理解できる範囲には限界があるといえます。
そこで、知識発見を得意とするデータマイニングの手法を利用することで、新しい消費者の行動パターンを見つけ出し、最適な商品陳列に繋げ、売り上げを伸ばすことにつながります。

鋳造製品における不良品対策

鋳造製品とは、材料の成分や形状・温度によって品質の安定化が難しい製品なのだとか。
しかし、不良品の発生確率を下げることは、コストを削減し売り上げを伸ばすポイントとなります。そこで、データマイニングを活用し、様々な要因との相関関係を仮説検証した結果、温度が高いことが不良品発生への関係性が高いことが判明しました。

原因が分からなければ対策の方法も分かりませんが、データマイニングにおいて仮説検証に優れた手法を活用することで、生産ラインにおける不良品対策をはじめとした問題を解決しやすくなります。

まとめ

今回はデータマイニングの意味や代表的な手法、そして活用した事例について紹介していきました。
大量のデータの中から市場を分析し、新たな消費者の行動パターンを見つけることや、データを経営戦略に活かすことは、競争力を維持する上で非常に重要なポイントとなります。

なので、ぜひ状況に合わせて適したデータマイニングの手法を選び、活用してみてはいかがでしょうか。

AIブログ購読

 
クリスタルメソッドがお届けする
AIブログの更新通知を受け取る

Study about AI

AIについて学ぶ

  • 「Diffusion Transformers (DiTs)」とは。わかりやすく解説

    「Diffusion Transformers (DiTs)」とは。わかりやすく解説

    「Diffusion Transformers (DiTs)」とは Diffusion Transformers (DiTs) は、画像生成における新しいアプロ...

  • 3D画像での異常検知システム(3DのAI・深層学習)

    3D画像での異常検知システム(3DのAI・深層学習)

    3DのAI・深層学習 3Dデータとは? 写真等の一般的な2Dデータは、ピクセル(画素)の縦×横の2次元の配列です。では3Dデータはどの様に表現されるのでしょうか...

  • AI問題点を分かりやすく解説!新たな技術の課題とは?

    AI問題点を分かりやすく解説!新たな技術の課題とは?

    AI(人工知能)は革新的な技術である一方で、さまざまな問題点も浮かび上がってきました。本記事では、AIの問題点についてわかりやすく解説します。 AIの急速な発展...

View more