機械学習とテキスト・データマイニングの違い【わかりやすく解説】
テキストマイニングと機械学習の違いを解説します。テキストマイニングはテキストデータを分析することであり、その手法として機械学習が用いられます。
機械学習とは
機械学習はデータの分析手法を意味します。
データとは
小説や記述式アンケートなどのテキストデータ、はい・いいえなどのアンケートの結果、画像データ、数値データなどが機械学習の分析対象になります。
手法例
クラスター分析、主成分分析は教師なし学習と呼ばれます。サポートベクターマシン、ナイーブベイズは教師あり学習と呼ばれます。
いずれもテキストマイニングでよく使われる機械学習の手法です。
テキストマイニングとは
膨大なテキストデータを分析して知見を得ることをテキストマイニングと呼びます。このテキストマイニングに用いられる分析手法の一つが機械学習です。
テキストマイニングの目的は、アンケートや口コミを分析し経営などに役立つ情報を抽出することにあります。アンケートや口コミなどのテキストデータを分析するために、様々な手法が用いられます。
共起ネットワークなど、機械学習ではない分析手法もあります。
事例
テキストマイニングでレシピのタイトルを分析し、共起ネットワークを描いた結果です。レシピタイトルでどのような単語が一緒に使われるか可視化した結果といえます。
データマイニングとは
データマイニングはテキストデータに限らず、様々なデータ(画像、音声など)を対象にします。テキストが対象の場合はテキストマイニングと呼ばれます。
まとめ
以上を踏まえて、機械学習、テキストマイニング、データマイニングを簡単にまとめると以下のようになります。
- 機械学習はデータの分析手法のひとつ
- データマイニングは機械学習などを使った分析手法の総称
- テキストマイニングはデータマイニングの中でも特にテキストデータ(文章)を対象にした分析