AIテキストマイニングの授業での使い方について
WEBで簡単にテキストマイニングができる「AIテキストマイニング」の使い方をまとめています。
概要
AIテキストマイニングを使えば、文章の統計的な分析が手軽にできます。
無料のユーザー登録(メールアドレス登録)をすれば、全ての機能が使えるようになります。
ただし、分析する文章は自分で用意する必要があります。
機能一覧
AIテキストマイニングでできることを、下表に、簡単にまとめます。
表
名称 | できること |
---|---|
ワードクラウド | よく使われる言葉を可視化 |
単語出現頻度 | 頻度をグラフ化 |
共起キーワード | 一緒に使われる言葉を可視化 |
2次元マップ | 似た言葉を分類 |
係り受け解析 | 修飾関係をグラフ化 |
階層的クラスタリング | 似た言葉を分類 |
感情分析 | 言葉を感情に分類 |
要約 | 重要と思われる文章を抽出 |
やり方
AIテキストマイニングは簡単に結果を出すことができます。
「新規作成」のフォーム入力タブで、テキストを入力し、「テキストマイニングする」を押下すれば、結果が出力されます。
社外秘など、機密の文章を分析する場合は、結果を公開しないようにします。
他社サーバーへのアップロード自体を嫌気する場合は、AIテキストマイニングの使用を控えて下さい。
画像保存
ワードクラウド、共起キーワードなどは画像として保存できます。
画面右上にある、三本線を選び、フォーマットを選択すれば、ダウンロードされます。
使い方
分析結果の使い方です。
結果は助詞や助動詞が省かれています。これらの言葉を含めず名詞、動詞、形容詞などに限って結果を表示しています。
ワードクラウド
出現頻度もしくはスコアの高い言葉を可視化しています。
スコアは、頻度とは異なります。
AIテキストマイニングでは、多くの文章に登場する言葉のスコアを下げています。
例
例えば、この記事に書かれている文章の場合、テキストマイニングという言葉の頻度が高くなります。しかし、これはAIテキストマイニングについて紹介した記事のため、わかりきったことです。
このような結果を避けるため、言葉の重要度を下げる手法であるスコアを導入しています。スコアによって、文章の中でより重要な言葉を見つけ出すことができます。
単語出現頻度
ワードクラウドにするための元データです。
ワードクラウドでは確認できないスコアを数値で確かめることができます。
スコアが高い言葉は、ワードクラウドで大きなプロットになっています。
一方、出現頻度でワードクラウドを可視化している場合は、頻度の高い言葉のプロットが大きくなります。
共起キーワード
文章における、同じ単語の組み合わせを可視化しています。
例
下の画像は別のソフトを使って分析した結果ですが、共起キーワードを表しています。
分析したテキストデータは、「真犯人フラグ」というドラマの感想(一般視聴者が投稿した口コミ)です。
画像左上に、西島と好きという言葉が線で結ばれています。
これは、俳優の西島秀俊が好きだ、という感想が多く書き込まれていることを意味しています。
「西島さん好き!」「西島さんが好きなのでみてます」「大好きな西島さんが出てると知り……」など、具体的な文章はそれぞれ異なります。
2次元マップ
単語と文章のデータで作られるマトリックス(単語を数え上げてまとめた表)は膨大になります。これを少ない軸(次元;出力されているデータは2次元)で可視化する方法が2次元マップです。
係り受け解析
文章の修飾関係を表しています。文章量が少ない場合、結果はあまり有効になりません。
階層的クラスタリング
似た言葉同士を隣同士に配置し、分類しています。
授業について
授業アンケートの分析や、分析結果を授業で教材として使用する場合についてです。
アンケート分析
ワードクラウドと共起キーワードを使って、アンケートによく書き込まれている意見を把握します。
さらに、AIテキストマイニングの機能「文章検索」を使って、寄せられた意見を具体的に確認します。
このように分析をすすめ、定量的なデータ(根拠)をもとに、授業に対する意見を理解します。