MS Formsアンケート結果の感情分析とポジティブ/ネガティブキーワードの抽出方法

Windows系

MS Formsで収集したアンケート結果の文字列を分析して、ポジティブ・ネガティブなキーワードに分類し、その出現頻度をランキング化することは、ユーザーのフィードバックを理解する上で非常に有効です。この記事では、100行程度のアンケート結果を効率よく分析するためのツールと方法を具体例を交えて解説します。

感情分析に適したツールの選定

感情分析を行うためには、テキスト解析に特化したツールを利用するのが便利です。代表的なツールとして、Pythonのライブラリ「TextBlob」や「VADER」、クラウドサービスのAWS Comprehendなどがあります。

TextBlobは簡単にポジティブ・ネガティブスコアを取得でき、Python環境で100行程度のデータなら即座に分析可能です。VADERも特にSNSや短文の分析に適しています。

ポジティブ・ネガティブキーワードの抽出手順

まずアンケートの各回答をテキストとして読み込みます。PythonであればCSVから読み込むのが一般的です。

次に、各回答文を単語に分割し、感情スコアを計算してポジティブとネガティブの分類を行います。例えばTextBlobを使うと、各文に対して.polarity属性でスコアを取得できます。

さらに、抽出したポジティブ単語とネガティブ単語を別々のリストにまとめ、出現回数を集計することで、頻度のランキングを作成できます。

頻度ランキングの作成例

PythonではcollectionsモジュールのCounterを利用すると簡単に単語の頻度を集計できます。例えば:

from collections import Counter
Counter(positive_words).most_common(10)

これにより、最も多く出現するポジティブキーワードのトップ10を簡単に取得できます。同様にネガティブキーワードもランキング化可能です。

クラウドサービスを使った分析のメリット

AWS ComprehendやGoogle Cloud Natural Languageなどのクラウドサービスを利用すると、大量データでも簡単に感情分析とキーワード抽出が可能です。

クラウドサービスではAPI経由でテキストを送信するだけで、ポジティブ・ネガティブスコアやキーフレーズ抽出を自動で行ってくれるため、コードを書かずに分析を進められます。ただし、結果の解釈や精度はツールによって異なるため、サンプルデータで精度を確認することが重要です。

分析結果の可視化と活用

頻度ランキングができたら、棒グラフやワードクラウドで可視化するとさらに理解しやすくなります。Pythonではmatplotlibやwordcloudライブラリが便利です。

可視化することで、どのキーワードが多く挙がっているかを直感的に把握でき、改善策や次の施策に反映させやすくなります。

まとめ

MS Formsのアンケート結果を分析する際は、PythonのTextBlobやVADER、もしくはAWS Comprehendなどを使うことで、ポジティブ・ネガティブキーワードを抽出し、出現頻度のランキングを作成できます。クラウドサービスを使う場合でも、結果の精度を確認することが重要です。これらの手順を踏むことで、100行程度のアンケートデータでも効率的かつ正確に感情分析が可能となります。

コメント

タイトルとURLをコピーしました