2015年12月10日木曜日

KH Coderで分析対象語の取捨選択をする2

KH Coderで分析対象語の取捨選択をするの方法で指定した語を分析対象から外せるが、他にも分析対象語をしぼる方法がKH Coderにはある。KH Coderでは分析結果をクラスターなどの図として出力できるが、分析対象の語数が変わることによって結果が変わることがある。対象語が多すぎると余分な情報が入ってしまい、また少なすぎると必要な情報まで取り除かれてしまい、悩ましいところではある。以下は階層クラスター分析で、分析対象語を変える手順。

1.KH Coderでテキストデータを読み、前処理を済ませておく
前処理の方法はこちら

2.階層的クラスター分析の設定画面を開く
メニューの[ツール]>[抽出語]>[階層的クラスター分析]で、以下の画面が開く。


3.対象語の選択
対象語数を変えるのは以下の3つの設定

・最小/最大 出現数による語の取捨選択
・最小/最大 文書数による語の取捨選択
・品詞による語の取捨選択

「最小/最大 出現数による語の取捨選択」はテキストデータ全体を通した出現数。「最小/最大 文書数による語の取捨選択」は、集計単位が段落とすると、いくつの段落で出現しているか。「品詞による語の取捨選択」は言葉通りでどの品詞を含めるかどうか。「チェック」 ボタンをクリックすると、現在の設定での分析対象となる語の数を確認できる。

4.「OK」ボタンでクラスター分析の結果を出力する

0 件のコメント:

コメントを投稿