テキスト統計ダッシュボードとは?
テキスト統計ダッシュボードは文字数・単語数・文数・段落数をカウントし、平均単語長・読みやすさレベル・キーワード出現頻度を算出します。使いすぎた単語の発見や、対象読者に合った文章かどうかの確認に役立ちます。
数値はキー入力のたびに更新されます。空白あり/なしの文字数、単語数、文の数、段落数、平均語長、1文あたり・1段落あたりの平均単語数、語彙密度(ユニーク語が全体に占める割合)、ユニーク語数、最長単語、そして毎分の語数を変更できる推定読了時間が表示されます。読みやすさはFlesch-Kincaidの学年の数値と、小学校・中学校・高校・大学の区分の両方で示されます。文の長さの起伏グラフは各文の単語数を棒で描いてリズムを可視化し、出現頻度の高い語は棒グラフで一覧できます。
使い方
- エディターにテキストを貼り付けるか入力してください。入力と同時にリアルタイムで統計情報が更新されます。ボタン操作は不要です。
- ダッシュボードパネルで文字数、単語数、文数、段落数、平均単語長、推定読了時間を確認できます。
- キーワード出現頻度セクションで、最も多く使われた単語を出現回数順に確認できます。統計レポート全体をテキストファイルとしてエクスポートすることも可能です。
使用するタイミング
- 1200語の指定があるブログ草稿を、要点を残したまま絞り込む。
- 生徒の作文が課題の学年に見合う読みやすさかを確認する。
- 公開前にキーワードの棒グラフを眺め、使いすぎている語を見つけて差し替える。
結果
ブログ記事の下書きを貼り付けると、1,247語、68文、平均単語長5.2文字、「marketing」が23回使用されていることがわかります。
よくある質問
- 読了時間はどう計算していますか?
- 単語数を読む速さで割って算出します。初期値は毎分200語で、これは成人が英文を黙読する平均的なペースです。速い・遅いに合わせて統計の下で速度を変えられます。専門的で密度の高い文章は150語/分前後、くだけた会話調は250語/分前後が目安です。
- 読みやすさにはどの計算式を使っていますか?
- Flesch-Kincaidの学年レベルを使い、平均文長と単語あたりの音節数から求めます。読みやすさカードには、素の学年の数値と、小学校・中学校・高校・大学というわかりやすい区分の両方を表示します。
- キーワード集計はtheやandのようなストップワードを除外しますか?
- 除外します。英語の代表的なストップワード約50語をフィルタするため、棒グラフの上位には冠詞や接続詞ではなく内容語が並びます。3文字未満の単語も雑音を減らす目的で外しています。
- 文はどのように検出していますか?
- 文末記号(ピリオド、疑問符、感嘆符)の後に空白か文末が続く箇所を検出しています。「Dr.」や「e.g.」のような省略形によって、まれに文数が1〜2増えることがあります。
- 英語以外のテキストでも使えますか?
- 文字数・単語数・段落数の計測はどの言語でも機能します。読みやすさとストップワード除外は英語向けに調整されているため、他言語でも数値は参考になりますが「学年」ラベルの妥当性は下がります。