Wahaha-blog

Tue, 28 Jun 2005

レポート・マイニング

今日の授業は学生に提出してもらったレポートの分析を題材にしてみた。具体的には

・名詞の出現頻度分布を見せて高頻度語・低頻度語・キーワードの説明
・TFIDFの説明
・単語ベクトルの説明
・単語ベクトルに基づくレポートの独自度の説明
・独自度によるレポートのランキング結果の説明
・単語ベクトルによるレポート間の類似度の説明

などを通して知識経営の役割について説明。「記述式テストにおける自動採点システムの最新動向」にあるようにレポートの採点は奥が深いので、とりあえず独自性と類似度に着目したけど、けっこういけるかも。アルゴリズムをブラッシュアップして、後期もしくは来年度はCGIフォームでの投稿+採点支援システムの構築をしてみよう。

matumura, 2005/06/28 17:13

---

すみません,何度もトラックバックしてしまいました。消してください。

まーけ組, 2005/06/28 22:57

---

トラバありがとうございます。重複していたものは削除いたしました。夜になると重くなるのでご不便をお掛けしていますが、今後ともご贔屓に!

matumura, 2005/06/29 03:15

permanent link | writeback(0)

Comments...