Wahaha-blog

Sun, 16 Oct 2005

ブログにおける一人称の分布(開票率3%弱)

形態素解析はやっと終わったけど、構文解析はまだ3%弱。この調子だとあと5日くらいかかりそう。。。まあそれでも、ブログにおける一人称の分布がだんだん見えてきました。KNPの解析結果の中から提題タグのついてる形態素だけを集めています。

主語(提題)頻度一人称に占める割合ブログに占める割合
私・わたし・ワタシ58056.81%3.31%
僕・ぼく・ボク19519.10%1.11%
俺・おれ・オレ14113.81%0.81%
あたし・アタシ666.46%0.38%
うち・ウチ333.23%0.19%
その他60.59%0.03%
一人称合計1021100%5.83%

matumura, 2005/10/16 16:24

permanent link | writeback(0)

Comments...