TTC: TinyTweetCrawler β version

TTC: TinyTweetCrawler β version

Last update: 2010-08-03
Naohiro Matsumura

はじめに

Twitterから検索キーワードを含む呟き (Tweets) を収集するフリーソフトウェアです。収集した呟きは

検索クエリ,ID,日付,ユーザ名,呟き

の形式のCSVファイル(サンプル)として保存しますので、TTMを利用すればテキストマイニングを行うことができます。TTCの最新バージョンは 0.06 です。Windows XP, Vista, 7で動作を確認しています。

インストール

ダウンロードして任意の場所で展開してください。

使い方

TTCは をダブルクリックすると起動します。使い方は非常に簡単なので起動すれば分かると思います。収集した呟きは download_***.csv に出力します(***には年月日時分秒が入ります)。検索オプションを利用することで、AND検索、OR検索、NOT検索、期間指定などの高度な検索も可能です。検索オプションについてはこれだけは覚えておきたい、Twitter検索で使える便利なオプションまとめも参考になります。

その他

TTCが利用しているOAuth認証経由のTwitter APIは1時間当たり350回の利用制限(Rate limiting)があります。TTCでは100ツイート取得するのにAPIを1回利用しますので、1時間あたり最大35,000ツイート以上取得することはできません。それ以上のペースでツイートを取得したい場合は Request whiltelisting から要望を出せば利用制限が緩和されると思います(たぶん)。

なお、検索結果が取得できないことがよくありますが、原因はよく分かりません…

スクリーンショット

履歴