TWC: TinyWebCrawler β version

TWC: TinyWebCrawler β version

Last update: 201-01-16
Naohiro Matsumura

はじめに

Yahoo!ブログ検索を利用して、ブログを収集するフリーウェアです。収集したブログ記事は

検索キーワード,日付,記事タイトル,記事URL,記事本文

の形式のCSVファイル(サンプル)として保存しますので、TTMなどを利用すればテキストマイニングに役立てることができます。Windows版とMac OSX版があり、最新バージョンは 0.09 です。

インストール for Win

ソフトウェア 説明
twc.exe TWC本体。任意の場所に置いてください。

インストール for Mac

ソフトウェア 説明
twc-mac.zip TWC本体。任意の場所に置いてください。
ActivePerl ActivePerl Community Edition(無償)をインストールしてください。

Mac版TWCを起動すると

のエラーメッセージが出ますが無視してください。

使い方

TWCはをダブルクリックすると起動します。使い方は非常に簡単なので、起動すれば分かると思います。なお、Mac版TWCに日本語キーワードを入力するときは、コピー(Ctrl+c)&ペースト(Ctrl+v)で貼りつけてください。

スクリーンショット


(左がWindows版、右がMac OSX版)

謝辞

TWCは明治大学の水野誠先生ご要望により生まれました。 また、立命館大学の樋口耕一先生より様々な改善案(v.004作成への要望・v.005作成用パッチ)を頂きました。 記して感謝いたします。

履歴