TCH: TinyCopipeHoihoi β version
TCHは日本語レポートの剽窃を発見するためのフリーウェアです。コピペルナーをオマージュしています。レポート同士の類似箇所を計算したり、関連しそうなウェブページとの類似箇所を計算して、コピペの疑いのある箇所をハイライトします。Win版とMac OSX版があります。最新バージョンは 0.14 です。
ソフトウェア | 説明 |
---|---|
tch-win.exe | 任意の場所に置いてください。(ただし日本語を含まないディレクトリの配下) |
ソフトウェア | 説明 |
---|---|
tch-mac.zip | 解凍して任意の場所に置いてください。(ただし日本語を含まないフォルダの配下) |
とても簡単なので、サンプルデータ report.zip で試してみてください。
デフォルトではテキストから自動抽出したキーワードを使って関連ウェブページを探しますが、検索キーワード欄に検索キーワードを(複数)入れることも可能です(このときは自動抽出したキーワードは使いません)。Mac版TCHに日本語キーワードを入力するときは、コピー(Ctrl+c)&ペースト(Ctrl+v)で貼りつけてください。
サンプルデータ(report.zipを解凍したもの)をTCHにかけると、report_tch.htmlが出力されます。対象テキストの関連テキストや関連ウェブページとの類似度が表示されます。▼をクリックするとコピペの疑いのある箇所が赤字で表示されます。
よくある質問とそれに対する回答を以下にまとめておきます。
質問 | 回答 |
---|---|
ファイルを読み込めません。 | 日本語を含むディレクトリの配下に入力フォルダを置くと読み込めないので、そうでない場所に置いてください。 |
文字化けします。 | Win版TCHは入力ファイルの文字コードをShift-Jis(もしくはcp932)にしてください。 |
Wordファイルは分析できますか? | プレインテキストに変換すれば分析できます。プレインテキストへの変換方法は下記を参照してください。 |
レポートはWordファイルで提出してもらうことが多いと思いますので、以下にWordファイルからテキストファイルを作成する方法について簡単に説明します。
(for Mac) word2text.zip をダウンロード&解凍して任意の場所に置いてください。word2textアイコンをダブルクリックするとファイル選択画面になりますので、Wordファイル(複数選択可能)を選択すれば、同名のテキストファイルが作成されます。Microsoft Word 2008 for Macがインストールされている環境でのみ動作を確認しました。
(for Windows) xdoc2txt が使えると思います(未確認)。