TCH: TinyCopipeHoihoi β version
ツイート
このエントリーをはてなブックマークに追加

TCH: TinyCopipeHoihoi β version

Last update: 2016-1-9
Naohiro Matsumura

はじめに

TCHは日本語レポートの剽窃を発見するためのフリーウェアです。コピペルナーをオマージュしています。レポート同士の類似箇所を計算したり、関連しそうなウェブページとの類似箇所を計算して、コピペの疑いのある箇所をハイライトします。Win版とMac OSX版があります。最新バージョンは 0.14 です。

インストール for Win

ソフトウェア 説明
tch-win.exe 任意の場所に置いてください。(ただし日本語を含まないディレクトリの配下)

インストール for Mac

ソフトウェア 説明
tch-mac.zip 解凍して任意の場所に置いてください。(ただし日本語を含まないフォルダの配下)

使い方

  1. プレインテキスト形式のレポートをフォルダ(日本語名はNG)に入れる。
  2. をダブルクリックしてTCHを起動し、レポートを入れたフォルダを指定する。
  3. マッチング幅を設定する。マッチング幅を広くすれば少し処理速度は上がります。
  4. 類似度の閾値を設定する。
  5. 「コピペホイホイ」ボタンをクリックして解析を開始する。
  6. 解析結果が「フォルダ名_tch.html」ファイルに作成される。

とても簡単なので、サンプルデータ report.zip で試してみてください。

デフォルトではテキストから自動抽出したキーワードを使って関連ウェブページを探しますが、検索キーワード欄に検索キーワードを(複数)入れることも可能です(このときは自動抽出したキーワードは使いません)。Mac版TCHに日本語キーワードを入力するときは、コピー(Ctrl+c)&ペースト(Ctrl+v)で貼りつけてください。

サンプルデータ(report.zipを解凍したもの)をTCHにかけると、report_tch.htmlが出力されます。対象テキストの関連テキストや関連ウェブページとの類似度が表示されます。▼をクリックするとコピペの疑いのある箇所が赤字で表示されます。

FAQ

よくある質問とそれに対する回答を以下にまとめておきます。

質問 回答
ファイルを読み込めません。 日本語を含むディレクトリの配下に入力フォルダを置くと読み込めないので、そうでない場所に置いてください。
文字化けします。 Win版TCHは入力ファイルの文字コードをShift-Jis(もしくはcp932)にしてください。
Wordファイルは分析できますか? プレインテキストに変換すれば分析できます。プレインテキストへの変換方法は下記を参照してください。

Wordファイルをプレインテキストに変換するには

レポートはWordファイルで提出してもらうことが多いと思いますので、以下にWordファイルからテキストファイルを作成する方法について簡単に説明します。

(for Mac) word2text.zip をダウンロード&解凍して任意の場所に置いてください。word2textアイコンをダブルクリックするとファイル選択画面になりますので、Wordファイル(複数選択可能)を選択すれば、同名のテキストファイルが作成されます。Microsoft Word 2008 for Macがインストールされている環境でのみ動作を確認しました。

(for Windows) xdoc2txt が使えると思います(未確認)。

履歴