ExcelTTM β version
ExcelTTMはMicrosoft Excel上で動くテキストマイニングの前処理のためのフリーウェアです。「タグ付きテキスト」を解析して7種類の集計データを作成します。Mac OSX版とWindows版があります。最新版はバージョン v0.05 (Win版はWin10、Mac版はmacOS Sierraまで対応)です。Excelを使用しないTTMもあります。
清水裕士さんの開発したフリーの統計分析プログラムHADにはExcelTTMと連携する機能がありますので、ExcelTTMでテキストマイニングした結果を統計分析したい際にはHADがお薦めです。(が、Mac版HADは非推奨とのことです)
以下の4つのソフトウェアをインストール(ダウンロード)してください。
注:日本語版Windowsでしか動作しません。
ソフトウェア | 説明 |
---|---|
Microsoft Excel | 言わずと知れたネ申Excel。 |
ExcelTTM-win.xlsm | ExcelTTM本体。任意の場所に置いてください。 |
excelttm-win.exe | ExcelTTMが呼び出すプログラム。ExcelTTM-win.xlsmと同じ場所に置いてください。 |
mecab-0.996.exe | 工藤拓氏の開発した形態素解析器。MeCab downloadsからmecab-0.996.exeをダウンロードしてインストールしてください。文字コードは「Shift-JIS」を選択してください。 |
以下の3つのソフトウェアをインストール(ダウンロード)してください。MeCabのインストールは不要です。
ソフトウェア | 説明 |
---|---|
Microsoft Excel | 言わずと知れたネ申Excel。Excel 2011 for Macをインストールしてください。(他のバージョンではVBAの仕様が異なるため動作しません) |
ExcelTTM-mac.xlsm | ExcelTTM本体。任意の場所に置いてください。 | excelttm-mac.zip | ExcelTTMが呼び出すプログラム。解凍してExcelTTM-mac.xlsmと同じ場所に置いてください。 |
Win版とMac版では異なる形態素解析器を用いているので結果が一致するとは限りません。またWin版では動詞は原型に戻していますが、Mac版では戻していないという違いがあります。(正確に言えば、Mac版は形態素解析ではなく分かち書きを行っています。)
ExcelTTM-win.xlsm (or ExcelTTM-mac.xlsm) をダブルクリックして起動すると下記のメッセージが出るので、「マクロを有効にする」ボタンをクリックしてください。excelttm-win.exe (or excelttm-mac) をダブルクリックしても何も起こらないので注意して下さい。
ExcelTTM-mac/win.xlsmの「分析データ」「キーワード」「ストップワード」「同義語」シートに適宜データを入れてから、「分析データ」シート上の をクリックするとExcelTTMウインドウが立ち上がりますので、「解析」ボタンを押せば分析できます。データ範囲は自動で認識されますが、手動で変更することもできます。分析結果は「ttm0」〜「ttm6」シートに出力されます。各データの詳細については、拙書「人文・社会科学のためのテキストマイニング」をご参照ください。
ExcelTTM-mac/win.xlsmの「分析データ」「キーワード」「ストップワード」「同義語」シートにサンプルデータが入っているので、それを参考にしてください。
よくある質問とそれに対する回答を以下にまとめておきます。
質問 | 回答 |
---|---|
ExcelTTMウインドウを出したままデータを編集するとフリーズします。 | いったんExcelTTMウインドウを閉じてからデータを編集してください。 |
アイコンをダブルクリックしても開きません。一瞬開きかかけるのですが、すぐウインドウが閉じます。 | excelttm-win/macではなく、Excelファイルのほうをダブルクリックして起動してください。 |
エラーが出て分析できません。 | 入力データに不備があると動きません。空のセルがある、セルのどこかに改行が入っている、はデータにゴミ(フォントの種類とか大きさとか色とかの情報など)がついてる、といったことが原因なので、ExcelのCLEAN関数等を使ってデータを綺麗にしてください。 |
エラーが出て分析できません。 | ExcelTTM-mac/win.xlsm と excelttm-win.exe は同じ場所に置かないと動きません。同じ場所に置くようにしてください。 |
エラーが出て分析できません。 | ExcelTTM-mac/win.xlsm と excelttm-win.exe の置き場所へのパスに日本語や半角スペースが含まれていると動きません。日本語や半角スペースを含まない場所に置いてください。 |
エラーが出て分析できません。 | (Win版のみですが)MeCabのインストールができていないと動きません。そのときはMeCabをインストールしてください。 |
エラーが出て分析できません。 | (Win版のみですが)「Program Files」と「Program Files(x86)」が存在するときに、MeCabが「Program Files」にインストールされていると動きません。MeCabを「Program Files(x86)」に再インストールして下さい。 |
またベータ版ということでバグが潜んでいる可能性が大いにあります。お気づきの点やご要望などありましたら下記までお知らせ下さい。
松村真宏 <>三浦麻子 <>
2009年春に三浦さんとの共著で「人文・社会科学のためのテキストマイニング」を出版し、2014年にその改訂版を出版しました。この本のウリは、なんといっても独自に開発したテキストマイニングのフリーソフトウェアTTMの導入から使い方まで詳しく解説していることです。テキストマイニングは技術的・金銭的理由から初心者には敷居がとても高いのですが、めんどくさい処理は全てTTMが行いますので、この本を読んでいただければ誰でも簡単にテキストマイニングを行うことができるようになっています。また、OpenOffice, R, Wekaとの連携、分析手法の詳細、応用事例などにも力を入れており、これ一冊でテキストマイニングの基礎的な知識を網羅的に習得することができますので、人文・社会科学系の学部の教科書や副読書としても最適な内容になっています。Kindle版もあります。