Thu, 29 Jan 2009
トントカイモ氏によるテキストマイニング分析発表会より転載.
娘中心の生活が読み取れますね。
あるいは、帰宅を中心に考えることもできそう。
しかし、奥さまが遠くにいるのがちょっと気になります・・
その辺りスライドでは全く説明抜けておりましたが、
描画にはFruchterman and Reingold の改良版力指向アルゴリズムを用いております。
このアルゴリズムにおいて、各ノードは単に見やすさのため重複しないように
配置されているだけであって、ノード間の距離は共起度と全く関係有りません。
というわけで、ご夫妻の関係を伺い知ることは殆ど出来ませんでした。残念です。
> あるいは、帰宅を中心に考えることもできそう。
よしろう先生の千里眼鋭すぎ・・・
> しかし、奥さまが遠くにいるのがちょっと気になります・・
位置についてはトントカイモ氏の説明のとおりですが,
色が紫色じゃないということは媒介中心性が低いということなのでry
Wed, 28 Jan 2009
IDMのプログラムは2002年ごろにPerlで作ったものを改良して使い続けています.当時は大規模なデータなんて簡単に手に入らなかったので,メモリ効率や処理速度に特に気を配らなくてもよかったのですが,最近では大規模データ(Yahoo!知恵袋データセットだと質問と回答の本文約16億文字,質問数311万件,回答数約1347万件,EDGE Datasetだとlivedoorクリップデータ155MB,ICWSM 2009 Spinner3r Blog Datasetだとブログデータ142GBなど)が簡単に入手できるようになってきました.今後もIDMの研究を続けていくためには,プログラムのメモリ効率と処理速度を大幅に改良する必要があったので,覚え立てのC++で書き直してみました.まだ基本的な機能しか実装できてない(メッセージ,投稿者,語の影響量が出るだけ)ですが,5倍くらい早くなりました.簡易ベンチマークは以下の通り.
IDM on C++ real 0m3.106s user 0m2.918s sys 0m0.142s 使用メモリ 約30MB IDM on Perl real 0m16.758s user 0m15.589s sys 0m0.826s 使用メモリ 約300MB
Tue, 27 Jan 2009
トントカイモ氏の分析によると,当Wahaha-blogの最頻出語は「娘」であることが判明いたしました.日本を代表するストイックな学術研究ブログ,という当初の狙いは達成されていないようです.
確かに,書き込みテスト直後のエントリはSEMの多重指標モデル云々とあり,実に学術的でしたね.とりあえず右の「about」を書き換える必要があるのでは(笑
自分のためにもなるし,今度挑戦してみよう.
ゼミ生がTTMとMeCab(とR)をUSBに入れて持ち運んで使ってる,というのを聞いて試してみたら本当に動きました.気軽に持ち運べるので,いままで思いつかなかった面白い使い方ができそうです.あっちょんぶりけ )゚0゚(
おお、なるほど。確かにいちいちいろんなPCに同じ環境を再現するのは面倒だったんです。他のソフトじゃなかなかそうはいかないでしょうから、これもアピールポイントの一つとして本の原稿に加えてもいいかも。
Mon, 26 Jan 2009
今更ですがニコニコ動画のデータ分析研究発表会なるものがあったことを知りました.ここに資料がアップされていたので一通り目を通しました.ニコニコ動画はときどき見る程度であまり詳しくないのですが,十分楽しめました.
娘がトトロを作ってきました.
トトロ
トトロが吠えてるところのマネ
JSAI2009 Community Webプラットフォームに発表申込をしました.pya!水玉潰しで遊んでいて閃いたアイデアなので,pya!水玉潰しをリスペクトしてこのようなタイトルにしました.
演題:IDM!水玉潰し 著者:松村真宏(大阪大学) 概要:本研究では,影響伝播モデルIDMを用いてウェブコミュニティが蓄えている総影響量GWI(Gross Web Influence)を定義し,GWIを成長させるための道標を導くことに取り組む.具体的には,各種制約下(与える情報の種類および量)のもとでGWIを最大化する条件(どこにどの情報を与えるか)を求める問題に取り組む.本研究の成果は,コミュニティマネジメント/マーケティングへの応用が期待される.
データセットにはEDGE Datasetsを使う予定です.
おもしろそ・・
このさきどこに行くのでしょう。楽しみです。
どこに行き着くんでしょうね.
Sun, 25 Jan 2009
海遊館に行ってきました.阪神高速を使ったら30分弱で到着.阪神高速はいかつい運転する人が多しい車線変更しまくらなあかんので嫌いなんやけど(新型GTRが爆走しているのを見れたのは面白かった),やっぱり便利なんやな.海遊館は最初に長いエスカレーターで上に上がって,巨大水槽の周りをクルクル回りながら降りる構造になっていますが,混み具合は入口から出口に向かって単調減少するので,出口付近になるとみんな足早に通り過ぎていきます.なので,出口付近のベンチに座ってゆっくり巨大水槽を見るのがお勧めです.
Fri, 23 Jan 2009
ここ2週間くらい22時前に布団に入って朝5時前に起きる生活が続いています.最近は朝起きるのも全然辛くないので,すっかり早寝早起きが習慣になりました.朝は頭も冴えるし,夜食も食べなくなるし,いいことずくめです.
でしょー。私はもう8年くらい続けてますが、以前どうして遅寝遅起きしていたのか、自分の馬鹿さ加減にあきれかえります。
やっぱりめっちゃ偏ってます.ちなみに頻度の上位20タグはこんなんでした.「キャッシング」「ローン」「審査」「金融」はスパムっぽいですね.
javascript,25371 web,25229 yuiseki,20466 google,19758 ネタ,19685 あとで,17582 キャッシング,17498 2ch,16977 tips,16785 ローン,16452 あとで読む,15111 まとめ,14996 blog,14153 tool,13772 CSS,13751 未カテゴリ,13444 審査,13274 hatena,12622 design,12502 金融,11651
奥さんに女試しを試してもらったら,なんとmoteQが100でした.「阪大現役/OG/OBのmoteQは20以下」という仮説は棄却されました.
こっそり阪大OGですが58でした。でも100ってすごいですね。
ゼロ!
をたたき出してしまいました.ikuさん共々「外れ値」ということで.
僕の授業の受講者のトントカイモ氏(一応匿名にしとこう)が,EDGE Datasetsの整形ソフトClipGetterを公開しています.ClipGetterおよびマニュアルをEDGE Datasetsを用いたテキストマイニングで公開していますので,ご興味のある方はどうぞ.TTM用のフォーマットを出力できるところがマニアックで素敵です.
ちなみに,EDGE DatasetsについてくるREADME.txtには,データをパースするperlスクリプトが付いてます.
Thu, 22 Jan 2009
男だけど女試しをやってみたら凄い偏差値が出てしまった.男で良かった.
私なんて10でしたよ.しかしIQの満点が100ってどういう求め方をして…なんて正規分布を見せられたら考えてしまうからこんな値なんでしょうね.
まあasarinさんを見てると10なのも分か(ry
きっと現役OBOG阪大生の共通点に違いない.
Wed, 21 Jan 2009
LeSportsacのMini bag(オニキス)が届いた.軽いし洗濯できるし安いし(楽天で買ったら55%割引だった),かなり満足.
Mon, 19 Jan 2009
今のうちに習得しておかないと一生使えないような気がしたので,今年の目標の一つにC++でプログラムを書くことを挙げています.学部4回生のときに少し使ったことがあるくらいだったので,きれいさっぱり忘れています.そういうわけで,Perlで書けば10分くらいでかけるプログラムを,勉強しながら1週間くらいかけてC++で作りました.全然知らなかったのですが,STLやBoostって便利ですねー.もう少し慣れればPerlとそんなに変わらない時間でプログラムも書けそうです.timeコマンドによる簡易ベンチマークを見ると,確かに高速化しています.XcodeのGCCのバージョンが4.3になればマルチコアCPUの恩恵も受けられるので,そうなればC++がもっと早くなりそうです.
C++版 real 0m0.692s user 0m0.242s sys 0m0.135s Perl版 real 0m2.363s user 0m1.907s sys 0m0.166s
Sun, 18 Jan 2009
空けてみました.婦人服,ディズニーの膝掛け,紫色の女性用ダウンジャケット,おもちゃのブレスレット,メガネ拭き,商店街で使える各種クーポン券(コーヒー紅茶ペア無料券とか証明写真500円引き券とか実印2000円割引券とか)などがたくさん入っていてお得でした.特に証明写真はちょうど撮りに行こうと思っていたところだったので,早速使わせていただきます.
娘が18日(土)から急にいろんなものを指さして「これなあに?」と聞いてくるようになりました.聞かれてみると知らないことだらけで,まともに答えられないことが多いことに気づかされます.娘にフィールドマイニングの極意を教えてもらいました.
奥さんが本厄なので水月公園の近くの尊鉢厄神で厄払いしてきました.学生のころはこの近くに住んでたので水月公園は知ってたけど尊鉢厄神は知りませんでした.屋台が沢山出てたのでたい焼きベビーカステラを買い食い.東京コロッケという小さい球形のコロッケが売られてたけど,東京の屋台では見たことないものが売られてました.大阪では売られてない大阪焼きみたいなもんかな.
石橋商店街のおはこ市で新春おたのしみ大会があるというので,尊鉢厄神の行きと帰りにぶらっと立ち寄って,豚汁と蒸しパンと焼き芋を買い食い.堤さん曰く「売れても売れなくても赤字」という福袋も長い列に並んで買ってみた.まだ空けてないので空けるのが楽しみです(娘が昼寝から目覚めたら一緒に空ける予定).
阪急西宮ガーデンズに行ってきました.中央にどーんと吹き抜けの空間があって,その周りに様々な店舗が立体的に配置されていて,最近よく見かける構造の大規模でオシャレなショッピングモールでした.
午前中はけっこう空いてたのだけど,昼からどんどん混み始めてきて,飲食店舗には軒並み長い行列ができてました.フードコートも,僕たちはちょっと早めに行ったのでまだ空いてる席があったのですが,12時すぎからの席取り争いは大変そうで,そこらじゅうでピリピリした空気が漂ってました.
食後にコールド・ストーン・クリーマリーでアイスクリームを食べたのだけど,店員さんたちがみんなで楽しそうに歌を歌いながらアイスクリームをこねてくれるパフォーマンスはとても良かった.元日に行った中谷堂の餅つきもそうだけど,作っている工程そのものをパフォーマンスにする仕掛けは,うまくいけばかなりの集客効果があると思う.
ガーデンズ内は空調が効いてて暖かかったのだけど,娘が「お外がいい!」というので,寒空の下ガーデンズ屋上のスカイガーデンでも遊んできました.噴水の広場があるのですが,大人は寒そうにじっとしているのに,子供たちは走り回って水と戯れてました.寒いからこそ動きまわるべきなんだなぁと思い,僕も娘と走り回ってました.ガーデンズのレストラン街も混みまくってたので,駅前の居酒屋ふじや本店で夕食を済まして帰宅.
Fri, 16 Jan 2009
JSAI2009「Community Webプラットフォーム」論文募集
6月に香川で開催される人工知能学会全国大会において近未来チャレンジ「Community Webプラットフォーム」セッションの論文を広く募集しています.ご興味の方はぜひ発表・参加をご検討ください.
第23回人工知能学会全国大会(JSAI2009) 近未来チャレンジ(サバイバル・オブ・チャレンジ)セッション 「Community Webプラットフォーム -ブログ・SNS・ソーシャルウェアの未来形-」 論文募集のお知らせ http://sites.google.com/site/communitywebplatform/cfp09 -------- 主催:社団法人 人工知能学会 日時:2009年6月17日(水)~6月19日(金) ※セッションの日時は未定です。 場所:サンポートホール高松(香川県高松市) オーガナイザー: ・大向 一輝(国立情報学研究所) ・松尾 豊 (東京大学) ・松村 真宏(大阪大学大学院) ・福原 知宏(東京大学) ・武田 英明(国立情報学研究所・東京大学) 申込方法: 発表申込・論文作成に関しては人工知能学会全国大会の手順に準じます。 詳細は全国大会のページをご覧ください。 http://www.ai-gakkai.or.jp/jsai/conf/2009/index.php/application 申込締切:2009年1月26日 (月) 14:00 投稿締切:2009年4月20日 (月) 14:00 申込の際には、発表カテゴリを「近未来チャレンジ」とし、 「Community Webプラットフォーム」を選択してください。 発表方式: 受理された論文は当セッションで口頭発表(発表15分・質疑5分) していただきます。また、セッションの全体について、参加者の みなさまから評価をいただきます。 内容: 現在のWebは、これまでの「巨大な辞書」という役割だけではなく、個人間のコミュニケーションの基盤としての機能を持っています。とくに、ブログやソーシャルネットワーキングサービス(SNS)の普及によって、個人が記名性あるいは自己同一性を持ちながら他者とコミュニケーションを行うことが容易になりました。すでに、海外では数億人以上、国内でも1千万を超えるユーザがこういったサービスを日常的に利用するようになり、今後もその数は増加するものと思われます。また、ユーザの増加にともなって、Web上で流通する情報量も飛躍的に増大しています。 このような状況の中で、人工知能研究の対象である情報・知識・コミュニティといったものが質・量ともに大きく変わっています。個人の持つ主観的な情報が容易に発信できるようになり、個人同士のつながりが可視化されるようになったことで、それらの集積による「コミュニティに支えられた知識」の姿が見えるようになるのではないかと期待されています。また、ここで得られた知識は、将来的にはエージェントや、エージェントの活動の場であるセマンティックWebに生かすことが可能であると思われます。 近未来チャレンジ「Community Webプラットフォーム」セッションでは、変化し続けるWebを、個人-コミュニティ-情報-知識といった視点から研究し、議論する場を提供したいと思います。現在Webの分野で活発に研究を行っておられる皆様のご投稿をお待ちしています。 研究テーマ: 「Community Webプラットフォーム」では、知識共有や社会ネットワーク分析、セマンティックウェブなど、幅広い領域を対象としています。下記テーマ以外にも、Webやコミュニティに関する研究を広く募集します。 ・知識共有システム ・ブログ ・SNS ・ソーシャルタギング ・フォークソノミー ・実世界情報の利用 ・コミュニケーション分析 ・キーワード抽出 ・キーパーソン抽出 ・ソーシャルネットワーク抽出 ・ネットワーク分析 ・スモールワールド ・スケールフリーネットワーク ・セマンティックウェブ ・オントロジー ・メタデータ ・トラスト ・ウェブアプリケーション ・インターフェイス ・その他 お問い合わせ先: 大向 一輝(国立情報学研究所)i2k {at} nii.ac.jp http://sites.google.com/site/communitywebplatform/cfp09
告知ありがとうございます!
というか、事前に一報せずにすみません…
何か発表しますのでよろしくお願いします!
Thu, 15 Jan 2009
パスポートの写真を撮らないといけないので5ヶ月ぶりに散髪に行きました.最近自分で適当にザクザク切ってたので,当たり前やけどやっぱりプロは上手なのが改めて分かりました.
Obamicom.Meで作りました.
イイ!
Wed, 14 Jan 2009
フリスクのTVCMを見てると,ケースを一振りすると同時にスライドさせてフリスクを口の中に放り込んでます.なんかかっこいいし簡単そうに思えたのでやってみたら,フリスクは一粒も口に入らずにそこら中に飛び散りました.意外と難しいです.
Tue, 13 Jan 2009
たくさん立てた今年の目標の一つは早寝早起きして朝型生活になることです.年末から夜10時すぎには娘といっしょに寝る生活を始めたのですが,早起きができずに睡眠時間たっぷりの毎日を過ごしていました.ところが,今日初めて早起きに成功しました.
18時から琉球居酒屋赤瓦で1次会,まねきねこで朝までカラオケ.
ゼミ生やゼミ生OBOGや有志のがんばりと商店街の方々のご協力により,ゑびす男選び@阪大坂2009は盛会に終わりました.今年は土曜日だったこともあって小学生も10名以上走ってくれました.また,3歳の女の子もお母さんと一緒に走ってくれて,例年にない賑わいがありました.また交流会では,ゑびす男,ゑびす娘,こどもゑびすの表彰に加えて,ふくまるくんの応援,参加者全員に商店街の商品が当たる太っ腹抽選会や池田市制施行70周年記念事業の助成を受けて作成したオリジナルTシャツを参加者全員にプレゼントする大盤振る舞いもありました.老若男女88名が阪大坂を一斉に駆け上がる様は迫力があり,交流会も大いに盛り上がったので,その勢いに押されて今年の厄もどこかに吹き飛んでいったと思います.
当日の様子はまた後日アップしようと思いますが,藤井写真館さんが今年も写真をこちらにアップしてくださっていますのでぜひご覧ください.当日の賑わいが伝わってくると思います.また,朝日新聞や産経新聞や読売新聞(YOMIURI ONLINE版はゑびす男は俺だ!88人激走(ウェブ魚拓))に記事が載りました.ケーブルテレビのJ:COMも来てたので,そのうち放送されると思います.
来年の2010年1月10日(日)も開催しますので,今後もご支援のほどよろしくお願いいたします.
Fri, 09 Jan 2009
ゑびす男選び@阪大坂2009(公式ぶろぐはこちら)がいよいよ明日に迫ってきました.降水確率が30%とちょっと心配ですが,小雨決行なのでたぶん大丈夫でしょう!
久しぶりにWii Fitを起動しました.
WiiFit君が、あまりにも久しぶりに
画面の上下がひっくり返る仕様になってたら
オモロー(んなわけないか・・・。)
目標を低めに設定したので,今度こそ続けたいと思います.
# と書きつつ,明日の朝が早いので今日はお休みしました
Thu, 08 Jan 2009
娘が「まぁいっかぁ」を連発するようになった.意識してなかったけど,僕が普段よく使っている口癖でした.まあいっか.
そういえば昔
そんな曲名のラップがありましたね
「DA・YO・NE」の後に
EASTEND×YURI
なつい
というより 古い
ちょっと前なら
(σ・∀・)σ < ゲッツ!
今なら
(σ・∀・)σ < 言うよね〜
でもやっぱり
(σ・∀・)σ < ガッペむかつく
が一番好き.
体重が過去最高の67.3kgでした.お腹周りも84cmで,メタボまであと1cmに迫ってきました.今晩からWii Fitを再開しよう.
MacBookの160GB HDDの使用率が90%を越えていたので320GB HDDに換装.これでしらばくは安心です.ググッてみるとたくさんの解説ページがヒットしますし,Appleが公開してるHard Drive Replacement Instructionsもあるので,MacBookのHDD換装は非常に簡単でした.
9月頃から取り組んでいたTTM本が無事脱稿しました.春頃に刊行される予定です.人文・社会科学の学生や研究者向けのテキストマイニングの本で,教科書にも使う予定なので,来年度からは授業も楽になりそうです.あと,去年の11月末に脱稿した社会知本もそのうち刊行される予定です.新年早々肩の荷が下りてすっきりしました.
年末年始は京都で2泊,徳島で2泊,淡路島で1泊ゆ.京都では元日には近所の初詣の帰りに奈良にも出かけて中谷堂の高速餅つきをみたり,ならまちを散歩したり.徳島ではお墓参りをしたり,あらしに舌鼓を打ったり.淡路島ではウェルネスパーク五色ゆ〜ゆ〜ファイブで温泉につかったり,ふぐ和でふぐ料理を堪能したり,イングランドの丘でコアラを見たり.そんな感じでゆっくり過ごしてきました.