リンク: [ホーム] [自己紹介] [リンク集] [アルバム] [ソフトウェア] [発表文献] [その他]

まさおのChangeLogメモ / 2008-12

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

2008-12-31 Wed

* 今月読んだ本

11月末の図書館展からはじまるスケジュールに追われて、本を読む時間を
取ることもできず…といった感じだった。

4冊:
[2008-12-15-1] 恋する天才科学者
[2008-12-24-1] 「使い勝手」のデザイン学
[2008-12-28-1] 金属物理博物館
[2008-12-28-2] 地球最後の男
Referrer (Inside): [2009-01-03-1]

2008-12-28 Sun

* 地球最後の男 [book]

今年、ウィル・スミス主演で『アイ・アム・レジェンド』の邦題で公開さ
れたハリエッド映画の原作。

1970年代のかなり古いSF小説で、舞台もアメリカのありがちな郊外都市を
舞台にしているけれど、ホラー感覚を混じえた風味は古さを感じさせず、
優れた短編作品といった趣きを感じる。

DVDレンタルの宣伝でウィル・スミス主演の方の予告編だけを何度も観さ
せられて気にはなったのだけど、かなり設定依存な雰囲気があったので、
原作だけ読めば十分かな…という意味で読んでみたが、たしかにまあ映画
はもう観ないでもよいかな、、、という気がする。

* 金属物理博物館 [book]

古今の金属物理の実践と理論を平易に解説した入門書。

人と金属のつながりという観点から、石器・青銅器時代の原初期から説明
をはじめ、中世の錬金術に至るまでの金属加工技術の発展を追い、近代科
学に入ってからは、各種理論・分野を幅広く解説している。

なにより各国の科学者の個性に触れながらの解説によって、とても楽しげ
な科学研究のプロセスを語っており、その中に理論・原理の解説を混ぜる
というバランスに優れた良書のように思う。

「初学者にも…」とある通り、専門的な箇所はかなり読み飛ばしたものの、
門外漢の自分でも楽しく読めた。
Referrer (Inside): [2009-01-21-2] [2008-12-31-1]

2008-12-27 Sat

* ライラの冒険 黄金の羅針盤 [movie]

少女ライラが真実を示すという魔法のコンパスを手に冒険を繰り広げると
いうファンタジー小説を原作とした映画化第1弾。

全体に駆け足な展開といった印象で、全体の世界観に付いていくのが難し
かった。たとえば、ストーリー上もダイモン(Daemon?)という概念を理
解する必要があるのだが、ほとんど説明されないため、クエスチョンマー
ク状態でストーリーだけが進んでいってしまう。。。
すなおに原作を読んでみたほうがよさげな気がする。

エンディングも相当にクリフハンガーな展開で、次回作以降の3部作での
完結が待たれるところだが、噂では金融危機によって映画制作がストップ
してしまったとか。こうなるとハリーポッターシリーズとは違って、少女
役の再演が難しそうな雰囲気ではある。。。

2008-12-26 Fri

2008-12-25 Thu

* Firefox3の証明書情報表示が長すぎてURLが読めない

SSL証明書の表示名が長い場合、証明書の表示機能のせいで肝心のURLが読
み取れないという本末転倒な感じ…。
例: https://app3.infoc.nedo.go.jp/

参考までに、Windows Vista上でのFirefox3.0.5およびIE7のスクリーン
ショットを貼っておく:




(2009-01-28 追記) バグ報告しておいた:
http://bugzilla.mozilla.gr.jp/show_bug.cgi?id=6500

2008-12-24 Wed

* 「使い勝手」のデザイン学 [book]

日常にありふれる日用品を題材に、制約の中で行われるデザインのあり方
を解説した本。

特にヒトの生物的・物理的特性と向き合う必要性にも意識的で、数々の事
例紹介とともに教えてくれるのがとても参考になった。

人間の行動の大半には何らかのデザインが絡んでいるので、わたしたち
は、デザインに何がついてまわるかを本能的に知っている。九時になら
ないと放映しない番組は八時には見られない、と承知している。テレビ
を二台並べるか、手持ちのテレビに子画面表示の機能がついているかし
ないかぎり、いちどに二つの番組を見られないのを知っている。たとえ
その技術的な能力をもっていても、本当の意味で二本のミステリー映画
を同時に見て、両方の筋書きをきちんと把握しつづけることはできない
とわかっている。選択の必要性と、それを避けようとするのにかかる代
価を理解している。音量を、眠っている赤ちゃんに聞こえないほど小さ
く、しかも自分たちが耳をそばだてたり、肝心のせりふを聞きのがした
りせず番組を聞いていられる程度に大きくすることはできないと知って
いる。テレビを見るというような、ごくありふれた行為の本質を理解し
ているからこそ、わたしたちはデザインの本質がわかり、完璧を達成す
ることの難しさがわかる。完璧なものが何もないというのは、デザイン
に対する批判ではなく、その原因が人間にあると認めることにほかなら
ない。
(p.19より引用)
Referrer (Inside): [2008-12-31-1]

2008-12-22 Mon

2008-12-21 Sun

* The Closer (Season 1 & 2) [movie]

ロス市警の女性敏腕捜査官を主人公にしたドラマ。プロットもわかりやす
く、それでいて登場人物たちのキャラクターが効いたドラマで比較的楽し
く観ることができた。(このあいだ観たHEROESよりはずっとマシ。。。)

ただし、尋問の専門家で自白させるのが見せ場という設定は、5年くらい
まえから流行っているCSIなどへのアンチテーゼなのかなと思うが、一方
で逆に言えば、かなり憶測・予断にもとづく捜査をしているだけ、という
風にも見え、日本の刑事ドラマものと似た雰囲気も感じた。これはある意
味では面白いが、ずっと見つづけると若干食傷気味となる感もある。

2008-12-19 Fri

* NTCIR-7成果報告会から帰ってきて思ったこと

この10年に渡って続いてきたNTCIRプロジェクトは、情報検索や質問応答、
自動分類といった情報アクセス要素技術の研究コミュニティの基礎評価デー
タを提供するために行われ、各タスクで配布された共通データセットを元
に新しい要素技術の開発を行ったうえで、その評価を行い、タスク終了後
にはそのデータセットを一種のベンチマークとして、実験の再現性を確保
しつつ、新たなアイデアの創出を促すというものだった。

今週、東京の国立情報学研究所において、一年半ごとの開催としては7度
目の成果報告会が開催された。

今回は、以下の4つの主要タスクで行われた成果が報告された。
- ACLIA(言語横断質問応答)
- MOAT(意見抽出)
- PATENT(多言語特許の翻訳とマイニング)
- MuST(動向情報の抽出と可視化)

4日間フルに参加したらかなりグロッキー状態になったので、NTCIR自体の
説明は酒井さんのブログ等に譲り、成果報告会の個別の報告についても言
及しないが、NTCIRのような学術研究コミュニティ主導型プロジェクトの
発展可能性と、その限界について考えてみたい。

とくにタイムリーに公開された記事「ウェブサイエンスの抱える『再現性』
の問題」で指摘されている課題とかぶる点があるので、それにあわせて、
上記記事ではNTCIRのような学術主導型プロジェクトによるデータセット
整備について触れられていないので、それを補足する形で、3年ほど前の
NTCIR-WEBタスク運営での経験から言えることがあるかもしれないという
ことで考えてみた。
cf. http://d.hatena.ne.jp/kunimiya/20081218/p1

最初に書いておくと、Web上で使われている情報アクセス技術の大半は多
くの研究の蓄積により、再現性を確保してきた。別の地域、別の時機に類
似の手法を用いた研究を行うことで、それぞれの追試はある程度までは可
能であるし、そのような蓄積の上に、どのような技術が使えるかの見通し
が付いてきたという面はある。もちろん難しいものもある。例えば、
PageRankの追試は、Googleが宣伝していることもあり、追試が盛んに行わ
えたが、それ単体でのランキング技術はそれほど使えないというのが、こ
れまでの知見だろうと思う。ただ、これを確認するにもGoogle規模のWeb
グラフデータが無いと難しいなどの点から、即座にそのような知見を出す
ことは難しかった。これこそは一種の「再現性」の難しさとは言えると思
う。ただし、これもきちんとデータに基づいた話ができれば、数年がかり
で実証できることのように思う。これは一面では、科学そのものが捏造と
いった意図的な不正に弱いという、他の分野で言われてきたことそのもの
かもしれない。

さて、NTCIRに関して事業者とのやりとりという意味では、一つには、既
存の紙媒体出版におけるものが進んでいるということが挙げられる。新聞
記事データは、NTCIRに限らず、言語資源を用いた研究でとても重要なデー
タであるため、各新聞社との交渉にもとづいて商用の電子化済データを契
約している。このように元の電子化リソースに市場価値があるものであれ
ば、学術目的利用との契約を交すだけで使いやすい土壌を努力して作って
きた。NTCIRでも初期から、参加者に新聞記事データを配布しているが、
これはその方式に則ったものだ。

一方で、Webを対象にした場合はだいぶ様相が異なるのは言うまでもない。
Webに関しては個別のライセンシング方式をまかなうだけの基盤が原理上
存在しないので、たしかにid:kunimiya氏が指摘するような、事業者単位
でのライセンシングはある程度有効な手立てだろうとは思う。一方で、そ
れに依存してしまうと、研究基盤が脆弱になってしまうという問題もある。
たとえば、Google Web APIがSOAP方式の提供を停止してAjax APIのみに移
行してしまって、それを活用する形での研究は難しくなっているし、ノウ
ハウの共有という意味でも、数年くらいの停滞を余儀なくされた研究室は
多いのではないかと思う(幸いにYahoo APIがそれを代替する形で使われ
るようになってはいるが…。)

もう一点指摘しておかないといけない点は、著作権制度などのような社会
との関係についてだ。Webのアーキテクチャおよび大規模データという特
性は、個別ライセンスであれ一括ライセンスであれ、利用許諾を得ること
は実質的には困難であるという土壌を持っている。このため、Webを対象
とした研究を行う際には、研究利用目的であろうと社会規範との調整は必
要となる。とくに再現性、もしくは再利用性を考慮したデータセットを扱
う時はとりわけだ。たとえば、今回のNTCIR-7の意見分析タスクでは、当
初Webからクロールしてきたブログデータを使ったデータセットを配布す
る予定だったが、現行著作権制度のもとでは配布は難しいとの理由から、
新聞記事を使ったタスクに切り替えざるをえなかったと聞いている。次回
以降はフェアユース制度の採用に期待しつつ、という話もあったと聞いて
いる。社会制度上の解決をはかるためには、時には社会に積極的に働きか
けないといけない場合もあるのかなと思う。

一方で、NTCIRの限界としては、技術評価のためのワークショップである
という性格から、1)共通のタスクが用意でき、ある程度の参加者が確保
できるタスクに限られ、かつ、2)そのタスクの評価技術がある程度まで
固まっているようなものに限られるという点がある。
今回のMuSTで見られるような情報可視化のようなタスクに関しては、なか
なか評価までは辿りつかないのが現状だろう。そもそも評価が難しい研究、
そういった分野にこそ、ほんとうは再現性が求められるのかもしれない。


(2008-12-27 公開: NTCIR成果報告会後に下書きしていたものを中途半端
ながら置いておく)

2008-12-18 Thu

2008-12-17 Wed

* Scanpath2SVG

CRESプロジェクトで開発した、視線データを元に検索結果一覧ページでの
探索過程を可視化するツールを公開しました。Web利用者がサーチエンジ
ンの検索結果一覧ページを閲覧した際のおおまかな動線を、いくつかのセッ
ション全体をまとめて可視化できるようにSVG形式で出力できます。

http://cres.jpn.org/scanpath2svg/

昨日のEVIA 2008ワークショップにてショート発表したものです:
Egusa, Y.; Takaku, M.; Saito, H.; Terai, H.; Kando, N.; Miwa, M.:
Visualization of User Eye Movements for Search Result Pages
Proceedings of the Second International Workshop on Evaluating
Information Access (EVIA 2008) (Satelite Workshop of NTCIR-7);
pp.42-46; (2008-12)
http://research.nii.ac.jp/ntcir/workshop/OnlineProceedings7/pdf/EVIA2008/08-EVIA2008-EgusaY.pdf

ランキング上のアブストラクトに対する視線データをいったん中間的な形
式に変換したものを入力とするようにしましたので、視線追跡装置の種類
を問わずに利用できるとおもいます。
※ただし、ランキング上のアブストラクトと視線データとがあらかじめ関
連付けられていることを前提としています。

使い方、活用法、提案、質問などありましたら、上記ページの連絡先まで、
お気軽にご連絡頂ければ幸いです。

2008-12-16 Tue

* URL memo

- MuST - FrontPage: delicious users
動向情報の要約と可視化に関するワークショップ

2008-12-15 Mon

* 恋する天才科学者 [book]

著名な科学者の伝記だが、「家庭生活」という軸から科学者たちの習性を
浮き彫りにしようという試み。科学における成果に対して人格的な特性が
どのように貢献したかが明らかになる!? (本当か??)

以前読んだ「キュリアス・マインド」の大人読者向けといった編集意図か
と思う。

あくまでも歴史上の科学者だから良いようなものの、存命の人物であった
なら、こういった批評はできないだろうな、という気はする。研究コミュ
ニティの中でのどろどろの女性関係というのは、聞かないこともないので、
欧米だったら本人原稿として書かせてみるという手もあるかもしれんが…。

おもわず、身の周りでも連休中にばんばんメールが飛んできて、家庭生活
は大丈夫かしらん?と心配してしまったのを思い出した、のは内緒。。。
Referrer (Inside): [2008-12-31-1]

2008-12-14 Sun

* 郵便番号検索のデータを更新 [website]

年賀状の季節が近付いたので、郵便番号データを2008年11月28日版に更新
しました:

../etc/zipcode.cgi

2008-12-10 Wed

2008-12-09 Tue

* CVS-pserver+SOCKS

職場だとファイアウォールの設定で外部の cvs-pserver へのポートがあ
いていないので、SOCKS サーバ経由のアクセスを試してみた。

フリーの SOCKS 実装である Dante をインストールすれば
素のままでは SOCKS に対応していない cvs などのコマンドも

% socksify cvs -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/pukiwiki login
% socksify cvs -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/pukiwiki co pukiwiki

といった感じで socksify コマンドを経由してアクセスできるようになる。

設定としては、/etc/socks.conf に以下の設定を追加するだけ。

route {
        from: 0.0.0.0/0 to: 0.0.0.0/0 via: 144.213.2.10 port = 1080
        protocol: tcp udp # server supports tcp and udp.
        proxyprotocol: socks_v5 socks_v4 # server supports socks v4 and v5.
        method: none #username # we are willing to authenticate via
                                         # method "none", not "username".
}

cf. http://sho.tdiary.net/20030624.html#p02

2008-12-08 Mon

2008-12-06 Sat

2008-12-05 Fri

2008-12-04 Thu

2008-12-03 Wed

* メールアドレス masao@nii.ac.jp 失効

先に書いたとおり[2008-11-24-3]、以前の職場で使っていたアドレス
masao@nii.ac.jp が移動後3ヶ月を経て、12月1日付けで失効しました。

上記アドレスに送られたメッセージは既に確認できませんので、今後は
tmasao@acm.org 宛までお願いします。

なお、先に書いた通り、気が付いた範囲ではメールアドレスを更新してあ
りますが、まだ未変更のものなど残っていましたら、ご容赦くださいませ。
どうぞよろしくお願いします。

2008-12-01 Mon

サイクリング走行距離メーター
2001 : 01 02 03 04 05 06 07 08 09 10 11 12
2002 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12