リンク: [ホーム] [自己紹介] [リンク集] [アルバム] [ソフトウェア] [発表文献] [その他]

まさおのChangeLogメモ / 2005-09-28

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2005-09-28 Wed

* Image retrieval and disambiguation for encyclopedic web search

藤井先生のIJCAI2005でのポスター発表論文。

・書誌事項:
Atsushi Fujii, Tetsuya Ishikawa:
Image Retrieval and Disambiguation for Encyclopedic Web Search.
IJCAI2005. 2005.

・概要:
多義性を持つ語句の画像検索の手法として、近接度に応じた重み計算手法
の提案。

手元で Yahoo! Japan の画像検索結果をベースラインとして、多義性を持
つ用語22語で人手で適合判定を行ったデータを使い、その精度を比較し、
10位以内での正解出現率93.6%と良い性能を得た。

・感想その他:
どうやら藤井さんが3月の言語処理学会で優秀賞を取った内容の原稿らし
い。

* 英語で自己紹介

(Hi,)
(Nice to meet you.)

I'm Masao Takaku, a (post-Doc) researcher in (here) NII.

I'm working on NTCIR Web task with Prof.Oyama, (Prof.Eguchi) and
Prof.Kando.

I'm a graduate from Univ. of Lib. and Info. Sci.

I got a phD from Univ. of Tsukuba.

(Thank you.)

* Evolution of document networks

Webリンクネットワークの構造とその生成モデルについての論文。
doi:10.1073/pnas.0307554100

・書誌事項:
Flippo Menczer: Evolution of document networks. Proceedings of the
National Academy of Science. Vol.101, suppl.1, 2004, pp.5261-5265.

・概要:
Webリンクからなるネットワーク構造は、べき分布に従うことが知られて
いる。つまり「人気のあるページほどよりよくリンクされる」のだが、そ
れだけを元にした単純なネットワークモデルではWeb全体のリンク生成モ
デルを構築できず、「似た文書はよく似た文書同士とよりよくリンクする」
という文書内容の類似関係も考慮し、ミックスしたモデルによる定式化が
必要となる。

ミックスモデルとして、リンク関係はJaccard係数を、文書内容の類似度
としては文書ベクトルのコサインを用いて、リンク生成モデルを定式化し、
Web文書集合としてODPから抽出した11万ページ程度のデータ、および科学
論文文書集合としてPNASの16000文書程度のデータで実験を行い、実際の
分布ともよりフィットするモデルであることを実証した。

・感想:
最近話題のネットワーク理論畑での論文。
だいぶ前から積ん読になっていたため、どういう経緯で読むことにしたか
は忘れたが、短い論文でもあり、意外と読みやすい。

なお、この雑誌は参照文献の書誌事項にタイトルを入れないスタイルなの
だが、これは非常にイライラする。

* Book lovers beware

A survey of online research habits of
Stanford Law Library:
スタンフォードロースクールでの学生のオンライン活動の利用調査アンケー
トのまとめ。

学生の図書館利用動向のアンケート調査で、オンライン調査をどの程度使っ
ているかを聞いてみたところ、思ったよりも高い割合になったとの報告。

ロースクールは全学で550人程度の学生数で、2002〜2004年の3年分の調査
によれば、調査研究作業の80%以上をオンラインで行うと答えた学生は、
2002年は75%、2003年は83%、2004年は93%の割合にのぼったとのこと。