リンク: [ホーム] [自己紹介] [リンク集] [アルバム] [ソフトウェア] [発表文献] [その他]

まさおのChangeLogメモ / 2005-06-16

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2005-06-16 Thu

* Automatic Identification of User Goals in Web Search

http://www2005.org/cdrom/docs/p391.pdf
doi:10.1145/1060745.1060804
ユーザのクエリからNavi/Infoの2種別を自動判別する手法の提案。

・書誌情報:
 Uichin Lee, Zhenyu Liu, Junghoo Cho:
Automatic Identification of User Goals in Web Search.
In Proc. of WWW2005, pp.391-400. (2005)

・概要:
ユーザの検索質問ログからinfo/naviの2種類のどちらであるかを自動判別
する。

* A Taxonomy of Web Search

doi:10.1145/792550.792552
Web検索を3つに分類した論文。

・書誌情報:
Andrei Broder: A Taxonomy of Web Search. ACM SIGIR Forum, Vol.36,
No.2, pp.3-10. (2002)

・概要:
伝統的なIR研究で使われてきた「情報要求→クエリ→DB」といったモデル
をタスク指向のものに変えるべきとし、情報要求にあてはまらないニーズ
について、informational/navigational/transactionalの3つで考えてい
くと良いのではないかとした。

→ informational: (古典的な情報要求)と近い概念。
→ navigational: 特定のサイトにアクセスしたいという要求
→ transactional: サイトにアクセスし、さらにそこで何かの行動を行な
いたいという要求(買い物、ゲーム、)。

著者は元AltaVistaの研究員で、実際の検索質問の分析と、ユーザへのア
ンケート調査の2つから、それぞれの質問の割合などを分析(図5):

        ユーザ調査 ログ
Navi: 24.5% 20%
Info: (39%?) 48%
Trans: >22% (36%?) 30%

・感想:
ナビゲーション指向検索などの用語の元となった、非常に重要な論文と思
われる。

「トランザクション指向検索」そのものに焦点を当てた研究がないのか、
気になる。

* Sampling Search-Engine Results

http://www2005.org/cdrom/docs/p245.pdf
doi:10.1145/1060784
WWW2005 の論文。

・書誌情報:
Aris Anagnostopoulos, Andrei Broder, David Carmel:
Sampling Search-Engine Results. In Proc. of WWW2005,
p.245-256. (2005)

・概要:
サーチエンジンの結果などからサンプル抽出を行う手法の提案。

件数全体を知らない状態でもストリーム指向に使用できる。

・感想:
いやはや、なんだかよく分からんかった。途中からは数式の嵐。。。
よく分からないというのが感想。

一応、検索結果集合を厳密な計算なしでうまくサンプリングしてやれば、
検索件数の推定に使ったり、検索結果のクラスタリングに使う次元数を決
めたり、といった使い道がある模様。

個人的には、WAND という AND/OR 演算を高速化するための手法について
の解説があったのが収穫。

WAND:

WAND(X1, w1, ..., Xk, wk, θ)

if Σi(Xi * wi) >= 0
==> true

AND/OR は以下のように代替できる。

AND(X1, .., Xk) === WAND(X1, 1, ..., Xk, 1, k)
OR(X1, .., Xk) === WAND(X1, 1, ..., Xk, 1, 1)