Webリンクネットワークの構造とその生成モデルについての論文。
doi:10.1073/pnas.0307554100
・書誌事項:
Flippo Menczer: Evolution of document networks. Proceedings of the
National Academy of Science. Vol.101, suppl.1, 2004, pp.5261-5265.
・概要:
Webリンクからなるネットワーク構造は、べき分布に従うことが知られて
いる。つまり「人気のあるページほどよりよくリンクされる」のだが、そ
れだけを元にした単純なネットワークモデルではWeb全体のリンク生成モ
デルを構築できず、「似た文書はよく似た文書同士とよりよくリンクする」
という文書内容の類似関係も考慮し、ミックスしたモデルによる定式化が
必要となる。
ミックスモデルとして、リンク関係はJaccard係数を、文書内容の類似度
としては文書ベクトルのコサインを用いて、リンク生成モデルを定式化し、
Web文書集合としてODPから抽出した11万ページ程度のデータ、および科学
論文文書集合としてPNASの16000文書程度のデータで実験を行い、実際の
分布ともよりフィットするモデルであることを実証した。
・感想:
最近話題のネットワーク理論畑での論文。
だいぶ前から積ん読になっていたため、どういう経緯で読むことにしたか
は忘れたが、短い論文でもあり、意外と読みやすい。
なお、この雑誌は参照文献の書誌事項にタイトルを入れないスタイルなの
だが、これは非常にイライラする。