2006年の仕事納めなので、今年やってきたお仕事と、来年に向けての抱負
を述べたい。
今年は1月に所属を機構本部付きに異動したのが一番大きな出来事。
とはいえ、旧年度中は引続きNTCIRプロジェクトで積み残した仕事を行っ
ていたため、本格的に分野融合プロジェクトに参画しての研究は新年度4
月からだった。
まず、NTCIRプロジェクト積み残しの仕事としては、以下の2点:
1. 1.5TBのWebデータセットNW1000G-04を紹介するテクニカルレポート
前者のNW1000G-04については、今後も様々なアイデアを実証するテストコ
レクション・基盤として、活用していく予定なので、テクニカルレポート
が役に立てばと祈りたい。これについては追加分析も可能だと思うので、
不完全な点があれば、ご指摘いただくか、もしくは更なる分析結果をまと
められたい方がいましたら、手元のデータ類もお渡しすることもできると
思いますので、ぜひ私の方までご連絡ください。
2. NTCIR-5 WEBタスクにおける結果を分析した国際会議AIRS2006での発表
こちらは、やや時間も無く不完全な感じでの出来で、フルペーパーとして
投稿したものの、ショートペーパー扱いになった。結局、内容的にも、
Query difficultyの推定問題という、やや狭い話題しか展開できなかった
のが敗因。来年度は、そこからもう少し広がる話題を分析していく時間が
とれれば良いなあと思うものの、こちらはやや時間が足りるか分からない。
4月からは、融合プロジェクト研究に関わった。
このプロジェクトは「情報リンケージ」をキーワードとして、科研特定研
究「情報爆発」の計画班とも連携を取りながら、統数研の先生方を混じえ
て、打ち合わせを重ね、分野融合につながりそうな研究の話題を展開する
準備に力が注がれたため、実質的な研究の話は秋になるまであまり進まな
かったが、秋の研究会に向けての打ち合わせを契機として、「研究者情報」
にフォーカスを当てたシステム開発をおこない、これを中心的モデルとし
て、他の論文書誌情報等のDBと連携していくことに的を絞って検討を行っ
た。
これについては融合プロジェクトで開催した研究会と比較的内輪での発表
に留まっていて、未だ外部での発表はきちんと行っていないので、まずは
これを外部で発表するのが、来年度の最優先の仕事になりそう。まずは、
国内の研究会あたりで、さらに、できれば新たな観点からの発見などを行
う手法としてまとめて、国際会議、論文誌といった展開を考えている。
さらに、NTCIR参画時からの課題である、情報要求を考慮に入れた情報検
索システム評価を考えていくというプロジェクトも、今年度から動きはじ
めた。これも第2のお仕事として、今年度中には、最低でも一回以上の国
際会議発表を行ない、追加実験等を含めて、何か目に見える成果を出した
い。
さらに追加的な仕事として、Web情報抽出等で、2つのプロジェクトに関わっ
ているので、こちらも積極的に推進して、まずは国際会議レベルでの発表
に持っていきたい。また、電子図書館もしくは機関レポジトリ関連でも、
共同研究としてだが、面白そうなネタが2つ位あるので、まずは年始めに
も形になるようにまとめる予定。
以上、今年のお仕事のまとめと、来年2007年の抱負。
cf.
発表文献一覧