リンク: [ホーム] [自己紹介] [リンク集] [アルバム] [ソフトウェア] [発表文献] [その他]

まさおのChangeLogメモ / 2006-04

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2006-04-30 Sun

* del.icio.us対応

どうやってやるか少し悩みどころ。。。

とりあえずローカルに delicious.txt に、エントリ内容を吐き出させる
ことから始めてみますか…。

ちなみに、del.isio.usの利用開始は、[2005-03-08]から。

* RewriteBase

RewriteBaseを条件分岐で2つ同時に指定するのはできなそうなので、やめ。

navi_masao.rb を書いて localhost の時だけ編集・設定ボタンが出るよ
うにした。
Referrer (Inside): [2006-05-02-1]

2006-04-29 Sat

* clsearch.cgi+未

clsearch.cgiにて文字化けを引き起こす。

面, 果などの文字の後ろにひらがながくるパターンで問題になる模様。

素直にPerlメモに載っている方法を使えば回避できそう…。
http://www.din.or.jp/~ohzaki/perl.htm#JP_Match

とりあえずのパッチ:

Index: clsearch.cgi
===================================================================
RCS file: /home/masao/.cvsroot/public_html/d/clsearch.cgi,v
retrieving revision 1.2
diff -u -b -r1.2 clsearch.cgi
--- clsearch.cgi 26 Apr 2006 16:12:32 -0000 1.2
+++ clsearch.cgi 29 Apr 2006 06:57:18 -0000
@@ -67,6 +67,9 @@
 my $outstr = "";
 my $cnt = 0;
 
+my $ascii = '[\x00-\x7F]';
+my $twoBytes = '[\x8E\xA1-\xFE][\xA1-\xFE]';
+my $threeBytes = '\x8F[\xA1-\xFE][\xA1-\xFE]';
 
 sub clean {
     local ($_) = @_;
@@ -101,7 +104,8 @@
  $match_num++ if ($c =~ /^.+\[$tmp\].*\t.*$/);
   } else {
  my $tmp = clean($k);
- $match_num++ if ($c =~ m|$tmp|i);
+ $match_num++
+ if $c =~ /^(?:$ascii|$twoBytes|$threeBytes)*?(?:$tmp)/i;
  push @regular_keys, $tmp;
  }
  }
@@ -128,7 +132,7 @@
  $pos =~ s!^(([\x80-\xff]{2})*?)[\x80-\xff]$!$1!;
  $c = qq($pre$k$pos);
  my $p = join('|', @regular_keys);
- $c =~ s!($p)!$open_tag$1$close_tag!gi;
+ $c =~ s!\G((?:$ascii|$twoBytes|$threeBytes)*?)($p)!$1$open_tag$2$close_tag!gi;
  }
  } elsif ($mode == 1) { # アイテムモード
  my ($file, $id) = ($date =~ /href="(.*?.html).*?">\[(.+?)\]/);


もう少し簡単にやるなら、Jcode->s(pattern, subst) を使えば良さげ。

(やってみたけど)
Jcode->{s,m}ってJcode.pm2.00以上、Perl5.8.1以上を要求するのね…。

手元のサーバはPerlのバージョン、レンタルサーバだとJcodeのバージョ
ンの問題で動かないので、いやーんな感じ。
という訳で現状ではやめておく。

* 論文の書き方と査読の方法(和文Dの著者、査読者のために)

http://www.ieice.org/jpn/shiori/jd/kakikata_jd.html
すばらしい書き物。参考になる。

これだけの文章を編集委員会としてまとめるのはさぞ大変だったろうと、
推察されるのだが、どうだろう。

2006-04-28 Fri

* sshd+hosts.allow

なんかアタックが多いので、一応普段使っているネットワーク以外からの
接続は塞いでおく。

--- hosts.allow.20060428 2006-04-28 18:07:03.250482728 +0900
+++ hosts.allow 2006-04-28 18:29:22.049954272 +0900
@@ -67,10 +67,14 @@
 # Allow connets to sshd from sample.foobar.edu.
 
 #sshd: sample.foobar.edu
+sshd: .nii.ac.jp 136.187.
+sshd: .bbtec.net 220.1.152. 220.1.155. 221.89.8.
+sshd: .nier.go.jp .nicer.go.jp 210.164.30. 210.137.6.
+sshd: .slis.tsukuba.ac.jp 133.51.
+sshd: .sakura.ne.jp 59.106.13.
 
 ################################################################################
 # Allow all requests from hosts in .foobar.edu with one exception (notice the
 # leading dot)
 
 #ALL: .foobar.edu EXCEPT terminalserver.foobar.edu
-sshd : ALL


なんか外出先からアクセスしようとしてはまりそうな予感もするけど。。。
ま、それはそれ。いちおうやっておく。

不便なようだったら元に戻すこと。

* Microsoft Announces Windows Live Academic Search

http://www.microsoft.com/presspass/press/2006/apr06/04-11WLAcademicSearchPR.mspx
MicrosoftもGoogle Scholarもどきを開発したというので、行ってみたが、
FireFoxで動かず…。。。

あいかわらずのMS流だなぁ。。。

2006-04-27 Thu

* arno+acl

cf. [2006-04-20]

作業しようと思って、fstabを変更して、

--- /etc/fstab 2006-04-27 19:53:07.000000000 +0900
+++ /etc/fstab.20060427 2006-04-27 19:48:05.000000000 +0900
@@ -1,11 +1,11 @@
-/dev/hda2 / ext3 defaults,acl 1 1
+/dev/hda2 / ext3 defaults 1 1
 /dev/cdrom /mnt/cdrom iso9660 noauto,owner,ro 0 0
 /dev/fd0 /mnt/floppy auto noauto,owner 0 0
 none /proc proc defaults 0 0
 none /dev/pts devpts gid=5,mode=620 0 0
 sysfs /sys sysfs defaults 0 0
 /dev/hda1 swap swap defaults 0 0
-/dev/hdb /project ext3 defaults,acl 1 2
+/dev/hdb /project ext3 defaults 1 2
 #-- dynaplug --
 # The following line will be automatically modified by dynaplug.
 /dev/hdb1 /mnt/hdb1 auto noauto,user,exec 0 0

次にシングルユーザモードに落として再マウントしようと思い、

% sudo init 1

とやったら、なぜか「Kernel Panic」とか言われて、リブートしてしまわ
れた…。。。

再起動したので、結局、有効になっている模様なのではあるが。。。

% mount
/dev/hda2 on / type ext3 (rw,acl)
none on /proc type proc (rw)
usbfs on /proc/bus/usb type usbfs (rw)
sysfs on /sys type sysfs (rw)
none on /dev/pts type devpts (rw,gid=5,mode=620)
/dev/hdb on /project type ext3 (rw,acl)

* del.icio.us対応

折角、ChangeLogメモを公開しはじめたので、del.icio.usの方も付けるよ
うに対応を考えた。

だいぶ昔に書いたスクリプトをひっぱりだしてきて、眺める。
cf. [2005-03-09]

しかし、なぜかタイトル相当の部分が文字化けする現象に遭遇。

少し検索してみると、以下の記事に概要が載っていた:
http://antipop.gs/mt/2005/05/29/195830

どうやら、/recent を取ってくると文字化けで、/get で各日ごとに取得
すれば、文字化けしない模様。

ちなみに、上記で書いていたチュートリアルのミスは既に指摘が上がって
いるが、まだ直っていない模様:
http://bugs.pablotron.org/bug.php?op=show&bugid=29&pos=3

* JSAI2006

http://www.jaist.ac.jp/jsai2006/program/paper_list.html

人口知能学会全国大会のプログラムが公開されていたが、以下の発表が気
になったので、メモしておく:

Web画像を手がかりとした,人物に関する情報抽出の検討:
http://www.jaist.ac.jp/jsai2006/program/paper-230.html

Webからのエンティティ間の関係情報の抽出:
http://www.jaist.ac.jp/jsai2006/program/paper-256.html

形式的概念分析を用いた概念階層間の関係の発見:
http://www.jaist.ac.jp/jsai2006/program/paper-136.html

係り受け関係を利用した類語・例文辞書構築法と大規模コーパスへの適用:
http://www.jaist.ac.jp/jsai2006/program/paper-123.html

再帰的なグラフクラスタリングを利用した言語連想データの処理について:
http://www.jaist.ac.jp/jsai2006/program/paper-56.html

思い出共有ツールとしての、写真と日記:
http://www.jaist.ac.jp/jsai2006/program/paper-58.html

軽量オントロジーを用いた簡易型Webコンテンツ管理システムの開発:
http://www.jaist.ac.jp/jsai2006/program/paper-38.html

異なる機能語彙体系間の相互運用性に関する検討:
http://www.jaist.ac.jp/jsai2006/program/paper-43.html

文献情報に基づく分野間ネットワーク分析:
http://www.jaist.ac.jp/jsai2006/program/paper-241.html

2006-04-26 Wed

* ChageLogメモ

公開用のタグを付けてみた。。。

つかれた。。。

2006-04-25 Tue

* nlserv2仕様

http://www1.jp.dell.com/content/products/productdetails.aspx/pedge_2800

マシン: DELL PowerEdge 2800
大きさ: 485mm x 302mm x 720mm (高さ:脚付き x 幅:脚伸展時 x 奥行)

* SIGIR2006 Program

http://www.sigir2006.org/program.asp
いつのまにか公開されていた。

・気になるところ:

以下2件は、MSNでのユーザ行動にもとづくWebランキング手法の提案か…。

Learning User Interaction Models for Predicting Web Search Result Preferences
Eugene Agichtein, Eric Brill, Susan Dumais, Robert Ragno
Microsoft Research

Improving Web Search Ranking by Incorporating User Behavior
Eugene Agichtein, Eric Brill, Susan Dumais
Microsoft Research

来ましたJimmy Lin…。

Role of Knowledge in Conceptual Retrieval: A Study in the Domain of Clinical Medicine
Jimmy Lin, Dina Demner-Fushman
University of Maryland

Q&Aタスクの応答性能の予測か…。

A Framework to Predict the Quality of Answers with Non-Textual Features
Jiwoon Jeon, Bruce Croft, Soyeon Park, JoonHo Lee
University of Massachusetts Amherst

Terabyteでの成果か!?

Dynamic Test Collections: Measuring Search Effectiveness on the Live Web
Ian Soboroff
National Institute of Standards and Technology


お…。GoogleのMonika女史
Finding Near-Duplicate Web Pages: A Large-Scale Evaluation of Algorithms
Monika Henzinger
Google and Ecole Federale de Lausanne (EPFL)

ここ数年来のRobustでの課題難易度予測の成果か?
What makes a query difficult?
David Carmel, Elad Yom-Tov, Adam Darlow, Dan Pelleg
IBM Research Lab

検索結果上位の方の分析?
Less is More
Harr Chen, David Karger
Massachusetts Institute of Technology

ブラウジングなので一応、メモ。(タイトルだけだと、いまいちそう)
Find-Similar: Similarity Browsing as a Search Tool
Mark Smucker James Allan
University of Massachusetts Amherst

以下3本は評価関連の論文。最初のは酒井さんだなあ。
Evaluating Evaluation Metrics based on the Bootstrap
Tetsuya Sakai
Toshiba

Statistical Precision of Information Retrieval Evaluation
Gordon Cormack, Thomas Lynam
University of Waterloo

Statistical Method for System Evaluation Using Incomplete Judgments
Virgil Pavlu, Javed Aslam
Northeastern University

DLと入っているので、一応メモ。
Information Graphics: An Untapped Resource for Digital Libraries
Sandra Carberry, University of Delaware
Stephanie Elzer, Millersville University
Seniz Demir, University of Delaware

・全体の感想
MS Research Asiaチームが元気。MSRAsisからの論文が異様に多く通って
いる。一大勢力となっている感が強い。

* MS IME

英数字は常に半角を使っている方が好みなのだが、たまに何かのきっかけ
で、全て全角になってしまうことがあり、その設定変更方法を探していた。

どうやら、IMEの設定プロパティを開いて、「オートコレクト」タブ内の
「全角/半角」の欄で、「英字」に「常に半角に変換」を指定すれば良い
みたい。
Referrer (Inside): [2007-03-07-1]

2006-04-23 Sun

2006-04-22 Sat

* URL memo

- ふりがな 付けます: delicious221 users
- Ajaxload - Ajax loading gif generator: delicious4461 users
- Ontology Alignment Evaluation Initiative: delicious28 users
- 結城浩のWiki入門: delicious users
『結城浩のWiki入門』の【PDF版】が刊行されました!
- Main Page - WikiNotes: delicious322 users
Wealth of Networks WikiNotes
- 黒田 航 (Kuroda, Kow): delicious users
- Jianfeng Gao: delicious users
  * MSR IME Corpus: This corpus provides a test data set for the task of Japanese character conversion for test input. See (Suzuki and Gao 2006) for a detailed description.
  * S-MSRSeg: Chinese word segmenter, named entity recognizer, described in

2006-04-21 Fri

2006-04-20 Thu

* arno+acl

以下からRPMを持ってきてインストールした。
ftp://oss.sgi.com/projects/xfs/cmd_rpms/RPMS/i386/

acl-2.2.34-1.i386.rpm
libacl-2.2.34-1.i386.rpm
libattr-2.4.28-0.i386.rpm

これだけではダメなようで、aclオプション付きでマウントしなおす必要
あり: http://www.itmedia.co.jp/enterprise/0403/06/epn01_2.html

ううーむ。困ったな。。。
一旦落とさないとダメかこりゃ。
Referrer (Inside): [2006-04-27-3]

2006-04-19 Wed

2006-04-17 Mon

* URL memo

- Schedule Watcher: delicious users
卓上カレンダーに書き込む感覚で使える軽快なスケジューラ
- Center for Computational Sciences, University of Tsukuba: delicious users

* dvipdfmx+埋め込みフォント

dvipdfmxを使って、海外投稿用の和文フォント埋め込みのPDFを作る方法:

以下の内容の cid-x.map を用意する。

rml H :0:tlmincho
gbm H :0:tlgothic
rmlv V :0:tlmincho
gbmv V :0:tlgothic

以下のコマンドでPDF作成する。

% dvipdfmx -f cid-x.map main

Acrobat Readerの「文書のプロパティ」〜「フォント」を開いて、
「TLMincho(埋め込みサブセット)」などと表示されているのを確認する。

・参考にしたページ・サイトなど:
http://www.iir.me.ynu.ac.jp/~maeda/comp/pdftips.html
http://cise.edu.mie-u.ac.jp/~okumura/texwiki/?PDF%E3%81%AE%E4%BD%9C%E3%82%8A%E6%96%B9

→うまくできているか分からんが、とりあえずはこれでAIRS2006に提出…

2006-04-16 Sun

2006-04-15 Sat

* Unihan

cf.[2006-04-13]
ちょっと加工したら作れたので、手順だけ:

% ruby -ne 'next if /^#/;code,prop,val = $_.chomp.split(/\t/);puts [[code.sub(/^U\+/,"").hex].pack("U*"),val].join("\t") if prop =~ /^kJapanese(Kun|On)$/' Unihan.txt | ruby -e 'w={};ARGF.each do |l|char,yomi=l.chomp.split(/\t/);w[char]||=[];w[char]<<yomi;end;w.keys.sort.each do|char|puts [char,w[char]].join("\t");end

ページ作って、スクリプト化した。
→ etc/unihan-onkun.html

2006-04-14 Fri

2006-04-13 Thu

* Unihan

http://q.hatena.ne.jp/1144892483
単漢字の読みをダウンロードできるサイトを教えて下さい.CSV,Exel形
式などで,シフトJISの全ての漢字,できればJIS X0213の範囲までカバー
していると嬉しいです.

という質問に対して Unihan.txt をおすすめしてみたけど、

これは知っていたのですが,加工するのがすごく大変そうです.読みが
ローマ字なのもちょっと.

と返されてしまったので…。

ちょっとワンライナーをば:
% ruby -ne 'next if /^#/;code,prop,val = $_.chomp.split(/\t/);puts [[code.sub(/^U\+/,"").hex].pack("U*"),val].join("\t") if prop =~ /Japanese/' Unihan.txt

…確かに意外と手間取るね。。。
Referrer (Inside): [2006-04-15-1]

2006-04-12 Wed

2006-04-11 Tue

2006-04-10 Mon

2006-04-05 Wed

2006-04-04 Tue

2006-04-03 Mon

* LNCS LaTeX2e Style・インストールメモ

% sudo mkdir -p /usr/share/texmf-local/tex/latex/lncs/
% cd /usr/share/texmf-local/tex/latex/lncs
% sudo unzip ~/src/llncs2e.zip
% sudo mkdir -p /usr/share/texmf-local/bibtex
% cd /usr/share/texmf-local/bibtex
% sudo cp -p /usr/share/texmf-local/tex/latex/lncs/splncs.bst .
% sudo mktexlsr
サイクリング走行距離メーター
2001 : 01 02 03 04 05 06 07 08 09 10 11 12
2002 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12