リンク: [ホーム] [自己紹介] [リンク集] [アルバム] [ソフトウェア] [発表文献] [その他]

前の月 / 次の月 / 最新

まさおのChangeLogメモ / 2006-04

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

2006-04-30 Sun

* URL memo

- del.icio.us/help/api/posts:

117 users
- Ruby Scripts:

22 users
- 川o・-・）＜2nd life - Google SketchUp の API は ruby !:

* del.icio.us対応

どうやってやるか少し悩みどころ。。。

とりあえずローカルに delicious.txt に、エントリ内容を吐き出させる
ことから始めてみますか…。

ちなみに、del.isio.usの利用開始は、[2005-03-08]から。

* RewriteBase

RewriteBaseを条件分岐で2つ同時に指定するのはできなそうなので、やめ。

navi_masao.rb を書いて localhost の時だけ編集・設定ボタンが出るよ
うにした。

Referrer (Inside): [2006-05-02-1]

2006-04-29 Sat

* URL memo

- 窓の杜 - 【NEWS】テキストが何語で書かれているのか世界432言語から自動識別「Polyglot 3000」:

6 users
- 論文の書き方と査読の方法（和文Ｄの著者、査読者のために）:

users
- 駅探ラボ:

10 users
- SURBL -- Spam URI Realtime Blocklists:

232 users
- ちょっとしたメモ - W3Cの新しいXSLTサービスとGRDDL:

* clsearch.cgi+未

clsearch.cgiにて文字化けを引き起こす。

面, 果などの文字の後ろにひらがながくるパターンで問題になる模様。

素直にPerlメモに載っている方法を使えば回避できそう…。
http://www.din.or.jp/~ohzaki/perl.htm#JP_Match

とりあえずのパッチ:

Index: clsearch.cgi
===================================================================
RCS file: /home/masao/.cvsroot/public_html/d/clsearch.cgi,v
retrieving revision 1.2
diff -u -b -r1.2 clsearch.cgi
--- clsearch.cgi 26 Apr 2006 16:12:32 -0000 1.2
+++ clsearch.cgi 29 Apr 2006 06:57:18 -0000
@@ -67,6 +67,9 @@
my $outstr = "";
my $cnt = 0;

+my $ascii = '[\x00-\x7F]';
+my $twoBytes = '[\x8E\xA1-\xFE][\xA1-\xFE]';
+my $threeBytes = '\x8F[\xA1-\xFE][\xA1-\xFE]';

sub clean {
local ($_) = @_;
@@ -101,7 +104,8 @@
$match_num++ if ($c =~ /^.+\[$tmp\].*\t.*$/);
} else {
my $tmp = clean($k);
- $match_num++ if ($c =~ m|$tmp|i);
+ $match_num++
+ if $c =~ /^(?:$ascii|$twoBytes|$threeBytes)*?(?:$tmp)/i;
push @regular_keys, $tmp;
}
}
@@ -128,7 +132,7 @@
$pos =~ s!^(([\x80-\xff]{2})*?)[\x80-\xff]$!$1!;
$c = qq($pre$k$pos);
my $p = join('|', @regular_keys);
- $c =~ s!($p)!$open_tag$1$close_tag!gi;
+ $c =~ s!\G((?:$ascii|$twoBytes|$threeBytes)*?)($p)!$1$open_tag$2$close_tag!gi;
}
} elsif ($mode == 1) { # アイテムモード
my ($file, $id) = ($date =~ /href="(.*?.html).*?">\[(.+?)\]/);

もう少し簡単にやるなら、Jcode->s(pattern, subst) を使えば良さげ。

（やってみたけど）
Jcode->{s,m}ってJcode.pm2.00以上、Perl5.8.1以上を要求するのね…。

手元のサーバはPerlのバージョン、レンタルサーバだとJcodeのバージョ
ンの問題で動かないので、いやーんな感じ。
という訳で現状ではやめておく。

* 論文の書き方と査読の方法（和文Ｄの著者、査読者のために）

http://www.ieice.org/jpn/shiori/jd/kakikata_jd.html
すばらしい書き物。参考になる。

これだけの文章を編集委員会としてまとめるのはさぞ大変だったろうと、
推察されるのだが、どうだろう。

2006-04-28 Fri

* URL memo

- isologue: グーグルは「すごい」のか「すごくない」のか（財務的に見たGoogle）:

33 users
- Delicious Library:

4394 users
- B-Files !:

users
面白い特許
- je-pu-pu サムネイル:

* sshd+hosts.allow

なんかアタックが多いので、一応普段使っているネットワーク以外からの
接続は塞いでおく。

--- hosts.allow.20060428 2006-04-28 18:07:03.250482728 +0900
+++ hosts.allow 2006-04-28 18:29:22.049954272 +0900
@@ -67,10 +67,14 @@
# Allow connets to sshd from sample.foobar.edu.

#sshd: sample.foobar.edu
+sshd: .nii.ac.jp 136.187.
+sshd: .bbtec.net 220.1.152. 220.1.155. 221.89.8.
+sshd: .nier.go.jp .nicer.go.jp 210.164.30. 210.137.6.
+sshd: .slis.tsukuba.ac.jp 133.51.
+sshd: .sakura.ne.jp 59.106.13.

################################################################################
# Allow all requests from hosts in .foobar.edu with one exception (notice the
# leading dot)

#ALL: .foobar.edu EXCEPT terminalserver.foobar.edu
-sshd : ALL

なんか外出先からアクセスしようとしてはまりそうな予感もするけど。。。
ま、それはそれ。いちおうやっておく。

不便なようだったら元に戻すこと。

* Microsoft Announces Windows Live Academic Search

http://www.microsoft.com/presspass/press/2006/apr06/04-11WLAcademicSearchPR.mspx
MicrosoftもGoogle Scholarもどきを開発したというので、行ってみたが、
FireFoxで動かず…。。。

あいかわらずのMS流だなぁ。。。

2006-04-27 Thu

* URL memo

- Clouder::Blogger: yaml-mode-0.01 - simple major mode to edit YAML for emacs:

11 users
- XML.com: Microformats in Context:

52 users
- SketchUp - Home:

* arno+acl

cf. [2006-04-20]

作業しようと思って、fstabを変更して、

--- /etc/fstab 2006-04-27 19:53:07.000000000 +0900
+++ /etc/fstab.20060427 2006-04-27 19:48:05.000000000 +0900
@@ -1,11 +1,11 @@
-/dev/hda2 / ext3 defaults,acl 1 1
+/dev/hda2 / ext3 defaults 1 1
/dev/cdrom /mnt/cdrom iso9660 noauto,owner,ro 0 0
/dev/fd0 /mnt/floppy auto noauto,owner 0 0
none /proc proc defaults 0 0
none /dev/pts devpts gid=5,mode=620 0 0
sysfs /sys sysfs defaults 0 0
/dev/hda1 swap swap defaults 0 0
-/dev/hdb /project ext3 defaults,acl 1 2
+/dev/hdb /project ext3 defaults 1 2
#-- dynaplug --
# The following line will be automatically modified by dynaplug.
/dev/hdb1 /mnt/hdb1 auto noauto,user,exec 0 0

次にシングルユーザモードに落として再マウントしようと思い、

% sudo init 1

とやったら、なぜか「Kernel Panic」とか言われて、リブートしてしまわ
れた…。。。

再起動したので、結局、有効になっている模様なのではあるが。。。

% mount
/dev/hda2 on / type ext3 (rw,acl)
none on /proc type proc (rw)
usbfs on /proc/bus/usb type usbfs (rw)
sysfs on /sys type sysfs (rw)
none on /dev/pts type devpts (rw,gid=5,mode=620)
/dev/hdb on /project type ext3 (rw,acl)

* del.icio.us対応

折角、ChangeLogメモを公開しはじめたので、del.icio.usの方も付けるよ
うに対応を考えた。

だいぶ昔に書いたスクリプトをひっぱりだしてきて、眺める。
cf. [2005-03-09]

しかし、なぜかタイトル相当の部分が文字化けする現象に遭遇。

少し検索してみると、以下の記事に概要が載っていた:
http://antipop.gs/mt/2005/05/29/195830

どうやら、/recent を取ってくると文字化けで、/get で各日ごとに取得
すれば、文字化けしない模様。

ちなみに、上記で書いていたチュートリアルのミスは既に指摘が上がって
いるが、まだ直っていない模様:
http://bugs.pablotron.org/bug.php?op=show&bugid=29&pos=3

* JSAI2006

http://www.jaist.ac.jp/jsai2006/program/paper_list.html

人口知能学会全国大会のプログラムが公開されていたが、以下の発表が気
になったので、メモしておく:

Web画像を手がかりとした，人物に関する情報抽出の検討:
http://www.jaist.ac.jp/jsai2006/program/paper-230.html

Webからのエンティティ間の関係情報の抽出:
http://www.jaist.ac.jp/jsai2006/program/paper-256.html

形式的概念分析を用いた概念階層間の関係の発見:
http://www.jaist.ac.jp/jsai2006/program/paper-136.html

係り受け関係を利用した類語・例文辞書構築法と大規模コーパスへの適用:
http://www.jaist.ac.jp/jsai2006/program/paper-123.html

再帰的なグラフクラスタリングを利用した言語連想データの処理について:
http://www.jaist.ac.jp/jsai2006/program/paper-56.html

思い出共有ツールとしての、写真と日記:
http://www.jaist.ac.jp/jsai2006/program/paper-58.html

軽量オントロジーを用いた簡易型Webコンテンツ管理システムの開発:
http://www.jaist.ac.jp/jsai2006/program/paper-38.html

異なる機能語彙体系間の相互運用性に関する検討:
http://www.jaist.ac.jp/jsai2006/program/paper-43.html

文献情報に基づく分野間ネットワーク分析:
http://www.jaist.ac.jp/jsai2006/program/paper-241.html

2006-04-26 Wed

* URL memo

- Allen 1995: Natural Language Understanding - Contents:

users
- 城北ランシールズ　公式ホームページ:

users
城北ランシールズは、城北地域からJリーグ昇格を目指しているクラブチーム
- liper報告書:

users
- 2005 workshop on Open Source Web Information Retrieval:

users
- JAlbum - free web photo album software and photo gallery software:

2456 users
- Networks / Pajek:

346 users
Program for Large Network Analysis

* ChageLogメモ

公開用のタグを付けてみた。。。

つかれた。。。

2006-04-25 Tue

* URL memo

- はてな認証API:

* nlserv2仕様

http://www1.jp.dell.com/content/products/productdetails.aspx/pedge_2800

マシン: DELL PowerEdge 2800
大きさ: 485mm x 302mm x 720mm (高さ:脚付き x 幅:脚伸展時 x 奥行)

* SIGIR2006 Program

http://www.sigir2006.org/program.asp
いつのまにか公開されていた。

・気になるところ:

以下2件は、MSNでのユーザ行動にもとづくWebランキング手法の提案か…。

Learning User Interaction Models for Predicting Web Search Result Preferences
Eugene Agichtein, Eric Brill, Susan Dumais, Robert Ragno
Microsoft Research

Improving Web Search Ranking by Incorporating User Behavior
Eugene Agichtein, Eric Brill, Susan Dumais
Microsoft Research

来ましたJimmy Lin…。

Role of Knowledge in Conceptual Retrieval: A Study in the Domain of Clinical Medicine
Jimmy Lin, Dina Demner-Fushman
University of Maryland

Q&Aタスクの応答性能の予測か…。

A Framework to Predict the Quality of Answers with Non-Textual Features
Jiwoon Jeon, Bruce Croft, Soyeon Park, JoonHo Lee
University of Massachusetts Amherst

Terabyteでの成果か!?

Dynamic Test Collections: Measuring Search Effectiveness on the Live Web
Ian Soboroff
National Institute of Standards and Technology

お…。GoogleのMonika女史
Finding Near-Duplicate Web Pages: A Large-Scale Evaluation of Algorithms
Monika Henzinger
Google and Ecole Federale de Lausanne (EPFL)

ここ数年来のRobustでの課題難易度予測の成果か？
What makes a query difficult?
David Carmel, Elad Yom-Tov, Adam Darlow, Dan Pelleg
IBM Research Lab

検索結果上位の方の分析？
Less is More
Harr Chen, David Karger
Massachusetts Institute of Technology

ブラウジングなので一応、メモ。（タイトルだけだと、いまいちそう）
Find-Similar: Similarity Browsing as a Search Tool
Mark Smucker James Allan
University of Massachusetts Amherst

以下3本は評価関連の論文。最初のは酒井さんだなあ。
Evaluating Evaluation Metrics based on the Bootstrap
Tetsuya Sakai
Toshiba

Statistical Precision of Information Retrieval Evaluation
Gordon Cormack, Thomas Lynam
University of Waterloo

Statistical Method for System Evaluation Using Incomplete Judgments
Virgil Pavlu, Javed Aslam
Northeastern University

DLと入っているので、一応メモ。
Information Graphics: An Untapped Resource for Digital Libraries
Sandra Carberry, University of Delaware
Stephanie Elzer, Millersville University
Seniz Demir, University of Delaware

・全体の感想
MS Research Asiaチームが元気。MSRAsisからの論文が異様に多く通って
いる。一大勢力となっている感が強い。

* MS IME

英数字は常に半角を使っている方が好みなのだが、たまに何かのきっかけ
で、全て全角になってしまうことがあり、その設定変更方法を探していた。

どうやら、IMEの設定プロパティを開いて、「オートコレクト」タブ内の
「全角/半角」の欄で、「英字」に「常に半角に変換」を指定すれば良い
みたい。

Referrer (Inside): [2007-03-07-1]

2006-04-23 Sun

* URL memo

- 書籍管理ソフト　Amazon Application:

users
- CssCreator->Page Layout:

907 users
- Suggested Readings in Human-Computer Interaction (HCI), User Interface (UI) Development, & Human Factors (HF) ::

42 users
- RPA-base: RpaBase:

2006-04-22 Sat

* URL memo

- ふりがな付けます:

221 users
- Ajaxload - Ajax loading gif generator:

4461 users
- Ontology Alignment Evaluation Initiative:

28 users
- 結城浩のWiki入門:

users
『結城浩のWiki入門』の【PDF版】が刊行されました！
- Main Page - WikiNotes:

322 users
Wealth of Networks WikiNotes
- 黒田航 (Kuroda, Kow):

users
- Jianfeng Gao:

  *   MSR IME Corpus: This corpus provides a test data set for the task of Japanese character conversion for test input. See (Suzuki and Gao 2006) for a detailed description.

* S-MSRSeg: Chinese word segmenter, named entity recognizer, described in

2006-04-21 Fri

* URL memo

- Google Groups: Internet Searching:

2006-04-20 Thu

* URL memo

- ITmedia エンタープライズ：特集：Linuxカーネル2.6で実現するACL (1/5):

users
- 図書館員もどきのひとり言: creatorとcontributor:

users
- 裏２ちゃんねる:元NHK職員が２ちゃんねるにスレを立て内部告発 - livedoor Blog（ブログ）:

users
- 住太陽の「SEO 検索エンジン最適化」 - 自分で施策するための情報とツール:

181 users
- YouTube - Metallica Iron Man Hole In The Sky:

users
- 強い松尾ぐみのために：研究の指導とステップアップ:

* arno+acl

以下からRPMを持ってきてインストールした。
ftp://oss.sgi.com/projects/xfs/cmd_rpms/RPMS/i386/

acl-2.2.34-1.i386.rpm
libacl-2.2.34-1.i386.rpm
libattr-2.4.28-0.i386.rpm

これだけではダメなようで、aclオプション付きでマウントしなおす必要
あり: http://www.itmedia.co.jp/enterprise/0403/06/epn01_2.html

ううーむ。困ったな。。。
一旦落とさないとダメかこりゃ。

Referrer (Inside): [2006-04-27-3]

2006-04-19 Wed

* URL memo

- Known item search:

users
- Website Explorer:

42 users
- 檜山正幸のキマイラ飼育記 - 世界で一番か二番くらいにやさしい「モナド入門」:

2006-04-17 Mon

* URL memo

- Schedule Watcher:

users
卓上カレンダーに書き込む感覚で使える軽快なスケジューラ
- Center for Computational Sciences, University of Tsukuba:

* dvipdfmx+埋め込みフォント

dvipdfmxを使って、海外投稿用の和文フォント埋め込みのPDFを作る方法:

以下の内容の cid-x.map を用意する。

rml H :0:tlmincho
gbm H :0:tlgothic
rmlv V :0:tlmincho
gbmv V :0:tlgothic

以下のコマンドでPDF作成する。

% dvipdfmx -f cid-x.map main

Acrobat Readerの「文書のプロパティ」〜「フォント」を開いて、
「TLMincho（埋め込みサブセット）」などと表示されているのを確認する。

・参考にしたページ・サイトなど:
http://www.iir.me.ynu.ac.jp/~maeda/comp/pdftips.html
http://cise.edu.mie-u.ac.jp/~okumura/texwiki/?PDF%E3%81%AE%E4%BD%9C%E3%82%8A%E6%96%B9

→うまくできているか分からんが、とりあえずはこれでAIRS2006に提出…

2006-04-16 Sun

* URL memo

- 国際セミナー TEI Day in Kyoto 2006:

users
- トンデモ「研究」の見分け方・古代研究編:

2006-04-15 Sat

* URL memo

- Univ.Tokyo Library and Information Science Laboratory Open Labo. 2006:

users
- Classics in the History of Psychology -- Yerkes & Dodson (1908):

5 users
- 1024人応援団:

137 users
- GENOME MAP│ヒトゲノムマップ:

63 users
- Synergy:

621 users
- How I Work: Bill Gates - Apr. 7, 2006:

* Unihan

cf.[2006-04-13]
ちょっと加工したら作れたので、手順だけ:

% ruby -ne 'next if /^#/;code,prop,val = $_.chomp.split(/\t/);puts [[code.sub(/^U\+/,"").hex].pack("U*"),val].join("\t") if prop =~ /^kJapanese(Kun|On)$/' Unihan.txt | ruby -e 'w={};ARGF.each do |l|char,yomi=l.chomp.split(/\t/);w[char]||=[];w[char]<<yomi;end;w.keys.sort.each do|char|puts [char,w[char]].join("\t");end

ページ作って、スクリプト化した。
→ etc/unihan-onkun.html

2006-04-14 Fri

* URL memo

- GICAS-アジア書字コーパスに基づく文字情報学の創成:

users
- NPO アカデミックハラスメントをなくすネットワーク:

2006-04-13 Thu

* URL memo

- September 11 Newspaper Articles Archive:

4 users
- Google Calendar:

3110 users
- METS Navigator â Home:

31 users
- Gollum, the Wikipedia Browser:

* Unihan

http://q.hatena.ne.jp/1144892483
単漢字の読みをダウンロードできるサイトを教えて下さい．CSV,Exel形
式などで，シフトJISの全ての漢字，できればJIS X0213の範囲までカバー
していると嬉しいです．

という質問に対して Unihan.txt をおすすめしてみたけど、

これは知っていたのですが，加工するのがすごく大変そうです．読みが
ローマ字なのもちょっと．

と返されてしまったので…。

ちょっとワンライナーをば:

% ruby -ne 'next if /^#/;code,prop,val = $_.chomp.split(/\t/);puts [[code.sub(/^U\+/,"").hex].pack("U*"),val].join("\t") if prop =~ /Japanese/' Unihan.txt

…確かに意外と手間取るね。。。

Referrer (Inside): [2006-04-15-1]

2006-04-12 Wed

* URL memo

- About "info" URIs - Frequently Asked Questions:

9 users
- サルにもわかるＲＳＡ暗号: はじめに:

21 users
- Site K4:

51 users
畑正憲

2006-04-11 Tue

* URL memo

- 1日300円〜500円で今日も乗切る:

2006-04-05 Wed

* URL memo

- オープンソースFAQシステム QuestionLabor:

users
- Ajax Google Mapsを自サイトに設置する - ［JavaScript］All About:

2006-04-04 Tue

* URL memo

- Imagination Cubed:

2006-04-03 Mon

* URL memo

- Webページでダイスを振るbookmarklet - collisions.dotimpac.to:

23 users
- Springer - LNCS:

users
Information for LNCS Authors

* LNCS LaTeX2e Style・インストールメモ

% sudo mkdir -p /usr/share/texmf-local/tex/latex/lncs/
% cd /usr/share/texmf-local/tex/latex/lncs
% sudo unzip ~/src/llncs2e.zip
% sudo mkdir -p /usr/share/texmf-local/bibtex
% cd /usr/share/texmf-local/bibtex
% sudo cp -p /usr/share/texmf-local/tex/latex/lncs/splncs.bst .
% sudo mktexlsr

2001 : 01 02 03 04 05 06 07 08 09 10 11 12
2002 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12

前の月 / 次の月 / 最新