リンク: [ホーム] [自己紹介] [リンク集] [アルバム] [ソフトウェア] [発表文献] [その他]

まさおのChangeLogメモ / 2004-12

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

2004-12-29 Wed

* MoBo IO 差し替え

あまりに遅いのに腹がたってきたので、差し替えのため、まずはベンチマー
クを取ってみた。

・date=200412(キャッシュ有)
PStoreIO: 4.12u 0.97s 0:06.26 81.3%
DBIIO(AC=on): 11.27u 0.91s 0:12.66 96.2%
DBIIO(AC=off): 11.00u 0.86s 0:12.49 94.9%

・date=200412(キャッシュ無)
PStoreIO: 8.60u 1.74s 0:17.43 59.3%
DBIIO(AC=on): 16.57u 1.43s 0:24.45 73.6%
DBIIO(AC=off): 16.09u 1.60s 0:24.00 73.7%

・date=2004 (キャッシュ有)
PStoreIO: 7.36u 3.73s 0:11.59 95.6%
DBIIO(AC=on): 11.19u 0.96s 0:12.75 95.2%
DBIIO(AC=off): 11.35u 0.80s 0:12.86 94.4%

・date=2004 (キャッシュ無)
PStoreIO: 23.60u 5.31s 0:43.09 67.0%
DBIIO(AC=on): 32.80u 5.46s 0:51.16 74.7%
DBIIO(AC=off): 32.98u 4.90s 0:51.45 73.6%

AutoCommit の on/off は、閲覧パフォーマンスには全く関係ないことが
分かった。あれはやはり更新時に効くからか…、当然かもね。

* WikiSpam来襲

nile/?FrontPage がやられた。

アクセスは以下より:
217.70.109.248 - - [29/Dec/2004:08:18:11 +0900] "POST /nile/ HTTP/1.1" 302 5 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Fuck you (+http://www.go-to-the-nahuy.com); .NET CLR 1.1.4322)"
217.70.109.248 - - [29/Dec/2004:08:18:16 +0900] "GET /nile/?FrontPage HTTP/1.1" 200 38404 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; Fuck you (+http://www.go-to-the-nahuy.com); .NET CLR 1.1.4322)"

ついでに pukiwiki のバージョンを更新してて、コンフリクトを解消する
ついでに、イタズラを消した。

また来ると鬱陶しいので、
・ソフト/PukiWiki/WikiSPAM - discypus:
http://discypus.jp/pukiwiki/pukiwiki.php?%A5%BD%A5%D5%A5%C8%2FPukiWiki%2FWikiSPAM
を見て、.htaccess に以下を設定。

<Limit POST>
  Order Deny,Allow
  Deny from 209.242.128.0/24 219.128.0.0/14 219.136.0.0/15 61.140.0.0/14 61.144.0.0/15 61.146.0.0/16
</Limit>

2004-12-28 Tue

* zen2han

nkf よりも Namazu がやっているように pure-Perl の正規表現で置換す
る方が少しだけ速いみたい…。

フォーマルランでは、そうしてみよう。

→ eucjp_zen2han_ascii() には、「()」をASCIIに置換しないバグがあっ
た…。要確認!!

2004-12-22 Wed

* Generalized Venn Diagrams

http://www.informatik.uni-ulm.de/ni/mitarbeiter/HKestler/vennm/
ベン図を自動でキレイにレイアウトしてくれるツール。
とりあえずメモ。

from: ■ [Vis] VennMaster:
http://km.meme.hokudai.ac.jp/people/buchi/diary/?date=20041206#p02

* 独立行政法人情報処理推進機構のフォントの再配布について

http://www.grass-japan.org/FOSS4G/license-ipafonts.eucjp.htm
とりあえずメモ。
けっこう高品質みたい。

* mecab

新しめの ipadic ではビルド時に辞書を処理する際に segfaultする。

../src/mkmecabdic
(1/5): reading connection matrix ... done!
(2/5): writing connection matrix (5 x 1145 x 371 = 2123975) ... done!
make: *** [da.me] セグメント例外 (core dumped)

MLでの指摘はあるようだが、未対応の模様(うぉ、一年も前じゃん…)。
cf. [mecab:00067] mecab-0.76 and ipadic-2.6.2:
http://www.tahoo.org/~taku/ml/mecab/msg00066.html
[mecab:00079] Re: mecab-0.76 and ipadic-2.6.2:
http://www.tahoo.org/~taku/ml/mecab/msg00078.html

ipadic-1.6.1 までなら大丈夫。

* zabom - arno

TurboLinux でとりあえず GUI 抜きでアップデートパッケージを入れたい
時は、以下のようにする。

% sudo zabom --cui

* Perl 5.8.x Unicode関連

http://www.pure.ne.jp/~learner/program/Perl_unicode.html
とりあえずメモ。

2004-12-21 Tue

* Value too large for defined data type

http://web.kuicr.kyoto-u.ac.jp/~hattori/non-research/memo/unix/largefile
2GBでのエラー表示の原因と対策。

Value too large for defined data type

とかエラーを出す。 どうやらファイルサイズが 2G を越えているのが原因らしい。 UNIX では「2G の壁」とい
うものが存在する。 これは lseek() など、ファイル内の読み出し位置を移動する関数に 与えるオフセット値が
伝統的に signed long であるためである。 signed long では 2147483647 、要するに 2G バイトまでしか表現で
きないので これを越えると単に fseek()に渡せないだけでなく、 内部の位置計算処理に多大な混乱が起こる
(ちなみに相対位置指定のために負の値も必要)。

最近の UNIX では 2G を越えるファイルもサポートしている。 ただし、従来のプログラムが混乱することを防
ぐために 2G を越えるファイルは 通常の open() では開けない (エラーになる)ようになっている。 前述のエ
ラーメッセージは 2G を越えるファイルを開こうとしたときに perror() が返すエラーメッセージである。

んで、2G を越えるファイルを使いたいときは 以下のような definition を入れてコンパイルすればいいらしい。

gcc hoge.c -D_LARGEFILE_SOURCE -D_FILE_OFFSET_BITS=64

こうすると、stdio.h の中で、 open() や lseek() とかを 2G 以上のファイル対応の関数にマップしなおしてくれ
るようだ。 オフセット指定の型は off_t 型となっていて、これに対応する実際の型も従来の long から long long
になる。

long long 型はまだ ANSI 規格にはないらしいのだが、 gcc では 64 bit の整数型として実装されている。 多分ほ
かのコンパイラにもあるのだろう。

これで、コンパイルし直せばなんでも OK かというとその辺はちょっと怪しい。 off_t 型を int や long に代入す
るというようなコードは十分あり得るからだ、 まあこういう場合はおそらく警告が出るだろう。

・オフィシャルな仕様としては以下のサイトに情報がある模様。
Large File / File System Support:
http://ftp.sas.com/standards/large.file/

* Ruby のバグ(勝手に)トラッカー

http://mput.dip.jp/rubybugs/
とりあえずメモ。

2004-12-16 Thu

* フレイヤSXホームページ

http://www.delegate.org/freyasx/index-ja.shtml
あの ODIN の Freya の改良(後継)版。
Delegate の作者が手を入れているみたい。

2004-12-15 Wed

* コントロールが見つかりません

http://park14.wakwak.com/~maru-yama/omake/notfound.html
オリエンテーリングバージョンだぁ…。ははは…。

2004-12-14 Tue

* Putty - iconName

PuTTY を最近のものに入れ替えてから、tcsh で設定している、アイコン
の時のウィンドウタイトルの切替が効かなくなっていたので、ちょっとソー
スを読んでみた。

cfg.win_name_always というような変数名の設定項目が増えていた模様。
(日本語版だと「ウィンドウ→振る舞い→ウィンドウとアイコンタイトル
をセパレートする」)

この項目をチェックしておかないと、ウィンドウタイトルの切替が効かな
い。

* コージーコーナー

cf.[2004-11-25]
お客様相談室に電話した。
赤羽店での禁煙席の状況について確認してくれた。

どの店でも禁煙席は設けていないとのこと。
ダメだね、こりゃ。

電話対応もあまり丁寧ではなく、慇懃無礼な感じ。
あまり多くを望んではいけないらしい。

2004-12-10 Fri

* Optimize Ruby Script

http://www1.u-netsurf.ne.jp/~brew/mine/ja/ruby/optimize.html
「Rubyスクリプト最適化のオニ」。
とりあえずメモ。

2004-12-09 Thu

* 科学技術論文の書き方

http://www.okada-lab.org/~okada/Ronbun.html
例文や説明が簡潔で分かりやすくて良い。

2004-12-07 Tue

* Solarisのパッケージ管理ツール

1:
pkg-get を使えば、以下のサイトにある Solaris 用パッケージを簡単
にインストールできる。

http://www.sunfreeware.com/
http://www.blastwave.org/

2:
一方、全く違う選択肢として、NetBSD の pkgsrc や Linux の RPM を利
用する手もある。

http://www.pkgsrc.org/
http://www.rpm.org/

が、さすがにこれはキツいかも…。

* mairix - email index and search tool

http://www.rc0.org.uk/mairix
メール検索システム。
とりあえずメモ。

from: matz日記。

* GETA

WAM は疎行列の表現形式。

XR/CW は、行と列それぞれの ID/name を管理している。

まず、$GETAROOT/etc/ci.conf にハンドルのメタ情報を書いておく。
(ハンドルの名称)

% cat $GETAROOT/etc/ci.conf
handle: test.masao.nii.ac.jp
short: test

実際のデータとなる $GETAROOT/data/$handle/freqfile を記述し、

% $GETAROOT/sbin/mkw $handle $GETAROOT/data/$handle/freqfile

として WAM を作成する。

WAM の内容は dumpwam により表示できる。

% $GETAROOT/bin/dumpwam $handle cw_row
% $GETAROOT/bin/dumpwam $handle cw_col
% $GETAROOT/bin/dumpwam $handle xr_row
% $GETAROOT/bin/dumpwam $handle xr_col

とする。

* ■ [edu] 大学院進学はまちがいなく自殺行為である

 http://d.hatena.ne.jp/dice-x/20041129
「安直に大学院進学を目指す若者を教員は安直に進学させるな」との叫び。

文系は理系よりもさらにひどい状況にあるからなあ…。きっと。
朝からこんな記事を読んで、憂鬱な気分になってしまった。

2004-12-06 Mon

* css.maxdesign.com.au

http://css.maxdesign.com.au/index.htm
CSS を使ったナビゲーションのチュートリアル。とりあえずメモ。
Listamatic/Listamatic2/Listutorial/Floatutorial/Selectutorial
といった各種コンテンツ。

from: Chitatopops: リストタグに適用するさまざまなスタイル:
http://chitatopops.net/archives/2003/09/08/listamatic.php

* On evaluating web search with very few relevant documents

http://portal.acm.org/citation.cfm?doid=1009105

神門先生が紹介してくれた新しい評価手法の提案についてのペーパ。
WEBタスクのように少ない適合文書、大きな文書集合でも安定した評価が
可能になるとの提案。

書誌事項:
On evaluating web search with very few relevant documents
SIGIR2004: Proceedings of the 27th annual international conference
on Research and development in information retrieval
Sheffield, United Kingdom
POSTER SESSION
pp. 530 - 531
2004
ISBN:1-58113-881-4
Author: Ian Soboroff (National Institute of Standards and
Technology, Gaithersburg, MD)

あとで読む。

* *大 手 小 町*

http://www.yomiuri.co.jp/komachi/reader/200411/2004111900038.htm
夜の携帯メールは迷惑?? 04.11.19 10:05:30 りんご
友人の携帯に、夜の11時ごろメールを送りました。 次の朝、少
し怒ったようなメールが届きました。 「11時過ぎのメールは勘弁
してください。もう寝てます」と。私は携帯でメールはしていないので、
パソコンと 同じ感覚で、24時間オーケーなものだと思っていまし
たが、携帯だと、少し感覚が違うようですね。 個人差もあるのかも
しれませんが、、。今後携帯メールを送る際には、送っていい時間帯と
か確認しなくちゃいけないなぁなんて思いました。皆さんはいかがです
か?

大部分の人は夜中のメールは迷惑なのでヤメテ、っていう意見だった。
興味深いなあ。

2004-12-04 Sat

* zipcode.cgi

正月の年賀状に備えて、久々に郵便番号データを更新。

* HubLog

CiteSeer OAI compliance:
http://hublog.hubmed.org/archives/001003.html
CiteSeer が生データを公開して、提供用の SOAP API も公開中とのこと。

これは注目。

from: CiteSeer's metadata is now freely available:
http://km.meme.hokudai.ac.jp/people/buchi/diary/?date=20041129#p02

* プレゼン道入門

http://nova.planet.sci.kobe-u.ac.jp/~matsuda/review.html
非常に参考になる点多し。
とりあえずメモ。

from: プレゼンテーションについてメモ / buchilog(2004-10-30):
http://km.meme.hokudai.ac.jp/people/buchi/diary/?date=20041030#p02

2004-12-03 Fri

* Okapi

昔見た Journal of Documentation の論文を検索して印刷。

Journal of Documentation, Volume 53 Number 1 1997
が Okapi プロジェクトの特集号になっている:
http://caliban.emeraldinsight.com/vl=946033/cl=49/nw=1/rpsv/cw/www/mcb/00220418/v53n1/contp1-1.htm

論文著者の所属を見たら、City University of London で開発されたらし
いので、そのサイト内限定で検索。→ Google:size:city.ac.uk okapi

以下のページに辿りついた:

Okapi-Pack: http://www.soi.city.ac.uk/~andym/OKAPI-PACK/

ここが公式サイトのよう。

研究用途でのみシステムを使え、まず申請して、100ポンド送れ、とのこ
と。もしソースコード付きで欲しければ、1000ポンド送れ、とのこと。

2004-12-02 Thu

* mozdev.org - copyurlplus

index: http://copyurlplus.mozdev.org/
RakuCopyの代替になりそうなので、とりあえずインストールしてみた。

* 汎用連想計算エンジン GETA

http://geta.ex.nii.ac.jp/
ちょっと付属マニュアルとかがヘボいけど…。。。

GETA3 はさらに面倒な構成らしいので、とりあえず GETA2 からいじって
みる。

% ./configure --with-gmake --prefix=$DIR
% make

で、インストールまで行う。

http://d.hatena.ne.jp/nazoking/20040524 あたりに試した記録があり、
参考になる。
サイクリング走行距離メーター
2001 : 01 02 03 04 05 06 07 08 09 10 11 12
2002 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12