リンク: [ホーム] [自己紹介] [リンク集] [アルバム] [ソフトウェア] [発表文献] [その他]

まさおのChangeLogメモ / 2005-02-12

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

2005-02-12 Sat

* 訳してねっと

http://www.yakushite.net
コミュニティ型機械翻訳サイト。

各分野のコミュニティ内で Translation Memory とも言うべき辞書を共有
して、それを使った機械翻訳を提供する。
といった感じだろうか。

とりあえずメモ。

* ■ [I18N] 文字符号化検出と言語検出

http://d.hatena.ne.jp/kazama/20041106#p1
文字コードと言語の自動検出の話題。

Mozilla の chardet モジュールとそれに関連する各種ライブラリがよく
まとまっている。
http://www.mozilla.org/projects/intl/chardet.html
http://www.mozilla.org/projects/intl/UniversalCharsetDetection.html

iChardet: mozilla/intl/chardet の Java 版:
http://www.i18nfaq.com/chardet.html

ちなみに、ICU4C ではエンコーディングの自動判別機能は提供していない
らしい…。
http://oss.software.ibm.com/icu/userguide/codepageConverters.html

また、以下の www-international@w3c.org ML の以下のスレッドでは多言
語の自動判別についてのアルゴリズム/ツールが挙げられている。
・What is a language detection algorithm?
http://lists.w3.org/Archives/Public/www-international/2004OctDec/thread.html#59