アクセスカウンタ

<<  2005年10月のブログ記事  >>  zoom RSS

トップへ


[Sylpheed] NEC選定IBM拡張文字対応が取り込まれました。

2005/10/15 19:33
http://tmtm.org/cgi-bin/w3ml/sylpheed-jp/msg/3166
ありがとうございます。

Unicode 化されたソフトの多くが、実用面から Windows 機種依存文字対応を行なっていく事で、Windows 以外の OS でも文字化けしなくなりますね。

Unicode は、確かにデメリットがあるかもしれませんが、このようなメリットもあり上手く付き合って行きたいものです。
記事へブログ気持玉 / トラックバック / コメント


Citrus iconv パッチ

2005/10/15 17:55
なるせさんのテスト結果 で NetBSD 2.0.2 Citrus iconv の cp932, euc-jp-ms の変換に不具合のあることが判明しましたので、パッチを作成しました。
あらたに、euc-jp, euc-jp-ms の JIS X 0201 片仮名に関して UCS からの変換に不具合があったので、一緒になおしておきました。

元になるソース
ftp://ftp.jp.netbsd.org/pub/NetBSD/NetBSD-2.0.2/source/sets/src.tgz
ftp://ftp.jp.netbsd.org/pub/NetBSD/NetBSD-2.0.2/source/sets/sharesrc.tgz

パッチ
http://www2d.biglobe.ne.jp/~msyk/software/citrus/netbsd-2.0.2-csmapper.patch
http://www2d.biglobe.ne.jp/~msyk/software/citrus/netbsd-2.0.2-ja-enc.patch

パッチのあてかた
cd /tmp
ファイルをダウンロード
cd /
tar ztvf /tmp/src.tgz src/lib/libc/citrus src/lib/i18n_module
tar zxvf /tmp/sharesrc.tgz src/share/i18n/csmapper
cd /usr/src
patch -p0 < /tmp/netbsd-2.0.2-csmapper.patch
patch -p0 < /tmp/netbsd-2.0.0-ja-enc.patch


メイク&インストール
cd /usr/src/lib/i18n_module/MSKanji
make USETOOLS=no dependall install
cd ../EUC
make USETOOLS=no dependall install
cd /usr/src/share/i18n/csmapper
make USETOOLS=no dependall install
記事へブログ気持玉 0 / トラックバック 0 / コメント 2


Citrus iconv

2005/10/13 06:45
なるせさんの blog で、Citrus iconv のテスト結果が出ていたので、CVS からソースをとってきて、調べてみています。

CP932関連ファイル
src/share/i18n/esdb/CP/CP932.src
src/lib/libc/citrus/modules/citrus_mskanji.c
src/share/i18n/csmapper/CP/mapper.dir.CP.src
src/share/i18n/csmapper/JIS/JISX0208@MS%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0208@MS.src
src/share/i18n/csmapper/CP/CP932EXT%UCS.src
src/share/i18n/csmapper/CP/UCS%CP932EXT.src
src/share/i18n/csmapper/JIS/JISX0208VDC@NEC%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0208VDC@NEC.src

EUC-JP-MS関連ファイル
src/share/i18n/esdb/EUC/EUC-JP-MS.src
src/lib/libc/citrus/modules/citrus_euc.c
src/share/i18n/csmapper/JIS/mapper.dir.JIS.src
src/share/i18n/csmapper/JIS/JISX0208@MS%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0208@MS.src
src/share/i18n/csmapper/JIS/JISX0208VDC@NEC%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0208VDC@NEC.src
src/share/i18n/csmapper/JIS/JISX0208UDC%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0208UDC.src
src/share/i18n/csmapper/JIS/JISX0212@MS%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0212@MS.src
src/share/i18n/csmapper/JIS/JISX0212VDC@IBM%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0212VDC@IBM.src
src/share/i18n/csmapper/JIS/JISX0212UDC%UCS.src
src/share/i18n/csmapper/JIS/UCS%JISX0212UDC.src

とりあえず、調べるべきと思われるファイルを列挙しておきます。

参考資料
Citrus iconv の実装
http://citrus.bsdclub.org/doc/iconv-article-rev2.pdf
記事へブログ気持玉 0 / トラックバック 1 / コメント 3


[MUA] MacOS X 標準のメールソフト

2005/10/13 04:55
MacOS X 標準のメールソフトで、丸付き数字などを本文に入れて送信してみたら…
Mime-Version: 1.0 (Apple Message framework v623)
Content-Transfer-Encoding: base64
Message-Id: <3cd44e3c2d7d79b71d911dbcbdfeead6@mtg.biglobe.ne.jp>
Content-Type: text/plain; charset=CP932; format=flowed
To: =?ISO-2022-JP?B?GyRCPzk7MxsoQiAbJEI+LUc3GyhC?= <msyk@mtg.biglobe.ne.jp>
From: =?ISO-2022-JP?B?GyRCPzk7MxsoQiAbJEI+LUc3GyhC?= <msyk@mtg.biglobe.ne.jp>
Subject: =?ISO-2022-JP?B?GyRCJUYlOSVIGyhC?=
Date: Thu, 13 Oct 2005 04:26:39 +0900
X-Mailer: Apple Mail (2.623)

う〜ん、やるなら charset=Windows-31J でしょう。
Thunderbird では文字化けする。
記事へブログ気持玉 / トラックバック / コメント


[Samba 3.0] charset モジュール

2005/10/13 01:52
現状報告。
Windows標準文字セット+JIS X 0212 と Unicode とのマッピングテーブルを1本化して、CP932、CP51932、EUCJP-MS に対応させてみました。
しかし、同じマッピングテーブルが CP932.so、CP51932.so、EUCJPMS.so に個別に含まれてしまっているので、サイズ的には意味なし。
マッピングテーブルを共有ライブラリ化する必要あり。
Samba の configure を libtool 化する必要もあるかもしれません。
といった所。
記事へブログ気持玉 / トラックバック / コメント


[Sylpheed] NEC選定IBM拡張文字への対応

2005/10/10 16:27
Fedora Core 3 では、Evolution ではなく Sylpheed という国産のメールソフトを使うことにしました。

機種依存文字対応という事で調べてみましたが、Windows と互換性のあるのは NEC特殊文字だけで、NEC選定IBM拡張文字を受け取ると、Unicode の Private Use Area (ユーザー定義文字がマッピングされている領域) に変換するようになっていました。

ISO-2022-JP⇔UTF-8 の変換を EUC-JP-MS 経由で変換しているためで、ここを CP932 経由で変換するようにして、CP932→ISO-2022-JP の変換で、IBM拡張文字をNEC選定IBM拡張文字に置換する事で、Windows 互換にして使ってみています。

Windows 用のメールソフトでも、IBM拡張文字をNEC選定IBM拡張文字に置換せずに ISO-2022-JP に変換してしまい、8ビットコードが出現する酷いコードを送信しているソフトもあるので、そういったソフトからのメールは文字化けしますけれども。

送信時に、機種依存文字 (JIS X 0208 外字) のチェックをして UTF-8 メールで送信するなどの事ができるといいかも。
記事へブログ気持玉 / トラックバック / コメント


[MUA] UTF-8 Ready

2005/10/09 13:36
文字コードの確認をせずに Fedora Core 3 標準のメールソフト Evolution で送信したら UTF-8 で送信されてしまい、某メーリングリストでご迷惑をおかけしてしまいました。

デフォルトのエンコーディングを ISOー2022ーJPに変更しましたが、サブジェクトだけはUTF-8 + BASE64 Q エンコード になってしまう。

ISO-2022-JP(RFC1468)は、いろいろと面倒なところがあるので、UTF-8 に移行するのは賛成ですが、有無を言わさずに UTF-8 になってしまうのは、困りますネ。

もはやインターネットメールは、一部の技術者が使うものから社会のインフラとして活用されてきているので、極力文字化けがおきないような工夫を技術的に施していく必要があるハズです。

たとえば、はじめてメールを送る場合は、相手がどのようなOSを使い、メールソフトを使っているかわからないのですから、日本であれば ISO-2022-JP でメールを送信するようにします。そして、メールを送信する際には、メールのヘッダーに自分が UTFー8 メールを受け取れるかの許可フラグのようなものを付加しておくります。UTF-8 許可フラグがついているメールを受け取った相手だけに、UTF-8 を送信するという事にするという事で、人の手をわずらわせる事なく、自動的に UTFー8 メールへの移行が行なわれるようになる事が期待できます。

あくまでも、これは一例で、穴があるでしょう。しかし、いいかげん、使う側に人間に専門的な知識がなければ正しく使うことが出来ないという現状が放置されている事は、好ましい状態とは言えません。

MTA どうしが ESMTP によって8ビット透過かチェックしているように、MUA どうしが UTF-8 Ready であるかのチェックするようにしてくれませんかね。
記事へブログ気持玉 / トラックバック / コメント


[GNU libc] glibc への ISO-2022-JP-MS, CP51932 追加

2005/10/08 04:16
glibc-2.3.5 に対して ISO-2022-JP-MS と CP51932 の追加を行なうパッチを次の場所に置いておきます。

http://www2d.biglobe.ne.jp/~msyk/software/glibc/current/

一応、アルファ版ということで、お願いいたします。
要望やバグ報告をいただけると嬉しいです。
記事へブログ気持玉 / トラックバック / コメント


CP932系エンコーディングのマッピング

2005/10/08 01:22
画像
CP932, CP51932, CP5022[0-2], eucJP-ms, ISO-2022-JP-MS でのベンダ定義文字、ユーザー定義文字のマッピングを図で現わしてみました。

細かなところでは、IBM拡張文字→NEC撰定IBM拡張文字の変換で、大文字のローマ数字等は、NEC特殊文字へ変換されるなどが示されていませんが、おおまかなイメージとしては、こんな感じです。

といっても、もうすこし説明が必要かと思いますが、説明はおいおい付け加えていき、とりあえず図だけ公開しておきます。
記事へなるほど(納得、参考になった、ヘー) ブログ気持玉 1 / トラックバック 1 / コメント 0


[Samba 3.0] Solaris 10 へのインストール

2005/10/05 22:26

Solaris へ Samba 3.0 をインストールするためには、libiconv にパッチをあててインストールが必要になりますが、パッチがあたらないとか、実行時に libiconv.so がみつからないなどのトラブルがあるようです。


あくまでも参考ですが、次のような手順を踏んでインストールにチャレンジしてみてください。


GNU patch のインストール


PATH=/usr/sfw/bin:/usr/ccs/bin:$PATH
export PATH
wget http://ftp.gnu.org/pub/gnu/patch/patch-2.5.4.tar.gz
gzip -dc patch-2.5.4.tar.gz | tar xvf -
cd patch-2.5.4
./configure
make
su
make install
exit
cd ..
PATH=/usr/local/bin:$PATH
export PATH

GNU libiconv のインストール


wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.10.tar.gz
wget http://www2d.biglobe.ne.jp/%7Emsyk/software/libiconv/libiconv-1.10-ja-1.patch.gz
gzip -dc libiconv-1.10.tar.gz | tar xvf -
cd libiconv-1.10
gzip -dc ../libiconv-1.10-ja-1.patch.gz | patch -p1
./configure
make
su
make install
exit
cd ..

Samba のインストール


wget ftp://ftp.ring.gr.jp/pub/net/samba/samba-3.0.20a.tar.gz
gzip -dc samba-3.0.20a.tar.gz | tar xvf -
cd samba-3.0.20a/source
LDFLAGS=-Wl,-R/usr/local/lib
export LDFLAGS
./configure --with-libiconv=/usr/local
make
su
make install
exit
cd ../..
記事へ面白い ブログ気持玉 1 / トラックバック 0 / コメント 0


[Samba 3.0] CP932, eucJP-ms charset モジュールの組込み

2005/10/01 14:09
FreeBSD や Solaris で Samba 3.0 を使う場合、パッチをあてた libiconv が必要でなおかつ、共有ライブラリの検索パスが適切に設定されている必要があるという所でつまづく人は多いみたい。

Linux での情報ばかりで、FreeBSD や Solaris での、そのものズバリの情報がなかなかみつからない事に対して不満があるようですが、UNIX系のOSは、そもそも細かな違いがあるもので、その違いを乗り越えて使うのは、ユーザーの責任というところがあったと思います。

そうはいっても、UNIX系のOSも以前に比べて、利用し易くなりオープンソースソフトウェアを利用する人の裾野が拡がって来ていると考える事ができるので、configure 一発で済むようにして、メイク&インストールは簡単にできるようにしておいた方がいいのでしょうね。

という事で、Samba の configure で iconv(3) での変換をチェックして、iconv(3) での変換が Samba では使えないと判断した場合は、Samba の方で文字コード変換するようにしてしまおうと考えています。

これが実現できれば、システムの iconv(3) に libiconv を使っている FreeBSD や eucJP-ms の変換が、eucJP-ascii のようになってしまっている Solaris では、iconv(3) を使わずに、Samba の方で適切な変換を行なえるようになります。

Samba 3.0 のコードを修正することなく、CP932、EUCJPーMS charset モジュール追加、aclocal.m4、configure.in、Makefile.in の修正だけで対応できそうです。
記事へブログ気持玉 0 / トラックバック 2 / コメント 4


<<  2005年10月のブログ記事  >> 

トップへ

コードページ932 2005年10月のブログ記事/BIGLOBEウェブリブログ
文字サイズ:       閉じる