[Subject Prev][Subject Next][Thread Prev][Thread Next][Subject Index][Thread Index]

[linux-users:91005] Re: 外字の扱い


 しらいです。

In Message-Id <200201311359.AA01146 _at_ charlie.asahi.email.ne.jp>
        Takuo Nakamura <nakamuri _at_ asahi.email.ne.jp>さんwrites:
> 中村です。

> > 最初からそんな Windows でしか読めないような文字を使わない
> >ようにしておけばいい、というのが本質論だとは思いますが :-)
> 
> JIS X 0212 の文字ですから UNICODE なら処理できます。

 UNICODE を処理するソフト側の実装によっては font が無いので
この辺りの gryph に相当する文字は実質上使えないことも多いん
です。
 そもそも ShiftJIS は ISO 規格外なので、JIS では規格化され
ていますが国際的な文字コードとしては弱いと思います。


> Windows の オフィスアプリケーションは MS-Office 2000 から
> 完全に UNICODE 化してしまいましたし、0212 は名前の入力に
> 必須ですから使わないようにするというのは無理だと思います。

 それは飽くまでも UNICODE で使うときの話であって、ShiftJIS
として使っている時にはこの拡張文字の扱いは非常に繊細な問題を
含むので、ShiftJIS で用いるのは避けるべきです。
 例えば、この JIS X 0212 の文字は、同じ gryph の文字が IBM
拡張文字と NEC 選定 IBM 拡張文字の領域に重複して存在しており、
font では見掛け上区別がつきません。
 その上、IME や API がこれらの文字を正規化して一方に一元化
してしまうのですが、どちら側に一元化するのかという仕様が何故
か Win95/98 系と WinNT/2000 系とで逆になっています。
 このため、同じ Windows 上ですら互換性を保てなくなる局面が
発生します。

 「名前の入力に必須」というのは気持ちとしては判るのですが、
現在 UNICODE を含めて規格化されている全ての漢字をもってして
も全人名用漢字を網羅することは叶っていません。
 人名用漢字をもって「必須」とされてしまうと、おそらく連日の
ように動的に新規漢字コードを割り振っていく必要があり、漢字コ
ードの体系に抜本的な改革が要されるでしょう。

 Office 2000 で UNICODE 化が成されましたが、このせいで同一
OS 上での漢字コード体系の二重化という弊害も生じてしまってい
ます。Office でしか扱えない漢字が結構あるんですね。
 IBM 拡張漢字にあるものはまだ Office 以外の環境でも扱えるの
ですが、それ以外の漢字については font は用意されているものの
IME で選べなかったり file に書込もうとすると入力不可だったり
して現実的ではありません。

 「あるから使う」「要るから使う」という自分本位な考えは、閉
じた環境の中では妥当性があるかも知れませんが、開かれた環境に
はそもそもそぐわないスタンスだと思います。

# Linux との親和性については... Li18nux で何とかしてくれる
#んでしょうよ :-)

                                               しらい たかし


この情報があなたの探していたものかどうか選択してください。
yes/まさにこれだ!   no/違うなぁ   part/一部見つかった   try/これで試してみる

あなたが探していた情報はどのようなことか、ご自由に記入下さい。特に「まさにこれだ!」と言う場合は記入をお願いします。
例:「複数のマシンからCATV経由でipmasqueradeを利用してWebを参照したい場合の設定について」
Follow-Ups: References: