しらいです。 In Message-Id <200201311359.AA01146 _at_ charlie.asahi.email.ne.jp> Takuo Nakamura <nakamuri _at_ asahi.email.ne.jp>さんwrites: > 中村です。 > > 最初からそんな Windows でしか読めないような文字を使わない > >ようにしておけばいい、というのが本質論だとは思いますが :-) > > JIS X 0212 の文字ですから UNICODE なら処理できます。 UNICODE を処理するソフト側の実装によっては font が無いので この辺りの gryph に相当する文字は実質上使えないことも多いん です。 そもそも ShiftJIS は ISO 規格外なので、JIS では規格化され ていますが国際的な文字コードとしては弱いと思います。 > Windows の オフィスアプリケーションは MS-Office 2000 から > 完全に UNICODE 化してしまいましたし、0212 は名前の入力に > 必須ですから使わないようにするというのは無理だと思います。 それは飽くまでも UNICODE で使うときの話であって、ShiftJIS として使っている時にはこの拡張文字の扱いは非常に繊細な問題を 含むので、ShiftJIS で用いるのは避けるべきです。 例えば、この JIS X 0212 の文字は、同じ gryph の文字が IBM 拡張文字と NEC 選定 IBM 拡張文字の領域に重複して存在しており、 font では見掛け上区別がつきません。 その上、IME や API がこれらの文字を正規化して一方に一元化 してしまうのですが、どちら側に一元化するのかという仕様が何故 か Win95/98 系と WinNT/2000 系とで逆になっています。 このため、同じ Windows 上ですら互換性を保てなくなる局面が 発生します。 「名前の入力に必須」というのは気持ちとしては判るのですが、 現在 UNICODE を含めて規格化されている全ての漢字をもってして も全人名用漢字を網羅することは叶っていません。 人名用漢字をもって「必須」とされてしまうと、おそらく連日の ように動的に新規漢字コードを割り振っていく必要があり、漢字コ ードの体系に抜本的な改革が要されるでしょう。 Office 2000 で UNICODE 化が成されましたが、このせいで同一 OS 上での漢字コード体系の二重化という弊害も生じてしまってい ます。Office でしか扱えない漢字が結構あるんですね。 IBM 拡張漢字にあるものはまだ Office 以外の環境でも扱えるの ですが、それ以外の漢字については font は用意されているものの IME で選べなかったり file に書込もうとすると入力不可だったり して現実的ではありません。 「あるから使う」「要るから使う」という自分本位な考えは、閉 じた環境の中では妥当性があるかも知れませんが、開かれた環境に はそもそもそぐわないスタンスだと思います。 # Linux との親和性については... Li18nux で何とかしてくれる #んでしょうよ :-) しらい たかし
Follow-Ups:
- [linux-users:91010] Re: 外字の扱いTakuo Nakamura
- [linux-users:90998] Re: 外字の扱いTakuo Nakamura
- Prev by Subject: [linux-users:91004] Re: サーバーの低消費電力化
- Next by Subject: [linux-users:91006] Re: サーバーの低消費電力化
- Previous by thread: [linux-users:90998] Re: 外字の扱い
- Next by thread: [linux-users:91010] Re: 外字の扱い
- Indexes:[Main][Thread]