Vistaで化ける字、化けない字

マイクロソフトのWindows Vistaでは、文字コードにUnicodeを使いながら、Unicodeとは異なる文字コード規格のJIS X 0213をサポートする、という方式を取っている。というのも、Windows 98日本語版以降ずっとサポートしてきたCP932(本名はWindows Codepage 932、いわゆるMS 漢字コード)やJIS X 0212を捨てるわけにはいかないので、CP932もJIS X 0212もJIS X 0213もみんなまとめてUnicodeで扱う、というやり方を取らざるをえないのである。

前報では、JIS X 0213の第一水準~第三水準漢字7614字について、Vistaで新たに採用された日本語フォントセットであるメイリオとXP以前のMSゴシックを見比べ、7614字のうち318字が、VistaとXP以前との間で文字化けする(ここでは本来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う)ことを報告した。今回は、残る第四水準漢字2436字と非漢字1183字について報告する。

第四水準漢字2436字のうち、Vistaの字体がXP以前と明らかに異なっているのは、14字ある。図8に一覧を示す。図の中で「2-08-68」というように書いているのはJIS X 0213の面区点番号、「5DB2」の方はUnicodeである。これを見るとわかるように、例えば「山かんむりに雋」という漢字をVista上で入力したつもりでも、そのデータをXP以前のパソコンに持っていくと「屮かんむりに雋」に化けてしまうのだ。

残り2422字のうち図9~11に示す722字は、Vistaでは表示できるが、XP以前では表示できない。特に、図9に示した277字は、Unicodeの弱点とも言うべきサロゲート・ペア(前報のカコミ記事参照)を使わなければならないので、XP以前のパソコンに持っていくと、ソフトウエアによってはちゃんと処理されない可能性が高い。結局、第四水準漢字で問題がないのは、これら736(14+722)字を除いた、1700字だけということになる。(2006.12.25/日経BP)
[PR]

by fbitnews2006-6 | 2006-12-25 13:38 | インターネット総合  

<< プロセッサ競争が、周波数からコ... ヤフー、公衆無線LANサービス開始 >>