機種依存文字としてしか使えなかった文字として,○の中に数字が入った文字や, ハートマークなどを挙げました.これはJIS第1水準や第2水準に含まれない文字というわけです.
そこで新たな文字集合を規定しようという試みがなされていました.
1990年にはJIS X 0212という文字集合が新たに規定され,5801文字が選定されました.一般にはJIS補助漢字と呼ばれます.この文字群はJIS基本漢字と呼ばれるJIS第1水準,第2水準の文字を補うために制定されました.
この文字集合を用いる方法としては,いわゆる JISコードにおけるエスケープシークエンスの切替え方式が想定されていました.また,日本語EUCにおいては第1バイトを 8F(16) とすることで,第2第3バイト目をJIS補助漢字に割り当てる方式がとられています.
いずれにせよJIS補助漢字は実際にはあまり普及していません.これはJIS基本漢字といっしょに用いることが考えられておらず,導入のために新たな枠組が必要であったからだと考えられます.
2000年にはJIS X 0213と呼ばれる新たな規格が制定されました.これは年号を用いて2000JISとも呼ばれます.この規格はJIS第3,第4水準と呼ばれる4,344文字の新たな漢字集合を規定したものですが,既存の文字コードとともに用いることができるように工夫がなされています.またJIS補助漢字とは重複する漢字も多く収録されています.この中には丸数字やハートマークも含まれます.
JIS X 0208では94×94(=8,836)の文字を扱えるのにもかかわらず,6,355字しか用いられていません.従って空きがあるわけです.この領域は自由領域,保留領域と呼ばれる区域なのですが,この部分にJIS第3水準の文字を埋め込むことにしました.1,908文字が埋められています.(なお正確には非漢字が659文字含まれます.)実はこの領域はメーカーなどが独自に文字を入れている領域でもあり機種依存文字を作りだしている領域でもあります.これによって無駄の少ない一つの領域ができあがりました.これを第1面と呼びます.
さらに,JIS第4水準の2,436文字の第2面を同じく94×94の区点の中に埋め込むのですが,これは非常に疎なものとなっています.実はこれは広く普及しているシフトJISと共存させるために作られたものです.
この第4水準(第2面)はJISコードと同じ切替え型として全く別個に扱うこともできるのですが,シフトJISの空き領域に埋め込むことも可能なように文字数を抑えているのです.具体的には下の図のようになります.
Mac OS X においては既に2000JISの文字が用いられるようになっています.また,日本語EUCにおいても第1バイトが 8F(16) であったときにJIS補助漢字を用いるのに加えて空き領域に第2面(JIS第4水準)を埋め込むことになりました.
後述のUnicodeの普及もありますので,どの程度普及するのかは未知数ですが,たくさんの漢字を使える環境ができていることには間違いありません.
19.5.5 機種依存文字 | 19.5.6 新しい文字集合 | 19.5.7 Unicode | ||
発展項目をスキップ | 19.6 平均情報量 | |||
2009年度版に向けて現在作業中です.
このページに関してお気づきの点がありましたら
コメント投稿システムまでお願いします.
|
Sun, 06 Mar 2005 03:20:09 JST (1608d) |