19.5.7 Unicode

これまでの流れとは別に, Unicodeと呼ばれる文字の規格が存在します. これは, 世界中の文字を全て集めて符号化しようという試みです. ISO-2022-JP のような切替え方式を用いずに多数の文字を用いることを可能とします.

ここでは細かなことは述べませんが, 16ビットの中に全ての文字を入れるという目的を持って作られたもので, 例えば中国,韓国と日本の漢字は統合されるということになります. 漢字には文化という面もあり, Unicodeには賛否両論がありますが, Java や Mac OS XやWindowsなどでも既に Unicode は利用されています.

国際規格では ISO 10646であり, 日本では JIS X 0221 で規定されています.

この文字集合をUCSと呼びますが,これを符号化するためのUTFと呼ばれる方法が定められています.UTF-7,UTF-8とUTF-16,UTF-32があります.