ISO 646 の枠組の中で,円記号などの日本独自の文字を埋め込むことができましたが, ASCII,あるいは ISO 646 の日本版である JISローマ字 では128文字ということでこれ以上仮名などを入れることはできません.というわけで, さらに1ビットを追加して8ビットとした文字コードが用いられるようになりました. 簡単にいえば, 次のような仕組みです.
この規格を JIS X 0201 と呼びます.
例えば, ASCIIで 1000001 は A を意味しますが, JIS X 0201 では 01000001 という8ビットが A を意味し, 先頭に1をつけた 11000001 はカタカナの「チ」を意味します.
言い換えると, 0から127まではASCII(JISローマ字)と全く同じであり, 128から255までに日本独自のカタカナを加えたわけです.
なお, 7ビットのままでカタカナを扱う規格も存在しますが, ここでは述べません.
8ビットへの拡張は日本だけではなく独自の記号を持つヨーロッパでも行なわれました.日本の JIS X 0201 と同じく, ASCIIを拡張したものです. 8ビットコードの国際規格として ISO 8859が定められ, それに沿った文字コードがいくつも登場しました. 実際によく用いられているのは西ヨーロッパ向けの ISO 8859-1(通称 Latin-1)と呼ばれるものです.
なお, ASCII や JIS X 0201 の文字は「半角文字」と呼ばれることがあります. これは後述されるJIS漢字との対比です.
伝統的にこれらの文字はそのJIS漢字の半分の幅で表示されてきましたからそのような名称が用いられるようになりました. なお, JIS漢字を「全角文字」と呼ぶこともあります. 文字コード自体では文字幅の規定などはなされていませんから本来はおかしな名称ではありますが知っておいてもよいでしょう.
また, おなじく通称で「半角カナ」と呼ばれるのは, JIS X 0201の 128から255の部分に配置された仮名文字です.
「インターネットでは 7ビットの ASCII が基本であり, 日本語を用いる場合でも, いわゆる『半角カナ』を用いる方法は定義されていない. そのようなものを不特定多数の人間が利用するインターネットで使うのは迷惑である」という主張もあります. 最近ではあまり問題は起きないとは思いますが, 実際に迷惑だと感じる人がいることには注意するとよいでしょう.
19.5.2.1 ASCIIファイルの中身 | 19.5.3 JIS仮名 | 19.5.4 JIS漢字 | ||
2009年度版に向けて現在作業中です.
このページに関してお気づきの点がありましたら
コメント投稿システムまでお願いします.
|
Fri, 14 May 2004 15:42:56 JST (1904d) |