8.2.3 半角と全角

ASCIIで使われている文字集合は, それぞれの文字の形も簡単です. そのため, ディスプレイに表示される際やプリンタに印刷される際には, 縦横比が 2:1 の,縦に細長い字体が多く用いられます. このような字体の文字を俗に半角文字と呼ぶことがあります.

これに対して, 漢字などの文字は文字の形が複雑なため, 一般に縦横比が 1:1 の字体が用いられます. このような字体の文字は全角文字と呼ばれることもあります. 漢字の文字集合としてはJIS X 0208という規格で定められたものがよく用いられます.

1バイトで表現されるASCII文字の倍の幅を 2バイトで表現される漢字が持つため, 処理に都合がよいという事情もあります.

ASCIIと同じく1バイトの枠内で表現されるJIS X 0201という文字集合があります.ASCIIは正確には7ビットで表現されるので,最大でも2の7乗で128文字しか表現できませんが,1バイト=8ビットで表現すると2の8乗で最大256文字表現できます.JIS X 0201は,ASCII文字に割り当てられてない部分に日本で使われるカタカナなどを割り当てた文字集合です.1バイトでは最大256文字しか表せないので,漢字は含んでいません.まだコンピュータの能力が貧弱で,漢字などを扱えるコンピュータがまだ少なかった頃に制定された規格です.この文字集合に属するカタカナは俗に半角カナと呼ばれます.

参考までに,全角文字と半角文字の表示した例を示しておきます.必ずしも, いわゆる全角文字はいわゆる半角文字の倍の幅で表示しなければならないと決まっているわけでないことを注意しておくとよいでしょう.

zenkaku.jpg

たとえば,JISコードは,JIS X 0201の文字集合と,JIS X 0208の文字集合が共存したテキストファイルを扱えるので,ひとつのファイルの中に半角文字と全角文字が混在していても大丈夫です.