19.5.1 文字コード

コンピュータの中では, 文字は0と1のビットの列で表されます. 0と1のビットが8つの組を1バイトと呼びます. 1バイトは情報を扱う基本的な単位の一つです. (本来は, 1バイトが8ビットであると決まっているわけではなく, コンピュータの種類によって異なるのですが, 大抵は8ビットだと考えても問題ありません.) 1バイトで2の8乗種類もの「もの」を指し示すことができます. 1バイトで, 数だと, 2進数表示で 00000000 から 11111111, すなわち, 10進数表示で 0 から 255 までの数を表すことができます.

このようなビット列を文字に対応づけることを考えます. 文字にすると1バイトのデータで最大256種類の文字を表現できます. 文字とビット列の対応を文字コードと呼びます. さて, ここまでは「文字」と呼んできましたが, コンピュータを使う際には「通信開始」であるとかいったコンピュータを制御するための符号を送信する必要が出てきます. また,「削除」「バックスペース」などといったものもあります. コンピュータではこれも通常の文字と同じくビット列を割り当てて表現します. これらの文字は特別に「制御文字」と呼びます.