9.3.6 表示の文字コードを選ぶ

文字コードの選択

review_s8.2 文字コードで,日本語の文章には,さまざまなエンコーディング方式があることを学びました.

日本語で書かれたウェブページでも,JISコード(ISO-2022-JP)が使われたり,シフトJISが使われたり,日本語EUCで書かれているページがあります.また,UTF-8で書かれている場合もあります.

ウェブページがどの文字コードで書かれているかという情報は,個々のウェブページの中身に書くか,もしくはウェブサーバの設定として指定されます.その情報がウェブブラウザに伝えられることで正しく表示が行なわれます.

しかし,世の中にはそういうページばかりではありません.ウェブページの制作者が,自分の環境でうまく見えれば,それだけでみんなうまく見えていると思って,正しいコードの指定を怠っていることも多いのです.

ウェブブラウザが想定する漢字コードとウェブページで使われている漢字コードが異なる場合には,意図したとおりに表示されず,意味のない文字列が表示されてしまうでしょう.これを文字化けなどといいます.そのときは,手動でウェブブラウザの文字コードを,ウェブページで使われている文字コードに合わせてやる必要があります.

Safariの場合,Safariのメニューから,表示テキストエンコーディングから,望みの文字コードを選択することで,表示に使われる文字コードを選べます.

Safariencoding.png

また,多くのブラウザでは,どういう文字コードが使われているかの自動判別の機能をもっています.ウェブページのデータをみて,これはきっとJISコードだろうとか,日本語EUCだろうなどと判定するのです.

Safariの場合も表示テキストエンコーディングにおいて,デフォルトを選択しておくと,ある程度の自動判別を行ってくれるようです.そのためには,Safari環境設定の「表示」のデフォルトエンコーディングにおいて,「日本語(Shift JIS)」などの日本語の文字コードにしておく必要があるようです.

Safarien.png

ただし,漢字コードの自動判別は完全ではありません.ウェブブラウザが自動判別に失敗するなどした場合は,文字化けして表示されます.そのときは,手動で文字コードを合わせてやる必要があります.

文字化けの例

正しくない文字コードで表示しようとしたために,文字がうまく表示できなかった例を示します. 文字コードの選択の助けにしてください. 元の表示させようとした文字列は,「東大太郎のホームページ」という文字列です. それをJISコード(ISO-2022-JP)と,シフトJIS(SJIS)と日本語EUCの3つのコードのファイルを作り, それぞれ,Safariのテキストエンコーディングとして,JISとSJISとEUCを選び表示させてみました.

ファイル表示コードはJIS表示コードはSJIS表示コードはEUC
JIS東大太郎のホームページ$BElBgB@O:$N%[!<%`%Z!<%8(B$BElBgB@O:$N%[!<%`%Z!<%8(B
SJIS???????Y???z?[???y?[?W東大太郎のホームページYz[y[W
EUC??????????????????????ナ?酊タマコ、ホ・ロ。シ・爭レ。シ・ク東大太郎のホームページ