8.2 文字コードで,日本語の文章には,さまざまなエンコーディング方式があることを学びました.
日本語で書かれたウェブページでも,JISコード(ISO-2022-JP)が使われたり,シフトJISが使われたり,日本語EUCで書かれているページがあります.また,UTF-8で書かれている場合もあります.
ウェブページがどの文字コードで書かれているかという情報は,個々のウェブページの中身に書くか,もしくはウェブサーバの設定として指定されます.その情報がウェブブラウザに伝えられることで正しく表示が行なわれます.
しかし,世の中にはそういうページばかりではありません.ウェブページの制作者が,自分の環境でうまく見えれば,それだけでみんなうまく見えていると思って,正しいコードの指定を怠っていることも多いのです.
ウェブブラウザが想定する漢字コードとウェブページで使われている漢字コードが異なる場合には,意図したとおりに表示されず,意味のない文字列が表示されてしまうでしょう.これを文字化けなどといいます.そのときは,手動でウェブブラウザの文字コードを,ウェブページで使われている文字コードに合わせてやる必要があります.
Safariの場合,Safariのメニューから,
から,望みの文字コードを選択することで,表示に使われる文字コードを選べます.また,多くのブラウザでは,どういう文字コードが使われているかの自動判別の機能をもっています.ウェブページのデータをみて,これはきっとJISコードだろうとか,日本語EUCだろうなどと判定するのです.
Safariの場合も
において,デフォルトを選択しておくと,ある程度の自動判別を行ってくれるようです.そのためには, の「表示」のデフォルトエンコーディングにおいて,「日本語(Shift JIS)」などの日本語の文字コードにしておく必要があるようです.ただし,漢字コードの自動判別は完全ではありません.ウェブブラウザが自動判別に失敗するなどした場合は,文字化けして表示されます.そのときは,手動で文字コードを合わせてやる必要があります.
正しくない文字コードで表示しようとしたために,文字がうまく表示できなかった例を示します. 文字コードの選択の助けにしてください. 元の表示させようとした文字列は,「東大太郎のホームページ」という文字列です. それをJISコード(ISO-2022-JP)と,シフトJIS(SJIS)と日本語EUCの3つのコードのファイルを作り, それぞれ,Safariのテキストエンコーディングとして,JISとSJISとEUCを選び表示させてみました.
ファイル | 表示コードはJIS | 表示コードはSJIS | 表示コードはEUC |
JIS | 東大太郎のホームページ | $BElBgB@O:$N%[!<%`%Z!<%8(B | $BElBgB@O:$N%[!<%`%Z!<%8(B |
SJIS | ???????Y???z?[???y?[?W | 東大太郎のホームページ | Yz[y[W |
EUC | ?????????????????????? | ナ?酊タマコ、ホ・ロ。シ・爭レ。シ・ク | 東大太郎のホームページ |
9.3.5 ブックマークへの登録 | 9.3.6 表示の文字コードを選ぶ | 9.3.7 タブブラウジング | ||
2009年度版に向けて現在作業中です.
このページに関してお気づきの点がありましたら
コメント投稿システムまでお願いします.
|
Wed, 05 Mar 2008 02:03:07 JST (514d) |