16.1.4 URL

URLは三つの部分からなるということを既にreview_s9.1.2 URLとは?で触れました.この中身について詳しく調べてみましょう.たとえばはいぱーワークブックのURLは

http://hwb.ecc.u-tokyo.ac.jp/current/index.html
~~~~   ~~~~~~~~~~~~~~~~~~~~~ ~~~~~~~~~~~~~~~~~~

です.これを前から順番に見ていきましょう.

まず一番最初に http: と書かれています.HTTPというのはウェブページを受信するときの通信方法のことでした.一般にこの部分は「スキーム名」と呼ばれ,URLで指し示しされた情報を取得する方法をここに書きます.ウェブページを開く場合はHTTPを用いるので,ここにhttp:と書かれるわけです.スキーム名はhttp以外にも20種類ほどあり,比較的有名なものとしてはftpなどがあるでしょう.

スキーム名以降の部分はスキームによって書き方が違いますが,まずはhttpの場合のみ考えることにします.上のURLでは,http:の次に hwb.ecc.u-tokyo.ac.jp が来ています.これは情報の置かれているウェブサーバーのホスト名(review_s14.1 ホスト名とドメイン名)を表しています.

そこから先の / で始まる部分は,ウェブサーバ内における情報の位置を表します.この部分がreview_s13.4.4 絶対パス名と相対パス名のところで学んだパス名の表記に似ていることに気づいた人もいるでしょう.実際,この部分はサーバ上のファイルシステムに対応していて,URL が指している情報はパス名に従ってディレクトリの中にファイルとして保存されています.ただし,ウェブサーバー内には外部から見られては困るファイルがあるのが普通です.ですから通常は公開する情報を置くためのディレクトリがあって,そこから下の階層のみにアクセスできるようになっています.URL表記における階層の一番上のディレクトリはルートディレクトリではなく,公開用の文書が置かれているディレクトリの階層のトップレベルのディレクトリに対応します.そこを基準にしたパス名が,URLのパス部分となります.

ちなみに,ここまではウェブサーバ上にある情報のURLだけ見てきましたが,実は手元の端末にあるファイルの場所もURLで指定することができます.この場合はURLのスキーム部はfileとなり,その直後に絶対パスを書きます.たとえば,

/home01/g999999/test.html

という場所にあるファイルのURLは

file:///home01/g999999/test.html

となります.自分の端末に保存したHTMLファイルを開くと,おそらくURLの欄にはこのように表示されるはずです.ただしこの書き方は自分の端末内での位置を示すものなので,他人にとっては意味を持ちません.明示的にローカルファイルのURLを使う機会は,さほど多くはないでしょう.

URL中で使える文字について

URLはHTML文書の中に直接書かれるものなので,HTML文書中で特殊な意味を持つ文字(related_s16.3.6 特殊な文字の書き方)などをURL中に書くことはできないようになっています.