16.3.1 HTML文書の大域的構造

HTMLでは「タグ」というものを使って文章の構造を定めるということだけ,既に説明しました.これから,そのタグを一つ一つ読み解いていきましょう.はじめにHTML文書の外形を眺めてみます.

HTML文書は,大まかに次のような構造をしています.

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
           "http://www.w3.org/TR/html401/loose.dtd">
<html lang="ja">
<head>
  (文書のヘッダ情報)
</head>
<body>
  (本文)
</body>
</html>

まず1,2行目に<!DOCTYPE ...> という文字列があります.これは文書型宣言といいます.実はHTMLにはいくつかバージョンがあり,皆さんがこれから学ぶHTMLはHTML 4.01 Transitionalというものに従っています.そのことをウェブブラウザに教えてあげなければならないので,HTML文書の1行目には必ずこれを書きます.はいぱーワークブックで学ぶ事を用いる限りにおいては,文書型定義には上に書いたものをそのままコピー&ペーストすればOKです.しかし別のバージョンのHTMLを書こうとするときは,文書型宣言もそれに合わせて書き換えてください.

ちなみにHTMLはSGMLと呼ばれる言語によって定義されていて,その定義のことを文書型定義(DTD)と呼びます.文書型宣言の中に現れるDTDというのは,このことを指しています. http://www.w3.org/TR/html401/loose.dtd にDTD本体があるので,気になる人は覗いてみてください.

次に<html lang="ja">というタグが現れます.これは「ここから先がHTML文書である」ということを意味するタグです.一方HTMLファイルの最後を見ると</html>と書かれているかと思います.これはHTML文書の終わりを意味するタグです.このようにHTMLでは,基本的に開始タグ・終了タグという2つのタグで挟んだ文字列に意味を持たせるということをします.lang="ja"というのは,文書が日本語であるという意味です.

その下にさらに<head>〜</head>で挟まれた部分と<body>〜</body>に挟まれた部分が続きます.<head>タグで挟まれた部分には文書の基本的な情報,たとえばタイトルや文字コードなどが書かれます.次に続く<body>タグで挟まれた部分が本文に該当します.HTMLファイルには<head>〜</head>で囲まれた部分と<body>〜</body>で囲まれた部分を1回ずつ,しかもこの順で書かなければいけないということがHTMLの文書型定義に記されています.

以上に挙げたことは,HTML文書を書く上で必要不可欠なことです.ですから,一からHTMLファイルを書くときは,これらの決まりを必ず守るようにしてください.予め雛形を用意しておき,それをコピーするようにすると便利でしょう.

次の節では,HTMLに関するいくつかの用語と注意を説明します.それから,<head>〜</head>の中身と<body>〜</body>の中身を覗いてみましょう.