PCやネットワークに関すること

正しいホームページの書き方 〜 HTML文法

ホームページとは何を指すのかということについては、別項にも書いておりますが、やはりここでは一般的な用いられ方で使っています。このホームページですが、皆様はどのように作成しておられるのでしょうか。多くの方は作成ソフトを使い、言葉や絵をワープロのように配置することで作っているのではないかと思います。きちんとしたソフトを使っているのですから、正しいに決まっていると信じているのでしょうけれど、実は必ずしもそうではないようです。

ホームページ自体は、HTML(Hyper Text Mark-up Language)という方法に則り、単純なテキストとして書かれます。例えば画面上で文字に色が付いているとしても、その元となるHTMLでは、「ここからは赤色」というような指定が書かれているものとなっています。このような書式(色など)やリンクなどの指定を行う記述部分は「タグ」と呼ばれています。この「タグ」の書き方とブラウザでの表示の仕方が定められているため、正しいタグを書くことで、作った通りに表示されるという仕組みになっています。作った通りと言っても、表示する際の画面の大きさや、ブラウザ側の指定などにより、微妙に再現されないのが普通ですが。

このHTMLですが、その仕様はW3C(World Wide Web Consortium)という団体が決めています。インターネットでのことですから、法律のように誰かが定めて規制されるものではなく、皆で合意して守っていこうという考え方に基づいているようです。このことは、実は、いくつかのバリエーション(亜流)を生み出してしまったりする原因になっています。代表的なブラウザを作っているのは御存知ネットスケープマイクロソフトですが、それぞれが独自に新しい機能を盛り込もうとして混乱していたこともあります。HTMLの進化の過程において、どうしても早く盛り込みたい機能があった場合など、統一に至る前に実現してしまうなどがあったためです。更にこれが理由となって、多少間違っていたりルールから外れていてもそこそこの扱いがされるようにもなっているようです。この辺のことは筆者自身も詳しくないので、これ以上の言及は避けます。

さて、正しいHTMLとはどういうものでしょう。ただでさえ亜流があったりする上、HTML自体が進化を続けていますから、余計に話が面倒になります。新しいバージョンのHTMLが設定されると、古いものは経過的に据え置かれるか、一部のルールもしくは全てのルールが廃止されるということになります。実際は以前のバージョンで書かれたものが表示できなくなるのも困りますので、廃止されたはずの古いものでも使用可能だったりします。こうした中で、正しいHTMLというものは、「まだ廃止されていないバージョンのHTML文法に沿っているもの」ということになります。例えば、いくつかのバージョンの機能にまたがっているものは、正しそうに見えて正しくないことになるのです。

先程、きちんとしたホームページ作成ソフトで作ったとしても正しいとは限らないと書きました。ソフトメーカーさんには怒られてしまうかと思いますが、事実、厳密な意味での正しさが守られていないケースはあるのです。また、HTMLを紹介・解説する本でも正しくないものがあるのです。きちんとしたものを作っていないという点を責めることもありえますが、急速に発展してきたインターネットのことですので、手が回らないということがあるのでしょう。これらの間違いに関するページも沢山ありますから、一度覗いてみると良いかもしれません。例えば、HTML鳩丸クラブ初めてのホームページ作成講座にあるホームページ作成ソフト比較表などですね。これらはまた見付けたら載せていきたいと思います。

では、正しいHTMLはどうやったら書けるのでしょうか。もともとの規定は英語であるうえ、素人には近付けない技術的な記述がされています。ここまでさかのぼるのは厳しいですね。そこで、信用できそうな人や組織に当ってみることにしましょう。信用できるかどうかを判断すること自体が難しいですが、W3C勧告(ここでは規定だとかルールだとか、色々な言葉を使っていますが、もともとは「勧告」なんです)という言葉が載っているような場合は信用して良さそうです。そこで見付けたサイトを紹介しましょう。まずHTMLに関しては、HTMLのコーディングチェックとその中にあるHTML4.0参考書がおすすめです。そして、実際に作ったページの文法チェックとして、Another HTML-Lintの中のゲートウェイサーヴィスを試してみると良いでしょう。

必ずしもHTML文法そのものではないルールもあります。例えば文字コードの扱い方がその代表例となります。機種依存文字と呼ばれている文字、つまり統一規格として定められていないため、表示が乱れてしまう文字などはHTMLとは関係なく使ってはいけないことになります。また、リンクを設置するときに、ジャンプ先のURLを書くときのルールについても、HTMLとは異なったRFCに従う必要があります。これらは大抵が使える文字の種類の問題だと考えてください。他にも色々と定められていることがあるのですが、普通は問題を生じることは少ないので、ここではあまり深追いをしないことにします。

文法的に正しいとしても、また全てのルールに従っているとしても、本当にそれで良いのか、という問題もあります。フレームを使っている場合は、フレーム非対応ブラウザでの表示も考えておくべきです(これは勧告にあります)。最近でこそフレーム非対応の方が少数派ですから、あまり問題は無いかもしれませんが、多くの人に見てもらう上でのマナーでもあります。最近といえば、JAVAスクリプトを使用しているページが大多数になってきています。JAVAはウィルス的な問題を起こすようなものも含め、危険性が高いこともあって筆者も使用しない設定にしているのですが、この場合に全く何も表示されないページがあるのです(これは勧告には無いかもしれません)。こういったものは文法以前の問題として考えて欲しいものです。そして、これは余談ですが、ホームページ作成ソフトは自動的に沢山のタグをつけるという傾向があります。これも文法的問題はありませんし、表示的にも問題はありません。ソースの見た目が悪いことや、HTMLを実際よりも難しいもののように見せてしまうことが欠点です。

確かに、きちんと表示されるかが重要であれば、厳密な意味での「正しさ」は大して意味はありません。正しさを追求するのは一つの考え方であって、全ての人が従うべきものとはいえないと考えています。ただ、本来はどういう考え方なのかということを知るためにはちょっとばかりの興味を持ってみることはプラスになります。多くの人に見てもらうページ、つまりは多くの人に見てもらえるページを作ることを考えていくのでしたら、必要な知識があった方が良いでしょう。

最後に、ここのサイトのHTMLですが、これらをHTML-Lintのチェックにかけないで下さいね。ほとんどのページを雑に作っているので相当悲惨なスコアになると思います。言い訳ですが、タグを手打ちでやっているせいでミスもありますし、第一最新の情報についていけていないのです。例えば、HTML4.0ではCSS(Cascade Style Sheet)を使用することになっていますが、全然使ってません。いえ、使えません。こういうあたりなどはボロボロなんです。(好みで敢えて使っている書き方もありますけど、そういうことを言っているとこのページ自体の内容と矛盾するので内緒としておきます)

Go Back

  --- Taq's Herb Photo Gallery ---