11.1.2 キーワード入力による検索

ここではロボット型検索エンジンの例としてexternal_sGoogleの利用法について学びます.文中の画像ではSafariを使用していますが,基本的にはどのウェブブラウザを使用しても検索方法に違いはありません.

まず,1つの単語のみを用いた簡単な検索の方法について説明します.例えば「東京大学」に関する何らかの情報を手に入れたいとしましょう.

  1. 下の図は Google のトップページです.青いラインで囲まれた枠が,キーワード入力欄です.まず最初にキーワード入力欄にマウスポインタを合わせて,左ボタンをクリックします.するとテキストカーソルが点滅し,文字入力が可能な状態になります.

    Google のトップページ
  2. その後検索したい単語(今回は「東京大学」)を入力します.日本語入力の仕方はreview_s8. 日本語の扱いを参照して下さい.

    キーワード入力

    キーワードを正しく入力した後,enterキーを押すと検索が開始されます.入力欄のすぐ下にある「Google検索」ボタンを左クリックしても同様に検索が行われます.

  3. するとあっという間に次のような検索結果が表示されました (検索エンジンの持つページのリストは日々更新されているので,必ずしも全く同じ結果が出るとは限りません).

    検索結果

    青いバーの右側に「約879,000件中1 - 10件目」と書かれているのがわかります.これは「東京大学」という単語に関係するページが88万件も (!) 見つかったことを意味しています.

検索結果は上位に表示されたページほど,検索エンジンが「適切である」と判断したものとなります.つまり現在は適切であると判断されたページのうち上位1位から10位までが表示されています.ページタイトルの下にそのページの中で検索した単語が含まれる部分の文章が表示されているので,それを参考に目的のページの目星を付けます.表示されている10件の中に希望するページがない場合は,検索結果ページの下部にある「次へ」をクリックして次の10件を表示します.

検索結果ページ: 次へ

しかし,本当は東京大学の中でも特に「教養学部」について知りたかった場合はどうすればよいのでしょうか.「東京大学」というキーワードだけで検索したページですから,必ずしも教養学部について書かれたページばかりとは限りません.実際に各ページを表示させてからリンクをたどったり,教養学部について書かれているかどうかを確認することも可能ですが,どうせなら初めから教養学部に関するページのみを表示させたいものです.

そのためには,キーワードを複数設定し,より適切な検索結果に絞り込む必要があります.Googleでは,複数のキーワードをスペースで区切って入力すると,それらの単語を全て含むページを検索してくれます(これをAND検索と言います).Googleのトップページに戻り,初めからやり直しても良いのですが,先ほどの検索結果ページの上部(または下部)に,検索した単語が既に入力されたキーワード入力欄があるので,今回はそこにキーワードを追加して検索結果を絞り込んでみましょう.

  1. 既に入力されている「東京大学」に加えて,「教養学部」と入力します(この際も入力欄をクリックし,テキストカーソルを点滅させる必要があります).キーワードとキーワードの間にはスペースを入力して下さい.そして再び検索を実行します.

    「東京大学」に加えて「教養学部」と入力
  2. 今度は検索結果が…

    検索結果

    「約41,400件」になりました.まだまだ膨大な件数ですが,最初の20分の1以下に絞り込まれ,検索結果の上位に教養学部のトップページが表示されました.

設定できるキーワードは2つだけではありません.スペースを空けさらに単語を追加すれば,3つ以上の単語を含むページを検索することもできます.教養学部の図書館について調べたければ,「東京大学 教養学部 図書館」と入力すれば良いわけです.徐々に単語を加えながら結果を絞り込むことも,最初から複数のキーワードを入力して,無駄な検索結果を省くこともできます.ただしあまりに多くのキーワードを設定してしまうと,かえって望ましい結果が出ないこともあります.

以上の操作を覚えるだけで,皆さんの情報収集能力は格段にアップするはずです.Googleなどによるキーワード検索をマスターすれば,WWWをまるで巨大な百科事典のように利用することができます.

advanced

検索キーワードに対して,どのようなページが上位に表示されるかに使われる評価関数は,検索エンジンごとに多少異なるでしょう.Googleなどで採用している方法として,「重要なページからリンクされたページが重要である」という基準があります.

GoogleではPageRankという概念を用いページをランク付けしランクの高いページから優先的に検索されるようになっています.このランクづけは自動的に行われ,ランクの高いページからリンクされているページは,ランクが高くなるなどの工夫が取り入れられています.

検索の練習

検索エンジンで調べることにより,次の四角の中に数字を入れてください.

東京大学教養学部の創立は(1) 年(2) 月(3) 日です.

さらに効率的な検索を行いたい人は,次の上級項目に進んで下さい.