航空の現代電脳篇 → ホームページ作法(22)

サイトの中の検索法

 

 本頁を読んでいただいているお一人から、サイト内部の検索エンジンをつけてほしいという要望があった。実は私も、しばらく前から同じことを考えていて、元締めの BIGLOBE に問い合わせを出し、返事を貰ったばかりであった。

 というのは『航空の現代』の中身が、質はともかく、量だけはどんどん増えて、今や400篇近い分量になった。そのため筆者自身、どこに何を書いたか分からなくなってきたからである。ましてや赤の他人様には、ごちゃごちゃのがらくたの山にしか見えないであろう。

 そこへ6月末のこと、BIGLOBE から知らせがあって、これまでホームページの開設限度は通常5メガ、超過料金を払えば最大25メガまでということだったが、今後は55メガまで許すというのである。今のところ本頁の使用量は15メガ程度で、25メガになるのはまだ2年ほど先ではないかと思われるが、その限界に達したならば「いったんネットに載せた頁は古くなっても削除してはならない」というヤコブ・ニールセン先生の教えには反するが、古いものから順に入れ替えてゆくつもりだった。しかし55メガまで可能ということになれば、無論それなりの費用は発生するにしても、まず入れ替えの必要はなくなる。しかし、むやみに量だけが増えて、どこに何が書いてあるかますます分からなくなるだろう。

 現在すでに自分でも混乱しているのだから、赤の他人の読者にはただもう面倒なだけで、余りに膨大な量では初めから見る気がしなくなる、などということになっては困る。それが、いよいよ具体的に検索エンジン取りつけの質問を発したきっかけであった。

 

 ところが BIGLOBE からもどってきた回答は、次のようなものだった。

「ホームページ内の検索機能をつけたい場合は、そのような機能のCGIプログラムをご用意されれば可能かと思われます」(ふむふむ)

「CGIプログラムは一般的にはPerl(パール)というスクリプト言語によってプログラミングされます」(パール語なんて聞いたことないなあ)

「CGIプログラムをご自身で作成される場合、Perl言語およびUNIX の知識が必要になります」(何だって? そんな知識持ってないぞ)

「プログラムを作成される場合は、CGIに関する文献やサイトを参照されることをお勧めします」(参照しても、分かりそうもないけど)

「弊社サーバでの設置に関しましてはCGIとはの項目をご参照くださいますようお願い申し上げます」

 そこで念のために「CGIとは」の項目を見ると、次のように書いてある。

「CGIを作成するには、UNIXについての正しい知識が必要となります。ここがCGIにチャレンジするうえで、最も難しいところでしょう。UNIXについては勉強してもらうしかありません。これらのプログラムは大抵、perlやsh,cshと呼ばれるインタプリタ言語や、C言語で作成されます」

 何のことか、さっぱり分からぬ。分かったのは、終わりの方のとどめの一文だけであった。

「不正確な知識に基づいて書かれたプログラムが暴走し、それが置かれているサーバ全体をダウンさせたり、あるいはファイルへの Permission が正しく設定されていないため、他の人間が勝手に自分のファイルを書き換えたりするなどの危険性が十分に考えられます。くれぐれも正しい知識を得た上で、CGIプログラムをお使い下さい」

 これはもう全く違う世界で、手に負えそうもない。BIGLOBE としても本音は、素人が余計なことをするのはやめてくれと言いたいのだろう。何かほかのことを考えねばなるまい。

 

 そこで、ひとつはウェブサイトに送り込んだファイルを、全て自分のパソコンに取りこみ、その中だけで grep か何かを使って検索するという方法である。取りこみに際しては、ホームページ・ブラウザを使うと手間ひまかかるから、FTPといったファイル・トランスファー・システムを使えばよかろう。ホームページのファイルをこちらからWWWサーバに送りこむのと同様に、サーバからこちらへ逆に送りこむ。

 ファイルの容量は15〜25メガ程度だから大したことはない。これで自分のパソコンの中に『航空の現代』という独立世界ができ上がる。その中で検索すればいいのだが、これは自分ひとりの役には立つけれども、外部の読者の皆さんの役には立たない。

 片手落ちで申しわけないし、せっかくわがサイトを活用してもらおうと思うのに残念である。

 

 というので、やはり既存の検索エンジンに頼るほかはないというのが次に考えたことである。まず、いくつかの主要な検索エンジンに「航空の現代」というキーワードを入れてみる。すると、たとえば「ヤフー」や「インフォシーク」など、本頁の表紙は表示されるが内容は出てこない。これでは、たとえば『航空の現代』の中からティルトローターに関する記事を選び出そうとしても、その役には立たない。

 余談ながら「ヤフー」などは検索サイトを人為的に選んで登録してあるから、こうなるのだろう。『航空の現代』そのものが見つかればそれで一応の役目は果たしたということで、その内部の検索まではもともと考えていないに違いない。

 つづいて「エキサイト」で検索してみると、これは本頁のファイルが25篇ほど呼び出された。しかし、400篇近い全体からすれば不充分である。ほかに『航空の現代』を含む航空関連のリンク集の頁が多数出てくるが、これも本頁そのものを探すのには役立っても、内部の検索にはならない。次に試した「Goo」は、そうしたリンク頁が10件ほど出てきただけであった。

 しかし最後の「InfoNavigator」は有難いことに、「航空の現代」という言葉を含むファイル300件以上が呼び出された。この中にはリンク集もあるが、そうしたよその頁はごくわずかで、ほとんどは本頁のファイルである。つまり400篇近い本頁の7割以上が画面に並んだことになる。

 そのような300篇のファイルに対し、次は絞りこみをかける。「絞りこみ」のわくの中に、たとえば「ティルトローター」というキーワードを入れる。すると300篇の中から42篇が抽出される。しかも全てが本頁のファイルで、他のサイトのリンク集などは入っていない。

 混じりっけなしの純粋な「航空の現代」ばかりだから、おそらくはこの42篇がわがサイトに含まれるティルトローター関連ファイルの全てなのであろう。取り敢えずは、むずかしいCGIなど使わず、この富士通の検索エンジンを使わせてもらうのが最良という結論に達した。ぜひ「InfoNavigator」を呼び出して上のような検索作業を試みていただきたい。

 

 なお、この検索方法を実行するに当たっては、もう一つ「日経サーチ・エンジン・ルーム」から入ってゆく方法がある。この検索装置は2つのキーワードを同時に入れて検索できるから、たとえば「航空の現代」と「ティルトローター」の2語を2つの函に入れ、いくつかの検索エンジンが表示されている中から「InfoNavigator」を選んでボタンを押せば、初めから絞りこんだ結果の42篇が表示される。

 さらに蛇足を加えると、「コペルニク・ライト」という検索装置は別の意味で面白い。これは一時に11種類のエンジンを使って検索してくれる。ただし1種類のエンジンについて10項目ずつしか結果を表示しないから、上のような同じサイトからティルトローター記事の全てを引き出すといった作業には適さない。広く薄く検索して、インターネットの大海の中で、どこに何があるか取り敢えず見当をつけるには良いであろう。

  

 もうひとつ蛇足に蛇足を加えると、「ヤフー」が上の私の目的に合わなかったからいうのではないが、あのように最初に人為的に取捨選択したり、分類したりする「ディレクトリー検索」は、私は好まない。

 インターネットの大海は確かに玉石混淆で、ごみのような情報も多いかもしれない。けれども、どれが玉で、どれがゴミか判定するのは検索者当人にまかせてもらいたい。ある人にはゴミであっても、別の人には玉かもしれない。他人が玉だのゴミだのを判別する権利は、本来ないのである。ただし初心者のためにはいいかもしれない。あるいは「ヤフー」のくせをのみこんで、ヤフーの選定の仕方と自分の判断とがよく合うような人にはいいだろう。

 念のために、私の言いたいのは「ヤフー」の善し悪しではない。情報収集の方法である。ある情報が自分に価値があるかないかを決めるのは自分自身であって、他人ではない。そのためには、途中で価値判断が入らないような仕組み、すなわちインターネットの場合ならば先ず機械的に全てをかき集めてしまう「ロボット検索」のような仕組みの方が他人に頼るディレクトリー検索より望ましいということである。その中から玉を探し出して美しく磨き上げるのは、われわれ自身の情報感知能力ではないかと思うのである。

(西川渉、2000.7.8) 

「電脳篇」目次へ) 表紙へ戻る)