日本のOS/2検索

Supported by Altair☆
<NBG01720@nifty.ne.jp>
日本の OS/2 検索:  

表示件数:     要約表示:     ソート:



日本のOS/2検索とは…

個人でOS/2関連の情報を掲載している日本国内の人々のwebページを対象とした検索エンジンです。

OS/2関連の情報をサーチする時、キーワードに「OS/2」と指定しても、OS/2に無関係なページが数多くひっかかって来て、やんなっちゃったことがありました。

だったら、OS/2な人々のページしかスキャンしないOS/2専用ロボット型検索エンジンを自分で作っちまえっと思い立ち、wgetとnamazuで構成してみました。思い付きでやってみてるだけなので、将来に於てもサービスを続ける保証はありません。(^^;

検索対象ページの選択基準

WebChain/2 Go Previous Go Next Go WebChain/2 Home Go Ramdom

2002年12月 8日より、WebChain/2に登録されているOS/2関連のページを検索対象としています。

検索式の書き方

検索そのものはnamazuとkakasiの機能を流用しています。

以下にnamazuの説明書を引用しておきます。

大文字、小文字の区別はありません。foo*のように末尾にアスタリスクを指定することで前方一致検索が可能です。また、単語をスペース区切りで並べて書くとアンド検索になります。日本語はkakasiによって分解され、「日本語情報処理」なら「日本語」「情報処理」のように2つの単語に分かれてアンド検索されます。日本語の単語の分解は完全ではありません。

全角(2 bytes)アルファベット・記号はすべて 1 byteとして処理されます。記号を含む検索も可能でTCP/IPというような単語の検索も可能です。ただし、記号の処理は完全ではないのでTCP IPのように分けてアンド検索をかけた方が取りこぼしがありません(その代わり余計なファイルまでヒットしてしまう可能性もありますが)。

括弧を含めたアンド検索とオア検索およびノット検索が可能になっており検索式に & | ! ( )を用います。記号の代わりにand/or/notで指定することも可能です。検索式はひとつづつスペース区切りで入力しなければなりません。例えば

( sed | awk ) ! perl & regexp
または ( sed or awk ) not perl and regexpでも同じ
といった検索をすることができます。これは「sedまたはawkが含まれ、perlは含まれない、そしてregexpが含まれる」文書を検索するという意味になります。括弧のネストもできるので、さらに複雑な検索式で検索することも可能です。

既知の問題点

  1. 検索対象からリンクされているURLがディレクトリのみでファイルが明記されていなかった場合、wgetがindex.htmlを仮定してしまうので、サーバからエラー404が返って来ることがある。もし、エラー404が返って来た時のURLが“〜/index.html”だったら、“index.html”の部分だけを消してジャンプし直してみてください。wgetに、Content-Location:ヘッダを見させれば良いというこたぁ わかっとるんですが、Content-Location:ヘッダを返して来ないサーバも少なくないし…。
  2. ページが消滅しても、それを検出していない。(最近は、月に1度、全部が消滅したと仮定して、ページの存在確認を行うようにしています)。
  3. 既存のページの内容が書き変わっても、それがデータベースに反映されない。(なまずをバージョン・アップしただけで解決しました)。
  4. OS/2関連の情報を発信している人が、OS/2の情報だけ発信しているとは限らないので、時々、無関係なものも引っ掛かる。(ま、愛嬌ということで…)。
  5. マシンや電源の二重化といった安定性向上のための努力を一切していないので、不定期にサービスが止まるかも…。(けっこ、頻繁に、ハードがトラブるんだよなぁ、古いから)。

[Altair☆'s Page] Copyright (c) 1999-2002 by Altair☆
All rights reserved.