日本のOS/2検索

個人でOS/2関連の情報を掲載している日本国内の人々のwebページを対象とした検索エンジンです。

OS/2関連の情報をサーチする時、キーワードに「OS/2」と指定しても、OS/2に無関係なページが数多くひっかかって来て、やんなっちゃったことがありました。

だったら、OS/2な人々のページしかスキャンしないOS/2専用ロボット型検索エンジンを自分で作っちまえっと思い立ち、wgetとnamazuで構成してみました。思い付きでやってみてるだけなので、将来に於てもサービスを続ける保証はありません。(^^;

検索対象ページの選択基準

2002年12月 8日より、WebChain/2に登録されているOS/2関連のページを検索対象としています。

検索式の書き方

大文字、小文字の区別はありません。foo*のように末尾にアスタリスクを指定することで前方一致検索が可能です。また、単語をスペース区切りで並べて書くとアンド検索になります。日本語はkakasiによって分解され、「日本語情報処理」なら「日本語」「情報処理」のように2つの単語に分かれてアンド検索されます。日本語の単語の分解は完全ではありません。

全角(2 bytes)アルファベット・記号はすべて 1 byteとして処理されます。記号を含む検索も可能でTCP/IPというような単語の検索も可能です。ただし、記号の処理は完全ではないのでTCP IPのように分けてアンド検索をかけた方が取りこぼしがありません(その代わり余計なファイルまでヒットしてしまう可能性もありますが)。

括弧を含めたアンド検索とオア検索およびノット検索が可能になっており検索式に & | ! ( )を用います。記号の代わりにand/or/notで指定することも可能です。検索式はひとつづつスペース区切りで入力しなければなりません。例えば

( sed | awk ) ! perl & regexp
または ( sed or awk ) not perl and regexpでも同じ

といった検索をすることができます。これは「sedまたはawkが含まれ、perlは含まれない、そしてregexpが含まれる」文書を検索するという意味になります。括弧のネストもできるので、さらに複雑な検索式で検索することも可能です。

日本のOS/2検索

日本のOS/2検索とは…

検索対象ページの選択基準

検索式の書き方

既知の問題点