日本のOS/2検索 | Supported by Altair☆<NBG01720@nifty.ne.jp> |
個人でOS/2関連の情報を掲載している日本国内の人々のwebページを対象とした検索エンジンです。
OS/2関連の情報をサーチする時、キーワードに「OS/2」と指定しても、OS/2に無関係なページが数多くひっかかって来て、やんなっちゃったことがありました。
だったら、OS/2な人々のページしかスキャンしないOS/2専用ロボット型検索エンジンを自分で作っちまえっと思い立ち、wgetとnamazuで構成してみました。思い付きでやってみてるだけなので、将来に於てもサービスを続ける保証はありません。(^^;
2002年12月 8日より、WebChain/2に登録されているOS/2関連のページを検索対象としています。
検索そのものはnamazuとkakasiの機能を流用しています。
以下にnamazuの説明書を引用しておきます。
大文字、小文字の区別はありません。foo*
のように末尾にアスタリスクを指定することで前方一致検索が可能です。また、単語をスペース区切りで並べて書くとアンド検索になります。日本語はkakasiによって分解され、「日本語情報処理
」なら「日本語
」「情報処理
」のように2つの単語に分かれてアンド検索されます。日本語の単語の分解は完全ではありません。
全角(2 bytes)アルファベット・記号はすべて 1 byteとして処理されます。記号を含む検索も可能でTCP/IP
というような単語の検索も可能です。ただし、記号の処理は完全ではないのでTCP IP
のように分けてアンド検索をかけた方が取りこぼしがありません(その代わり余計なファイルまでヒットしてしまう可能性もありますが)。
括弧を含めたアンド検索とオア検索およびノット検索が可能になっており検索式に & | ! ( )
を用います。記号の代わりにand
/or
/not
で指定することも可能です。検索式はひとつづつスペース区切りで入力しなければなりません。例えば
といった検索をすることができます。これは「( sed | awk ) ! perl & regexp
または( sed or awk ) not perl and regexp
でも同じ
sed
またはawk
が含まれ、perl
は含まれない、そしてregexp
が含まれる」文書を検索するという意味になります。括弧のネストもできるので、さらに複雑な検索式で検索することも可能です。
Copyright (c) 1999-2002 by Altair☆ All rights reserved. |