- ● 行番号の
< ** > と[ ** ] の違い- ● 大文字と小文字の区別
- ● 漢字コード/改行コード
- ● 全角英数記号
- ● 変換対象として想定しているドメイン名
[ HTML タグを認識させる ] チェックボックスが ON の時、 ログファイルに書き出される行番号のカッコには< ** > と[ ** ] の二種類があります。 前者はドメイン名が HTML タグ内に書かれていた場合(つまりハイパーリンク先)、 後者はタグ外に書かれていた場合(つまりブラウザでの表示)をあらわしています。例:
<a href="http://www. niftyserve.or.jp ">www. niftyserve.or.jp </a> は www. niftyserve.or.jp です。 ↑
< 123 >↑
[ 123 ]↑
[ 123 ]「とにかく無効な旧 .or.jp ドメイン名を一掃できればいい。」というのであれば、
< ** > と[ ** ] の違いを気にする必要はあまりありません。 (特に、変換対象が HTML ファイルでない場合。)このプログラムでは、以下のタグ内にドメイン名が書かれていた場合、行番号を
< ** > で出力します。
- <a href="...">
- <img src="...">
- <body background="...">
- <frame src="...">
- <iframe src="...">
- <link src="...">
- <embed src="...">
- <bgsound src="...">
- <meta url="...">
新ドメイン名への変換に際し、旧ドメイン名が大文字で書かれている場合は、大文字のまま変換します。 大文字・小文字が混在している場合は、小文字に統一して変換します。 (いずれも、domain.txt に記述されている範囲に限りますが。)
例:
変換前 変換後 domain.txt での記述 niftyserve.or.jp nifty.ne.jp 大文字のみ WWW.NIFTYSERVE.OR.JP WWW.NIFTY.NE.JP 大文字・小文字混在 Www.NiftyServe.Or.Jp Www.nifty.ne.jp 小文字のみ www.niftyserve.or.jp www.nifty.ne.jp
このプログラムは、対象ファイルの漢字コードが Shift JIS であることを前提として作られています。 「ドメイン名記述の直前・直後の 1 文字が必ず半角英数記号になっている」ことが分かっているならば、 JIS コードや EUC コードでも問題なく変換操作が行なえるはずですが、 極力 Shift JIS にしておく事をお勧めします。
(メモ帳で対象ファイルを開いた時、文字化けが起こらず、普通に日本語文字が読める状態ならば、 既にそのファイルは Shift JIS になっています。)
→ 参考リンク: QKC Home Page改行コードに関しては、 ラインフィードが現れるたびに行番号をインクリメント(加算)していますので、 Macintosh 形式の場合、ログファイルに書き出される行番号に異常が出ます。 (ログの表示がおかしくなるだけで、ファイルの書き換えそのものは正常に行なわれます。)
このプログラムが対応できるのは、半角英数記号で書かれたドメイン名のみです。 (ただし、Shift JIS で書かれた全角英数記号については、将来のバージョンで対応するかも知れません。)
このプログラムが変換対象として想定しているのは、基本的に POP3 サーバと WWW (HTTP) サーバの ドメイン名のみです。 (つまり「メールアドレス」と「ホームページアドレス」にのみ対応しています。)
SMTP、News (NNTP)、Proxy、FTP、Telnet 等のサーバドメイン名を変換した場合、 ドメイン名によってはそれらが正しく変換されない可能性がありますので、 プロバイダ等から配布されている文書と変換結果を照らし合わせ、 変換結果が正しいかどうか手動で確認していただけるようお願いします。 特に、旧 meshnet ドメインを扱う際には注意してください。