でタイプセットしていると, テキストで頂いたファイルを ファイル
用にマークアップする必要が生じたりワープロで作成した文書をテキストファイ
ルに変換(あるいは保存)したものを ファイル用にマークアップする必要が
生じる場合があります。
テキストファイルに のコマンドをマークアップする処理は, それほど大変
な作業ではありませんが, マークアップしていてうんざりすることは
- 英数字に全角文字を用いているケースが多々ある。(例えば 「This is a
pen.」を「This is a pen.」としている等)
- 半角カタカナを用いている。( ではエラーになります。)
- JIS の規格外の漢字コードを使用している。(某社特有の罫線コードや○
の中に数字が入った文字等)
- カタカナの長音記号(ー)とマイナス記号(−)を誤って使用している場合
が結構ある。
といった誤りが結構あるということです。このような誤り(必ずしも誤りとは言
えないかもしれませんが)をいちいち手で直す事に嫌気がさして
- 全角英数字を半角英数字に変換
- 半角カタカナを全角カタカナに変換
- 長音記号(ー)とマイナス記号(−)の使用誤りを検出して自動訂正(100%
とはいえませんが)
等の処理を行うツールを UNIX 上で作成していました。今回は UNIX で動作して
いたツールを MS-DOS(WIN32, djgpp) で動作するように修正しました。また, 機
能の一部を拡張して全角文字の変換テーブルを外部ファイルに持たせる事によっ
て, ある程度柔軟な変換を行えるようにしました(例えば○の中に数字の入った
文字を のマクロに置き換える事も可能です)。