zen2han は全角英数字 から半角英数字への変換, 半角カタカナから全角カタカナへの変換, カタカナの長音記号「ー」とマイナス記号「−」の推論訂正は, 内 部で行いますが, その他の全角文字の変換の定義は「全角変換定義 ファイル」と呼ばれるファイルに記述します(デフォルトのファイ ル名は ``zen2han.def'')。
この定義ファイルの書き方は, 基本的には
/from/to/のように全角文字と文字列を / (スラッシュ) で区切って記述 します。zen2han では from と一致する全角文字を見つけた時に from を to に変換します。この時,
である必要があります。 to を 記述しなかった場合には from を 削除する事になります。例えば PC98○1 特有の○の中に数字が入ったコードは ではエラーになりますので,
/(1)//
のように記述した場合は○の中に 1 と入っているコードを見つけるとその
コードを削除します。また, この記述は, 必ず先頭カラムから記述して下さい。
先頭に空白を空けないで下さい。
もし, to に /(スラッシュ) を含ませたい場合はセパレータを + にして下さい。例えば, 全角のスラッシュを半角のスラッシュに変換す る場合には以下のように記述します。
+/+/+
これを
/////
と記述するのは間違いです。/ も + も to に含
めたい場合には !,
"
, %
, &
, *
, -
等の記号をセ
パレータに使用して下さい。
もう少し正確に記述すると, UNIX(EUCの場合)の場合はセパレータが from にも to にも現れなければ, どんな文字(ASCII-CODE)を使用してもかまい ません。zen2han は先頭の 1バイト目をセパレータ文字と認識します。 MS-DOS(SHIFT-JIS) の場合は 2バイトコードの 2バイト目のコードが ASCII-CODE と同じになる可能性がありますので, 0x40未満のコードである必要 があります。取り合えず, 意味が分からない場合は上に示したコードを使用して 下さい。
先頭カラムが #
で始まる行はコメント行として処理しますので, 自由に
注釈等を記述する事が出来ます。
また, この定義ファイルはサンプルなので, の事を考慮した変換は行っ ていません。
例えば, 漢字の「Σ」や「∫」を数式モードの や に変換するように
というような記述をしておくのも場合によっては便利かもしれません。また, ○ の中に数字の入った文字も/Σ/$\displaystyle\sum$/
/∫/$\displaystyle\int$/
/(1)/\○\llap{1}/
のような記述をしておくと, でコンパイルし
た時にそれなりに表示されます。