更新: 2005-10-23
BTONIC辞書をテキスト化するRubyスクリプトです。
『音声付き CD-ROM クラウン仏和辞典、コンサイス和仏辞典』でしか試していませんが、他のBTONIC辞書にも使えるはずです。
出力されるのはxmlファイルで、EPWING辞書に変換するには、辞書ごとに変換スクリプトなどを作成する必要があります。
BTONIC2xml.rb | スクリプト本体 |
btonic.txt | 辞書ファイルの構造の説明 |
BTONICdump.rb | (参考) 辞書ファイルの各セグメントの先頭部分をダンプするスクリプト |
CrownFRdump.txt | (参考) クラウン仏和辞典ファイルのダンプ |
ConcJFdump.txt | (参考) コンサイス和仏辞典ファイルのダンプ |
btonic2xml.html | 使用説明書(このファイル) |
★ 辞書CD-ROMから直接変換することはできません。
BTONIC辞書をインストールして辞書ファイル(.exi)を取り出しておく必要があります。
★ 処理にはかなり時間がかかります。
Pentium 4 2.8GHz でクラウン仏和辞典の処理に約20分かかりました。
ruby -Ks BTONIC2xml.rb <dicName> [<outDir>] <dicName> 辞書ファイル名 (.exi) <outDir> 出力ディレクトリ (指定なしならカレントディレクトリ)
手順はWindows XP Home Editionの場合です。ほかのOSでは適宜読み替えてください。
ダウンロード後、適当な場所にアーカイブを展開します。ここでは「D:\work」に展開したものとします。
コマンドラインを開きます(スタートメニューから[すべてのプログラム]、[アクセサリ]、[コマンド プロンプト])。
ファイルの出力先が「E:\btonic」で、クラウン仏和辞典を標準の場所にインストールしているとすると、次のように入力します。ファイル名の入力は、エクスプローラからファイルをコマンドラインにドロップする方法が簡単です。
ruby -Ks D:\work\BTONIC2xml.rb "C:\Program Files\SANSEIDO BTONIC Viewer\CrownFR\CrownFR.exi" E:\btonic
E:\btonicにxmlファイルが出力されます。xmlファイルの名前と数は辞書ごとに異なります。
クラウン仏和辞典の場合
653 CrownFR_cr.xml 著作権 84,921,694 CrownFR.xml 辞書本体 261,107 CrownFRKisoku.xml 規則変化表 715,210 CrownFRFukisoku.xml 不規則変化表 10,674 CrownFR_hanrei.xml 凡例
コンサイス和仏辞典の場合
654 ConcJF_cr.xml 著作権 62,733,405 ConcJF.xml 辞書本体 10,294 ConcJF_hanrei.xml 凡例
スクリプトはOSやRubyのバージョンによっては不具合があるかもしれません。その場合は御連絡ください。できるだけ対処します。
質問・要望などは、EBシリーズ・サポート掲示板にお願いします(hishidaさんのご好意で間借りさせてもらっています)。
スクリプトをこう変えると見やすくなるよ、といったご指摘は大歓迎です。まだRubyは手探りの状態なので、突っ込みどころは多いと思います。ただ、こういった開発系の話題は、EBシリーズ・サポート掲示板にはそぐわないと思いますので、当面はメールがいいかもしれません。
v1.00 2005-03-06 by nomad
公開
v1.10 2005-10-23 by nomad
ルートの複数ディレクトリに対応 (有斐閣法律学小辞典)
作成: 2005-03-06