更新: 2004-02-16
朝日出版社の『asahi press SENTENCE』のデータを変換して、EBStudio用の入力ファイルを作成するRubyスクリプトです。独自形式辞書からEPWING辞書に変換できます。
手順はWindows98の場合です。ほかのOSでは適宜読み替えてください。
ただし作者はOS/2 Warpでしか変換スクリプトの動作を確認していません。
基本的に「増量データのみの変換手順」だけを実行すればよいのですが、v1.00ではわたしのミスで『アメリカ口語辞典』の日本語見出しが前方一致、後方一致索引に登録されていませんでした。この点が気になるかたは「辞書全体の変換手順」を実行してください
v1.20から増量データはすべて1書籍としてまとめるように変更しました。作成済みのEPWING辞書のCNNディレクトリは削除してください。残してもディスクの無駄です。
ダウンロード後、適当な場所にアーカイブを展開します。ここでは「D:\work」に展開したものとします。
コマンドライン(MS-DOSプロンプト)を開きます。SENTENCEのインストール先が「C:\Program Files\Asahi Press SENTENCE」、出力先が「E:\EPWING\asahi」とすると、次のように入力します。
ruby -Ks AsahiConv.rb "C:\Program Files\Asahi Press SENTENCE" E:\EPWING\asahi
6つの辞書をまとめて1つの書籍にする場合、または個別の書籍にする場合は、次のようにオプションとして「-single」または「-each」を指定します。
ruby -Ks AsahiConv.rb -single "C:\Program Files\Asahi Press SENTENCE" E:\EPWING\asahi
E:\EPWING\asahiに以下のファイルが出力されます。増量データがあれば、それも出力されます。
『最新日米口語辞典』の「おくのて」の項目は元データの編集ミスから英語見出しが指定されていません。出力されたWaei3.htmlをエディタで開いて、次の部分を手作業で編集してください(ファイル名は、-single指定時はAsahiAll.html、-each指定時はHyou.htmlになります)。
この作業は行わなくてもたいした影響はありません。
<dt id="15389"><b>おくのて[奥の手]</b></dt> <dd><dfn><b></b></dfn> 『最新日米口語辞典』<br> 奥の手an ace in the holea trump cardでもよい。... ↓ <dt id="15389"><b>おくのて[奥の手]</b></dt> <dd><dfn><b>an ace in the hole</b></dfn> 『最新日米口語辞典』<br> a trump cardでもよい。...
まず基本データを処理します。
E:\EPWING\asahiにあるasahi.ebsファイル(またはasahiSingle.ebs、asahiEach.ebs)を使用してEBStudioを実行します。
出力先などを必要に応じて修正したあと、辞書の作成処理を実行します([ファイル]>[実行]またはツールバーの実行ボタン)。
増量データがある場合は、引き続き増量データを処理します。使用するebsファイルはasahiUpdate.ebsです。
出力先は基本データとは別のディレクトリにします。すでに「E:\EPWING\AsahiEx」のようになっているはずですので必要に応じて修正してください。同じディレクトリにすると基本データ用のカタログが書き換えられてしまいます。
辞書の作成処理を実行します。
★注意★ EBStudioでの変換時にエラーメッセージが出た場合は、[OK]をクリックしてください。辞書自体はひとまず正しく作成されます。
以上で完了です。
ダウンロード後、適当な場所にアーカイブを展開します。ここでは「D:\work」に展開したものとします。
コマンドライン(MS-DOSプロンプト)を開きます。SENTENCEのインストール先が「C:\Program Files\Asahi Press SENTENCE」、出力先が「E:\EPWING\asahiEx」とすると、次のように「-update」を指定して実行します。
ruby -Ks AsahiConv.rb -update "C:\Program Files\Asahi Press SENTENCE" E:\EPWING\asahiEx
E:\EPWING\asahiExに以下のファイルが出力されます。
E:\EPWING\asahiExにあるAsahiUpdate.ebsを使用してEBStudioを起動します。
出力先などを必要に応じて修正します。出力先は基本データとは別のディレクトリにしてください。同じディレクトリにすると基本データ用のカタログが書き換えられてしまいます。
辞書の作成処理を実行します([ファイル]>[実行]またはツールバーの実行ボタン)。
★注意★ EBStudioでの変換時にエラーメッセージが出た場合は、[OK]をクリックしてください。辞書自体はひとまず正しく作成されます。
以上で完了です。
現バージョンでは第4回増量データまでにしか正式対応していませんが、以降の増量データで新しい種類が追加されても、種類名が「その他」になるだけで、検索自体は問題なくおこなえるはずです。
日本語見出しと日本語例文は、前方一致、後方一致、クロス検索(2文字以上の漢字・カタカナのみ)の索引が作成されます。
英語見出しと英語例文は、前方一致、後方一致、クロス検索の索引が作成されます。
見出し語内や例文内の単語を検索する場合は、クロス検索を使用してください。
変換スクリプトはOSやRubyのバージョンによっては不具合があるかもしれません。その場合は御連絡ください。できるだけ対処します。
質問・要望などは、EBシリーズ・サポート掲示板にお願いします(hishidaさんのご好意で間借りさせてもらっています)。
スクリプトをこう変えると見やすくなるよ、といったご指摘は大歓迎です。まだRubyは手探りの状態なので、突っ込みどころは多いと思います。ただ、こういった開発系の話題は、EBシリーズ・サポート掲示板にはそぐわないと思いますので、当面はメールでお願いします。
v1.00 2003-02-12 by nomad
公開
v1.10 2003-02-22 by nomad
増量データに対応
-singleなどをオプションで指定可能に
英日の日本語見出しを<dfn>に
AsahiLib.rbを分離、など
v1.20 2003-08-07 by nomad
第3回増量データに対応
増量データは常にまとめて 1 書籍にするよう変更
「CNN重要表現集」の種類を和英に訂正
増量データの見出しIDに接頭辞追加、など
v1.21 2004-01-11 by nomad
ruby 1.8でエラーになるのを修正 (AsahiLib.rb)
v1.30 2004-02-16 by nomad
第4回増量データに対応
作成: 2003-02-10