更新: 2004-02-04
Longman Dictionary of Contemporary EnglishのNew Edition(第4版、LDOCE4)に付属するCD-ROM辞書のデータを変換して、EBStudio用の入力ファイルを作成するRubyスクリプトです。独自形式辞書からEPWING辞書に変換できます。
LDOCE4Conv.rb | 変換スクリプト |
LDOCE4Gaiji.xml | 外字フォントファイル |
LDOCE4GaijiMap.xml | 外字定義ファイル |
ldoce4/*.rb | 変換スクリプト用ライブラリ |
zlib.dll | zlib DLL(Windows用) |
ldoce4conv.html | 使用説明書(このファイル) |
Rubyはバージョン1.8を使用してください。
1.6だと必要なライブラリ(Ruby/zlibとrexml)を別途入手する必要があります。
1.8 だと標準で付属しているため手間がかかりません。
Windowsの場合は、mswin32版が一番手間がかからないようです。
★ CD-ROMから直接変換することはできません。
必ずLDOCE4をインストールしておく必要があります。
★ 変換処理にはとんでもなく時間がかかります。
Celeron 400MHz、メモリ 128MB、Windows98という条件で約10時間30分でした。
また出力ファイルはテキストと画像をあわせて約270MBになります。
ruby -Ks LDOCEConv.rb [option] homeDir [outDir, [drive]] option -[A|B|C|D] 出力する辞書 (指定なしなら -ABCD、つまりすべて出力) -A Activator -B Bank (例文・慣用句) -C Collocation (連語) -D Dictionary (辞書本体) homeDir Longman 4 をインストールしたディレクトリ outDir 出力ディレクトリ (指定なしならカレントディレクトリ) drive CD-ROM ドライブ (指定なしなら D:、Minimal インストール時に必要)
手順はWindows98の場合です。ほかのOSでは適宜読み替えてください。
ダウンロード後、適当な場所にアーカイブを展開します。ここでは「D:\work」に展開したものとします。
アーカイブ内にあるzlib.dllをruby.exeのあるディレクトリに移動します。
コマンドライン(MS-DOSプロンプト)を開きます。
LDOCE4のインストール先ディレクトリを「D:\LDOCE4」、ファイルの出力先を 「E:\EPWING\LDOCE4」とすると、
次のように入力します。
ruby -Ks D:\work\LDOCE4Conv.rb D:\LDOCE4 E:\EPWING\LDOCE4
LDOCE4のCD-ROMをCD-ROMドライブに挿入します。
ソフトが自動的に立ち上がった場合は、キャンセルしてください。
CD-ROMドライブのドライブ名が「X:」とすると次のように入力します。
ruby -Ks D:\work\LDOCE4Conv.rb D:\LDOCE4 E:\EPWING\LDOCE4 X:
CD-ROMドライブのドライブ名がD:の場合は指定しなくてもかまいません。
EBStudioを起動し、出力されたLDOCE4.ebsを開きます。
(LDOCE4.ebsをドラッグして[書籍]欄にドロップするのが一番簡単です)
出力先などを必要に応じて修正します。
辞書の作成処理を実行します([ファイル]>[実行]またはツールバーの実行ボタン)。
以上で完了です。
zlib関係でエラーが出る場合、mswin32版Rubyだと、lib\ruby\1.8\i386-mswin32にあるzlib.soをruby.exeと同じディレクトリにコピーすると、うまくいくことがあるようです。
次の4つの書籍を作成します。
辞書の各項目は、見出し語、Menu、Word origin、本文、Usage noteの順に出力します。
画像は該当する語義の直前に表示され、画像がクリッカブルマップになっている場合は、リンク項目が参照先として出力されます。
発音、Verb form、Word setには対応していません。
先頭が "-" の例文はExtra dictionary examples、
先頭が "=" の例文はSentences from books, newspapers, etc.のものです。
作成する索引は次のとおりです。
ただし前方一致索引以外を作成するには、EBStudio のライセンスを取得する必要があります(1000円)。
変換スクリプトはOSやRubyのバージョンによっては不具合があるかもしれません。その場合は御連絡ください。できるだけ対処します。
質問・要望などは、メールではなくEBシリーズ・サポート掲示板にお願いします(hishidaさんのご好意で間借りさせてもらっています)。
スクリプトをこう変えると見やすくなるよ、といったご指摘は大歓迎です。まだRubyは手探りの状態なので、突っ込みどころは多いと思います。ただ、こういった開発系の話題は、EBシリーズ・サポート掲示板にはそぐわないと思いますので、当面はメールがいいかもしれません。
v1.00 2003-11-20 by nomad
公開
v1.01 2003-12-04 by nomad
Phrase BankとExamples Bankの項目がない見出し語、約1万1000件が出力されない大バグを修正
v1.02 2003-12-04 by nomad
title="..." にタグが含まれるとEBStudioが落ちるのに対応 (dic.rb)
v1.03 2004-02-04 by nomad
bank.htmlに余計な見出しが出力されていたのを修正 (v1.01で混入)
作成: 2003-11-20