OED2txt.rb 使用説明書

更新: 2005-10-18


●はじめに

OED2txt.rb v1.10

Oxford English Dictionary CD-ROM v3.0x および v3.1 の辞書データをテキスト化するRubyスクリプトです。

現在対応している CD-ROM のバージョンは次のとおりです。他のバージョンではおそらく変換できません。

出力されるのはテキストファイルで、EPWING辞書に変換するには、変換スクリプトなどを作成する必要があります。

●圧縮ファイルの内容

OED2txt.rbスクリプト本体
datafile.rbライブラリ
oed2txt-os2.exe変換プログラム(OS/2用)
oed2txt-win.exe変換プログラム(Windows用)
oedhtm.txt出力ファイルの簡単な説明
oed2txt.html使用説明書(このファイル)
misc/(参考になるかもしれないもの)
misc/oeddata.txtデータ構造などの簡単な説明
misc/entry.rb項目一覧処理スクリプト
misc/docdb.rb項目処理スクリプト
misc/ddd.rb.dddファイル処理スクリプト
misc/oed2txt.pas*.exeのVirtual Pascalソース

●テキスト化に必要なもの

  1. Ruby

やろうと思えば、Rubyなしで、.exeファイルを直接実行することもできます。使い方はoed2txt.pasを参照してください。

●動作確認

●注意

WindowsまたはOS/2で実行した場合は数分で処理が済みますが、それ以外のOSの場合は、かなり時間がかかります(Celeron 1.1GHzで約2時間)。これはWindowsまたはOS/2の場合は実行形式ファイル(.exe)を起動して変換しているのに対し、それ以外のOSではスクリプト本体で変換するためです。

●構文

ruby -Ks oed2txt.rb <inDir> [<outDir>]
  <inDir>   辞書ファイル(.htm)のあるディレクトリ
  <outDir>  出力ディレクトリ (指定なしならカレントディレクトリ)

●説明の前提

  1. 辞書本体とRubyは入手して導入が済んでいるものとします。
  2. 手順はWindows XP Home Editionの場合です。ほかのOSでは適宜読み替えてください。

●テキスト化手順

CD-ROMから直接変換することもできます。その場合は、.htmファイルがInstallation DiscとData Discにわかれているため、それぞれのCD-ROMに対して上記と同様にスクリプトを実行してください。

●質問・要望など

スクリプトはOSやRubyのバージョンによっては不具合があるかもしれません。その場合は御連絡ください。できるだけ対処します。

質問・要望などは、EBシリーズ・サポート掲示板にお願いします(hishidaさんのご好意で間借りさせてもらっています)。

スクリプトをこう変えると見やすくなるよ、といったご指摘は大歓迎です。まだRubyは手探りの状態なので、突っ込みどころは多いと思います。ただ、こういった開発系の話題は、EBシリーズ・サポート掲示板にはそぐわないと思いますので、当面はメールがいいかもしれません。

●謝辞

まずなによりもストームさんに感謝します。OEDのテキスト化に取り組むきっかけをつくってくれたのは、EBシリーズ・サポート掲示板でのストームさんの次の投稿でした。

記事No  : 1560   [関連記事]
投稿日  : 2004/03/06(Sat) 02:39
投稿者  : ストーム
E-Mail  :
題 名  : OED(Oxford English Dictionary)

データの解析にあたっても、ストームさんが苦労して解析された結果が非常に参考になりました。ただ暗号の解読は一筋縄ではいかず、おかげでスクリプトの完成までに1年以上もかかってしまいましたが。

OED v3.01への対応にあたってはohtaさんのご協力をいただきました。ありがとうございました。

●履歴


作成: 2005-08-21

http://hp.vector.co.jp/authors/VA005784/oed/oed2txt.html
Copyright (C) 2003 NOMAD. All Rights Reserved.
mailto:TBE00506@nifty.com