ひなこ辞書2

 以前作った「ひなこのーと」というソフト、英語の予習として教科書の英文をテキストファイルに落とし込んで(最近はスマホで文面を撮影すると、OCRでテキストに落としてくれるのね)、それを読み込ませると、構成する語に分割して、各単語の意味を辞書で調べ、ワークシートに「フリガナ」「品詞」「意味」を表示してくれるという超スグレモノであった。翻訳ソフトではないから品詞や意味は提示されたものを見て各自が選ぶ必要がある。品詞はダブルクリックで変更してゆき、意味はプルダウンから選ぶ。翻訳ソフトが当たり前になっている現代としてはしょぼい機能ではないか、などと言いたいかもしれないが、これが割と効果がある。一応自分の頭で考えるからである。単語が並べば、文意もぼんやりと浮かんでくる。カタカナでフリガナを振っているので、一応読める。なによりいいのは結果として「単語の意味だけで分かること」と「それだけではわからないこと(文法事項や表現)」が自分の中で区別できることだ。これって予習としてとってもいいことをやっているのではなくって?学校で何を聞いてくればいいか、がわかってから、授業に臨めるわけだ。
(予習ってこういうことだったんだよ。辞書引いて終わりではない。辞書引くのは紙はもちろん、電子辞書でもそこそこ面倒なことだから引いて、転記したところで汗かいたから終わりにしたくなる。「文を理解するためには、学校で何を聴いてくればよいか」これが分かるようになるのが予習だろう。)

 ところが、このソフトは「辞書」を必要とする。そのために作ったのが「ひなこじしょ」。Firefoxのスペルチェック辞書を元に、そこにある単語を、英辞郎のWebにアクセスして意味をとってきてまとめるという機能を持っている。しかしいちいちWebに問い合わせをするので、RPAで自動化しているとはいえ、合計一か月というたいへんな作業が必要であった。
 つまり「ひなこのーと」を使うには、著作権の関係から、皆さん自分でこの作業を行って辞書をつくらなければならない。「普通やらんだろ」である。自分でも二度とやりたくない。

 なので、このソフトは公開しても普及すまい、と思っていた。ところが、あとで知ったのだが、英辞郎の辞書のテキスト版、売ってたのね。(ダウンロードは終了しましたと言っていたのに。)確かに2015年からアップデートされてないが十分でしょ。しかも安い!450+税である。
 内心、あんだけ苦労したのに・・・という忸怩たる思いはあったが、だからといって行動を止めるようなつまらないプライドは持ち合わせていない。使えるならそれでいい。というわけで、変換ソフトを作った。これが「ひなこ辞書」の第2版である。

 テキストからの取り込みだと、動かしてみて、もーすこしここをこんなにしたいなあ→改良、がしやすいので(RPAだと悪夢だ)、機能としてはかなりのものになった。
 辞書に複数形は一部を除いて入っていないので、規則に従った複数形を仮に作る。すでに辞書にある複数形とダブってないことを確認するのはもちろんだが、それらについてMicrosoftOfficeのスペルチェックをかけて、エラーとなるとその行は削除する機能を加える。これで"mouse"の複数形として"mouses"を作りはするが、スペルチェックではねられるので完成版の辞書には残らない。

 スペルチェックでエラーになるとその行を削除する、というのは(自分でつくっていてなんだが)気に入った。
 英辞郎のテキストデータから抽出した単語の数、複合語や熟語を省いているとはいえ27万語を超えている。多すぎて取り回しが悪い。なら元の辞書から使用頻度の低い語を省くのにもいいんじゃなかろうか。(というかそうしている。所詮は自称進学校の英語。)

 本体の「ひなこのーと」も改良した。自分以外使わないだろう、ということで不具合があっても適当にいなしていた。そもそもあまりの負荷のせいでしょう、Microsoft Excelが回復不可能になることが恒常的に発生していたので、使うには細心の注意が必要だったのだ。
 しかし「ほかの人が使うかもしれない」となると話は別ですわ。負荷軽減の対策を取った。直し始めると、ユーザーに甘えないのが私。たとえば辞書の調整結果(アルファベットの文字でインデックスを持つが、結局は前方優先。つまり頻度の高いものを前に持ってくるという調整が使っているうちに必要になってくる)が語の追加(ソートかけなおして、インデックス再作成が必要)で失われないように、、、大変なのよ。同じスペルで違う意味の語が当たり前に並ぶものだから、辞書検索に二分探索法が使えなくてさ。

 MS-Excelのふがいなさでコードが消えるのを防ぐため、いろいろ必要になりました。あ、それと前回不完全だった「印刷のためにMS-Wordに書き出す機能」一応満足のゆくものができました。ただしこれをどのブックに持たせるか、というのは難しくて。当面の間自分専用になりそうです。

フリーソフト開発秘話、目次
ホーム