ひなこ辞書3

 英語はアルクの辞書を編集したので何とかなった。というか立派なものができた。
 しかしながらそれ以外の言語をどうするか。
 もともと「ひなこ辞書」「ひなこのーと」はフランス語を勉強する過程で多読をするために作ったのだ。いちいち辞書を引いていては、職業のある身としてはとても多読なんてできない。文章を入れれば、全単語について自動で辞書を引かせよう。

 英語辞書が妙に充実したので、それ以外をどうするかという問題が再度クローズアップされたわけだ。「とりあえずあれば良し」だったはずなのだが贅沢というか進歩というか。
 当面、フランス語もドイツ語もレベルアップする気がないので、ほっといてもいいといえばいいのだが「おもしろくない」。

 実はフランス語は2万語程度の辞書ができていて、特に不自由はしていないのだが、ドイツ語がないのは面白くない。うちの子がロシア語を勉強しているのでその辺も何とかしたい。ちなみに妙なところで私に似ているので、優秀な学生が集まることになっている大学祭でボルシチを売っていたロシア語サークルにロシア語でお礼を言ったら、反応がなかった(それは優良物件を漁りに来た他校の女子学生だよ)とか、反応が見当外れだった(ロシア正教を重視していないキリスト教系の大学だからだよ)とかで文句を言っている。
 翻訳サイトのおかげでずいぶん楽しているようだが、ファンのロシア人アスリートに声をかけたい!というのが勉強のモチベーションになっているようだ。(選手のSNSにロシア語でコメント付けたらレスポンスがあったのは感動だったみたい。「普通は定型のレスなのにロシア語で書いたら違うのが返ってきたんだよ」と大喜びだった。)

 そこで、多言語辞書を提供しているサイトから「何語だろうと訳が取れる」というRPAツールを作ることとした。候補はdict.com、とglosbe.com。訳語がシンプルなのでdict.comで作ったが、ところが数分のうちにRPAがばれてしまうのだな。「私はロボットではありません」チェックボックスと消火器その他の画像が出る。せっかく動くところまで作りこんだのに連続稼働させるとすぐに止まってしまった。そこでglosbe.com用に改修。苦労についてはいちいち書くまい。こっちはしばらくの間動いてくれた。自宅の環境で25〜30分連続。これなら「ポモドーロテクニック」のタイマーとして使える。わるくはないぜい。

 そこで、ドイツ語で単語を引く対象とする一覧。例によってOpenOfficeのスペルチェック辞書からとってきたのだが、glosbeとの相性は最悪。元々アメリカ人が作ったサイトだからか「大文字から始まるのは名詞」というドイツ語の基本ルールにすら対処してない。外来語は普通に英語だし。(キリル文字のロシア語を押しのけるようにラテン文字のアルファベットが並ぶさまは異様ですらある。)
 スペルチェック辞書の方も大概で、動詞の過去形、過去分詞、ご丁寧にzu不定詞まで辞書に載せてくださっている。複合名詞はもちろんだ。結果、検索した単語の8割くらいが「単語が見つかりません」ではねられる。ムダなことこの上ない。
 検索時間がバカにならないのは当然としても、30分弱の周期だと分かっているとはいえ、横に張り付いてなければならないというのはたいしたことのない制限と言い切るには抵抗がある。(ラグビーワールドカップを真似て止まる時に「ゴーン」という音を鳴らすようにしたが家人には不評である。)

 何とかならんかと思いながら見ていたら、どうやら意味を表示するほかのエリアに検索した単語のアルファベット前後の単語が出てくるみたいだ、ということで、最初の語を指定してそのウィンドウに出てくる単語を拾い、全部拾い終えたら一番下の単語を検索してまた一覧を見る、そこまで単純ではないが似たような方式で単語一覧が取れそうなことが分かった。
 スペルチェック辞書をつかわずとも、この方式で単語一覧を取得すれば「なんとかできそう」。
 しかしやたらめったら理系の専門用語が多いね。とくにコンピュータ用語。これはドイツ語でも感じたけど。
 あとキリスト教関係。例文として聖書を丸抱えしているように思われる部分もある。

 結局、Glosbeで用意されている単語を一覧にするだけでなく、意味も引くように修正した。非常にまずい。今までは語彙はあっち、意味はこっち、時々自分で辞書引いて、品詞はこの表に沿って変更、というふうに、ある程度自身の編集著作権を主張できないことはなかったのだが、これだとGlosbeへの依存度が、いくらなんでも高すぎる。(品詞名は編集するが。)個人で使うにはいいが、、、まあ自分の子供の勉強用だ。パパの辞書を貸しても誰も文句は言うまい。

 RPAって簡単なんだ、簡単。うん、現物合わせの試行錯誤をいとわなければ。
 あと、webページ移行のタイミングをはかるのがうまく行けば。(なぜ語が重複するか、どういうバグかとても悩んだ。結局、制御をOSに戻して、ちょっとウェイトを入れて、で回避した。)

フリーソフト開発秘話、目次
ホーム