戻る 資料/更新履歴/御意見板

わたくしの仕事環境――収入を度外視したSOHO例。(第六回)
白石昇


●業務内容その参。

 さて辞書を引かずにすむ方法、まあそれは当たり前のことなのですが辞書内容のデジタル化です。コンピュータというものは記憶演算出力入力しか出来ないのですから、一回辞書を引く毎にそれをデーターベースに入力し、記憶させちゃえばいいのです。

 記憶させておけば欲しいデータを入力して検索し、記憶しているところから引っぱり出して出力させればもう二度と辞書を引く必要はないわけです。この点に関してはコンピュータというものはそれはもう文句もいわずにやってくれますサクリと。だから、そうなっちゃったらわたくしがいちいち単語を記憶しなくても大丈夫なのです。嬉しいなあ。

 さて、大丈夫になって嬉しくなったところで、前回お約束した緬国にて購入してきた西瓜石鹸と胡瓜石鹸のプレゼントです。欲しい方は、件名を「てんもおまくわて」としたメールをoboru@geocities.co.jpまで送って下さい。住所氏名も忘れないで下さい。

 当然選に漏れた方の個人情報は速やかに破棄します。そして締め切りはこれが掲載されたデジクリが配信されてから最初の午前零時までとします。あ、ちなみに日本時間です。あわててタイ時間を探ったりしなくてもいいです。お風呂場でグレゴールザムザ的昆虫気分を味わいたい方はふるってご応募下さい。

 さて、業務連絡が終わったところでひとつ重大なことを思い出しました。

(たくさんのご応募、誠に有り難うございました。)

 あのですね。コンピュータというものはアメリカで開発され、アメリカで発達したものなんですよ。これ重要です。凄く重要です。だから、そこで使われる文字はいわゆる英文字なのです。これ基本です。凄く基本です。

 だからどこの国のコンピュータでも英文字が表示できないコンピュータというものはまずありません。だって、もともと英文字が表示できるコンピュータに自分たちの言語を表示できるようにしていったんですものどこの国も。

 というわけで日本の文字コードの歴史についてはここの文字コード関連のページを詳しく見ていただくとして、そう言うことなのです要するに。コンピュータをつかって辞書データを作る際には、わたくしが勉強している言語が英語でなくタイ語で、わたくしの母語が英語でなく日本語だ、と言うことがとても大変な問題になってくるわけです。

 要するに世の中には英語と自国語がコンピュータで使えれば充分、だという方が大多数なのですから、こんなあたしはマイノリティとして苦難の道を歩むことが最初から決められているのです。そうです、その宿命に抗うことは出来ないのです。

 現在コンピュータの世界で主流となっているテキストデータの文字コード体系では、タイ語と日本語を同時に表示し、入力検索を繰り返しながらデーターベースを作成してゆく、という事が、何かしらの手段を用いなければ困難なのです。

 だって日本工業規格とタイ工業規格の文字コードって、カブってるんだもん、って言うかどの国でもアメリカの文字コードに自国の文字足してっただけなんだから間違いなくカブるんだもん。要するにこんな感じで↓、

 ヘ赦 眥卿ムァ倏ツ

 いやーん、こまりましたね、って泰語で入力すると↑のように文字化けした日本語になる、と言うことなのです日本語ウィンドウズ上では。

 この半角カナと普段使い慣れないような漢字の組み合わせを見て、頭の中であのぐねぐねとした泰文字に変換できるがいれば問題ないのですが、そんな人は貴重です、ってゆうかそんな人はいまだかつて見たことも聞いたことがありません。

 だから表示できないと、データ作っても無駄になっちゃう訳ですね。だって記憶させたデータを検索しても出てきたデータ読めないんだもの。

 確かに現在はユニコードという、たくさんの言語を同一文書で共存できる新しい文字コード体系が存在し、ウインドウズ2000を導入すれば容易にマルチリンガル文書の利用が可能になりましたが、ウインドウズの世界ではまだまだ主流ではありません、というかそんなもの必要としない方が大多数なのですこの世の中。

 更に日本語ウイン上には欧文フォントと和文フォントなどという訳の分からない属性分けをしやがってるアプリケーションが多く、泰語データを日本語として認識し、したらしたでそのまま変更もできないというような事が多々あったわけです。

 そう言った土台をふまえた上でこれまではマルチリンガルでデータを管理する際、かなりアプリケーションに依存することが多かったのです。あたしがこのデータを入力しはじめたのは五年前なのですが、その頃はマイクロソフトエクセルバージョン5をウインドウズ95上で走らせて入力していました。

 しかし、このあたりが不思議なところなのですが、エクセルは日本語版はあるバージョンから和文データに英文フォントを割り当てる事がアプリケーション上で禁止され、タイ語フォントの表示が出来なくなります。多分次世代のユニコードを念頭に置いて、扱いにくいフォント混在のデータを一層してしまおうと思ったのでしょうゲイツ一家日の丸支部は。

 じゃマックにすればいいじゃん、というお言葉が聞こえてきそうですが、データをあれこれいじるフリーソフトの数がマックとウインでは雲泥の差がありましたので、どうしてもウインでやる必要があったのです。

 とりあえずいろいろな紆余曲折を経て、今わたくしはこのデータをロータスアプローチ98、というデータベースソフトを使って製作しております。ええそれはマイノリティとして一人ひっそりと。

 そして翻訳が進むにつれ辞書を引く機会も増え、当然のようにその度毎にデータの数も増えてきました。データは公開しておりましたが、どのソフトでも使える、というわけではなかったのですから、利用する人はほとんどいません。ずっとマイノリティだったのですあたしは一人で。しかし、先日とある方がこのデータをブラウズするソフトを製作されました。

 これで誰もがあたしが五年以上に渡って入力してきた単語帳を覗くことが出来るのです。おまけにこのソフトデータの追加まで出来やがります。まあなんて有り難いことなのでしょう。ということはもうこの五年間のように一人でチマチマ入力したりしなくても良くなったのかもしれません。

 というわけでもしタイ語の学習などをしていらっしゃるお友達がいらっしゃいましたら教えてあげて下さい。
 

初出・【日刊デジタルクリエイターズ】 No.0910 2001/07/27.Fri.発行

資料/更新履歴/御意見板
戻る
E-Mail: hinkaw@chan.ne.jp
(C) 2001 SHIRAISHI Noboru Office