Aprotool TM Editor チップ集 :: (2006/11/11)

トップページ 最新公開版 Ver.3.10 正規ユーザー登録


[Tip 9]久々のベータ版 : (2006/11/11)


わけあって6年ぶりの更新をしています。 何はともあれ、画面イメージを貼っておきます。 BETA/ATMEM312.PNG BETA/MOZSKM312.PNG

[Tip 8]MS UI Gothic が正しく表示できない : (2000/11/11)


MS UI Gothic を選択して漢字が正しく表示できない場合は、 Aprotool TM のコンソールウィンドウを開き、コマンドラインに "mode edit font -c:128" を入力して改行をおしてください。

[Tip 7]符号化方式自動判別 : (2000/06/01)


符号化方式自動判別機能をつけてみました。対象符号化方式は次のとおりです。
符号化方式 編集時 読込時
Shift-JIS DBCS Shift-JIS
EUC-JP DBCS EUC-JP
ISO-2022-JP DBCS ISO-2022-JP
UTF-8 Normal Unicode UTF-8 Normal
UTF-16 Unicode UTF-16
UCS-4 Unicode UCS-4
Unicode LangTagUnicode LangTagUnicode LangTag
ESC: Unicode LangTagESC:
ISO-2022-ECS B Unicode LangTagISO-2022-ECS B
TRON Unicode LangTagTRON
Unicode 系はBOMを明示的につけることで上位数バイトを読み込むだけでほとんど判別できます。
実際に自動判別が必要になるのは、Shift-JIS,EUC-JP,ISO-2022-JP,UTF-8 Normal です。
Big5 や GB を使用する人は誤判別しますので、チェックをはずす必要があります。
(2000/06/05) : (-懺悔-)、符号化自動判別の精度をあげたのはいいものの、 Beta 2 はデバッグダイアログを消し忘れてアップしてしまいました。 Beta 版の性格上それを解消するための再アップはしませんが、 貴重なバージョンとしてダウンロードしてみてください(フォローになっていない!)。 これが、正式バージョンだったら、各サイトの主催者に訂正メールを送ったりして 差替作業等で大変なんですが、それと比較して、こういう形式のベータ公開は気楽でいいというメリットもあります。
(2000/06/14) : 正式版 Ver 3.10 でサポートしました。

[Tip 6]Global IME : (2000/05/16)


Global IME を少しかじってみました。ただし Aprotool から、まともに使えるのは Windows95/98上のハングル入力のみ。
(2000/05/22) : その後の調査により、本体に含めるのは不安定過ぎるということで、別モジュールとしては配布することにしました。 Global IME for Aprotool TM Adaptor Ver. 3.09 (CWDIM309.EXE : 8067byte : 2000/05/20) (Download Now!)

[Tip 5]各符号化方式の圧縮効率 : (2000/02/17)


各符号化方式の圧縮効率を比較してみました。あまり顕著な差はないですね。 もともと中身が一緒なので、圧縮したら似たようなサイズになるのは当り前かもしれません。
データーは、ATMEJ308.EXE 付属の TMEDIT.HTM を各符号化方式に変換したあと、 LHA version 2.13 で圧縮しました。
符号化方式 圧縮前サイズ(bytes) 圧縮後サイズ(bytes)圧縮率(%)
Shift-JIS 343,183 78,32622.8
EUC-JP 343,183 78,20122.8
ISO-2022-JP 375,193 78,59520.9
UTF-7 389,901 94,95324.4
UTF-8 393,436 85,07621.6
UTF-16 585,862 91,47415.6
UCS-4 1,171,724114,378 9.8
意外と UTF-7 が苦戦していますね。圧縮後は UTF-16 よりファイルサイズが大きくなります。

[Tip 4]超漢字TRONコードの読み書き : (2000/02/06)


超漢字TRONコードをそのまま読み書き

編集時文字コード 読込時文字コード保存時文字コード
Unicode (Language Tag)TRON (Cho-Kanji)TRON (Cho-Kanji)

超漢字TRONコードから Shift-Mojikyo 形式に変換

編集時文字コード 読込時文字コード保存時文字コード
Unicode (Language Tag)TRON (Cho-Kanji)Unicode
(注) 保存時の文字コードは表示上は Unicode だが、文字鏡フォントの部分は、 Shift-Mojikyo 形式で保存される。

Shift-Mojikyo 形式から、Shift-JIS + 文字鏡番号に変換

編集時文字コード 読込時文字コード 保存時文字コード
Shift-Mojikyo (TM Spec)Shift-Mojikyo (TM Spec)DBCS + (&M;) Mojikyo Tag

[Tip 3]期間限定、禁断の秘儀 : (2000/01/20)


昨今、話題の JIS X 0213:2000 ですが、 確か、今日が制定日だったと思います。 なんと、Ver.3.08Beta1 には JIS X 0213 の Shift_JISX0213, EUC_JISX0213, ISO-2022-JP-3 の 相互変換処理が入っています。ただし正式版でサポートするかどうかは未定です。 サポートするにしてもレジストリの奥底に秘伝として忍び込ませるかもしれません。 意外とドキュメント化しないだけで、そのまま正式版にはいるかもしれません。 すべて謎に包まれています。 でもサポートしているからといって、いきなり ISO-2022-JP-3 をメールで 流す人はいないですよね。 だいたいエスケープシーケンスでさえ未定なのに、 なんでそんなもの先読みして実装しているんだっていう苦情もきそうです。

[Tip 2]第2回JAET大会資料 : (2000/01/16)


第2回JAET大会で発表した資料です。

JAET2SLD.LZH(10,767byte) : (2000/01/22)

言語情報つき Unicode テキストや 準TAD形式の超漢字TRONテキストで作成されています。
(2000/01/17) : GBコードとKSコードが不正だったのを修正。 Ver.3.08 Beta をご使用ください。
(2000/01/18) : ハングル、繁体漢字、簡体漢字を表示する場合は、 マイクロソフト社 のサイトからそれぞれの言語用拡張パックを入手してください。
(2000/01/20) : TRONコードからの変換時に Shift-JIS の 0x??80 と Big5 の 0x??A1 が化けるのを修正。 Ver.3.08 Beta1 をご使用ください。
(2000/01/21) : JAET2SLD.LZH 添付の shiryou.tad に文字指定付箋の半角を追加
(2000/01/22) : JAET2SLD.LZH 添付の shiryou.tad に文字指定付箋の不正バイトの修正

[Tip 1]各種Unicodeの保存形式 : (2000/01/15)


参考図 1
TMEDIT/TMG_OPEN.PNG
符号化 編集時文字コード保存時文字コードUTF8 BigE BOM BOMバイト列
UTF-8 Unicode Unicode (UTF-16)[X]   [X] EF,BB,BF
UTF-8N Unicode UTF-8 Normal      
UTF-16 Unicode Unicode (UTF-16)[ ] [ ]/[X][X] FE,FF or FF,FE
UTF-16BE Unicode Unicode (UTF-16)[ ] [X] [ ] FE,FF
UTF-16LE Unicode Unicode (UTF-16)[ ] [ ] [ ] FF,FE
UTF-32 Unicode UCS-4 [ ] [ ]/[X][X] FF,FE,00,00 or 00,00,FE,FF
UTF-32BE Unicode UCS-4 [ ] [X] [ ] 00,00,FE,FF
UTF-32LE Unicode UCS-4 [ ] [ ] [ ] FF,FE,00,00
注記
(2000/01/25) : UTF-7 をサポートしました。3.08Beta3 以降。
(2000/02/06) : UTF-7 はサポートしていますが、Unicodeのメインストリームではないので、表からは削除。
(2000/02/16) : 画像ファイルを GIF から PNG に変更しました。 ついでに、配布ファイルのテキスト形式を、できる限り、Shift-JIS から ISO-2022-JPに変更しました。 おかげで、ダウンロード用ファイルのサイズが 10%以上も減るという衝撃の副作用もあります(Ver. 3.09 Beta1)。 ISO-2022-JP はすべて 7bit 文字だけで構成されているので圧縮効率がよくなります。
さて、将来的に、配布ファイルのテキスト形式を UTF-8 にすると現在より圧縮効率はよくなるのか悪くなるのか。
(2000/02/17) : その後の調査によりファイルサイズの減少は PNG 画像が貢献していることが判明。
(2000/03/05) : BOMバイト列を追加