かわら版
かわら版 【1】〜【5】
《 2000年 11月〜12月 の時事的なニュース 》
【 1 】 [2000.11.13]
噂を聞いた(あくまで噂だが)。
日本で初めての、書籍版と同じ内容をもつ電子版「国語辞典」と「漢和字典」が、発売に向けて準備中だという。
「そんなものは今でもあるではないか」
と思うかもしれないが、さにあらず。今の電子版の各種辞典は、書籍版とは内容が異なる。いずれも略字を使っているので、正字が略字に化けてしまう。(「鴎」「涜」などのパソコン略字)
この問題が顕著なのが、漢和字典である。略字と正字では画数が異なるので、電子版は書籍版とは別の画数を示すからだ。部首から引こうとしても、画数が異なるので、引けない。役立たずであり、かつ、虚偽情報を示す。
さて、国語審議会は2000年末ごろに、「印刷標準字体」について正式に答申を出す予定であるらしい。となると、それ以後は、上述のような「略字しか表示できない電子版の辞書」というものは、まったく正当性がなくなる。(そもそも、正しい情報が知りたくて辞書を引くのに。……)
となると、この点を是正して、正しい文字を表示できる電子版の辞書が出てきても、おかしくない。それで、企業はさっそく、商品化の準備をしているらしい。
方式は、(よくわからないが)フォント指定により、略字が正字になるのだろう、と推察される。つまり、この電子辞書では、表示フォントが固定されるわけだ。(ユーザが自由にフォントを変更することはできない。)
なお、この[略字でなく正字を出す]フォントが、外部のアプリでも利用できるかどうかは、まったく不明。
(……以上、あくまで噂であり、信頼性もあまりない。ただし嘘でもない。)
【 2 】 《 追記 》 [2000.11.17]
上記のように正字を使う辞書ができるとして、そこで略字を利用する方法としては、実は、「字形の変更」しかない。
なぜか? これだけが「合法的な」方法だからである。
「字形の変更」をすることは、97JISにおいて許容されている。つまり、同じコードポイントのまま、略字を正字に変更しても構わない。(JCSの用語でいう「包摂」概念で。)
一方、新たに正字を追加することは、勝手に外字領域をつぶして文字を追加することになるので、明白な規格違反( X 0208 への違反)となる。
もちろん、X 0208 ではない新規格を新たに定めて、そこで文字を追加するのなら、JISへの規格違反とは言えない。とはいえ、そのような新規格(約220字の正字を追加する新規格)は、誰も提案していない。だから、そのような新規格が制定される見通しはまったくない。
となると、現実的には、国語審議会のいう印刷標準字体を使う方法としては、「字形の変更」以外にはないわけだ。
※ X 0213 は正字の「追加」を唱えているが、約220字でなく、
150字程度だけ。かなり字数が不足するわけで、役立たず。
※ 南堂私案は、「追加」でなく、「字形の変更」を唱える。
※ 「約220字」という数字については、資料「略字&正字」に
含まれる「conc-jis.htm」の「219」という字数を参照。
[78JISの略字(「嘘」など)も正字に直せば、字数は10増。]
※ 他に、「ユーザ外字領域を使う方法」もある。だが、これは
OSに依存する方法なので、Windows と Mac で非互換。
【 3 】 《 追記 》 [2000.11.21]
前述のような「字形の変更」をして、「略字でなく正字を使うフォント」は、実は、すでにある。それは、「秀英明朝」というフォントである。
このことは、ご存じの方も多いだろう。私もつかんでいたので、書きたかったのだが、未確認だったので、今まで書けなかった。が、読者から情報を得たので、ここに記す。
「秀英明朝」「秀英太明朝」は、大日本印刷(株)のフォントで、パソコン略字の代わりに正字を使う。これは、T-Time の製品版や、新潮社の「新潮文庫の100選」CD-ROMなどに付属して、文学作品を正字で読めるようにする。(いずれも有料の製品に付属する。フォントを単独では販売していない。)
さて、このフォントだが、一般のフォントと同様に扱える。だから、ワープロやエディタでも使える。また、DD-Win のようなソフトで、電子辞書を表示するためにも使える。
つまり、このフォントを使って「大辞林」などを表示すれば、「略字でなく正字を使う電子国語辞典」は、すでに出来上がっていることになる。(ただ、メーカーの出荷する製品としては、そうはなっていないわけだが。……)
この「秀英」というフォントは、美しい書体としても有名なので、私も入手したいと思っていたのだが、残念ながら、「抱き合わせ販売」しかしていないらしい。どうしてもほしければ、前述のような製品を買うしかないようだ。
cf. WWW上を「秀英」で検索すると、情報を少し得られる。
【 4 】 《 追記 》 [2000.12.05]
「字形の変更」のかわりに、「文字の追加」(正字の追加)をする、という方法は、実用化が不可能であるようだ。なぜなら、第3水準領域を用いた場合、メールで文字化けするからだ。 (何年か先には、文字化けしないように対処できるかもしれないが、少なくとも現時点では、無理。)
だから、前述のような正字を使う方法としては、現実的には、「字形の変更」以外にはないわけだ。《 詳細 》
JIS外字領域の文字をメールで送信すると、次のことがわかる。
(1) 第4水準領域(95区以降)
この領域は、ISO-2022-JP で対処できないので、完全に文字化けする。(別の漢字になる。「姐輝」などの別字に。)
送信したメールはメールソフトに保存されているが、これを送信者自身が読み直すと、文字化けしていることがわかる。(つまり、送信した時点で、文字化けしたわけだ。)
(2) 第3水準領域(84区途中〜94区)
この領域は、ISO-2022-JP で対処できるはずだが、なぜか文字化けする。(未定義領域は中黒「・」に化ける。機種依存文字[89区途中〜92区]は、半角の英字と記号に化ける。しかも、この半角の変な文字列を、コピーして、他のエディタに貼りつけると、エディタが一般保護違反を起こして異常終了する。)
なお、送信したメールを、送信者自身が読み直すと、文字化けしていないことがわかる。(これは、送信後の伝達の過程で、文字化けしたことを示す。)
ともあれ、以上のような理由により、第3水準領域の外字領域は、現時点ではとても使えない、とわかったわけだ。もし強引に使えば、あちこちでアプリの異常終了が発生するだろう。
[ 付記 ]
(a)
送信するべきファイルとしては、表紙ページの資料にある「文字一覧」を使う。そこから第1・第2水準を除いた文字を、送信すればよい。
(ただし、自分で自分に送信しても駄目。他者に送信すること。)
(b)
これらの外字の文字は、Windows マシンでは、送信前には中黒に似た黒点で表示される。しかし、これらは、送信後には中黒に化ける。前者の各文字はそれぞれ別のコードポイントを持つが、後者の各文字はすべて中黒のコードポイントを持つ。
(c)
先の (1) (2) のほか、13区の機種依存文字領域の文字の場合も考えられる。この領域は、丸数字やローマ数字があることで知られる。
実は、この領域の文字は、特に問題なく伝達が可能である。相手のマシンが別の機種であれば別字に文字化けする、というだけのことだ。送信者と受信者がともに Windows である場合には、何も問題はない。
(d)
実は、本件[第3水準を利用することのトラブル]のような問題は、今回が初めてではない。以前も似たような問題があった。
JCSの初期案では、 121〜122区を使うことにしていた。その後、「これらの領域を使うと、アプリが誤動作する可能性がある」と南堂私案が指摘すると、JCSはあわててチェックした。すると、実際に、ほとんどのアプリで異常動作が発生することが確認された。……こういう前歴があるわけだ。
(e)
本件の (2) の文字化けは、私が実際に確認したが、ひょっとしたら、プロバイダとか伝送経路とかの影響を受けるかもしれない。文字化けが必ず発生するとは限らず、正常に伝送されることがあるかもしれない。ただ、私が試行した例[フリーメールを利用]では、文字化けが発生した。
【 5 】 《 追記 》 [2000.12.09]
「字形の変更」がついに実現することになった!
国語審議会は 2000-12-08 に答申を正式に出した。そこでは印刷標準字体を定めたが、同時に、「パソコン略字を正字に変更すること」をJISに要請した。この方針を受けて、工業技術院はJISの「字形の変更」を1年以内に正式に決める予定だという。業界では、反対するどころか、「単なる目安ではなく強制力を持たせるため、政府の内閣告示にしてほしい」という声もあるそうだ。
[ ……以上、2000-12-09 朝日新聞朝刊の報道内容による]
文字講堂式のイヤミを言えば、
「ふうん。やっぱりね。日本の企業は例によって自主的な判断力がないんだな。お上に頼って、『みんな一緒主義』なんだな」
であるが、ま、めでたい日には、あまり文句を言うこともあるまい。クリスマスや正月の前だが、祝杯を挙げたくもなる。 (^^);
文字講堂としては、これでとうとう、最大の目的を達したことになる。というわけで、今後は更新することもなくなりそうだ。
これまで熱心に読んでくださった読者に、感謝いたします。ありがとうございました。
《 データ 》
簡易慣用字体22字は、以下の通り。
唖頴鴎撹麹鹸噛繍蒋醤曽掻痩祷屏并桝麺〓芦蝋弯
(注:「〓」は「さんずい+戸」)
《 余談 》
これでとうとう、瀕死の X 0213 は息の根を止められたようだ。
( ∵ 同じ正字を二重に採択するわけには行かないので。)
ご逝去をお悔やみ申し上げます。
《 略字の利用 》
「略字大好きの人」もいるだろう。そうした人たちは、今回の方針に、
悲憤慷慨していることだろう。しかし、私案にも記したように、
『(フォント変更で)略字を自分だけで使う限りは構わない』
のである。今までのフォントにより、略字を表示・印刷してよい。ただ、
他人と情報交換するときには、略字でなく正字が基本となる。今回の
国語審議会の方針は、世間の基準を統一することにあり、個人的な
利用法まで規制するものではない。
※ 将来的に、略字を別のコードポイントに復活させるか否かは、
私としては、「どうでもいいや、ご勝手に」と感じる。
《 残る問題 》
あとは、「常用漢字に対応する正字」が問題だ。これについては、
Mac OS X の特殊フォントでも使うのが現実的な策だろう。TRONを
使うのも一案である。 一方、Windows では、採用の予定はまったく
ないようだ。 (だから、教育用 ・官公庁用パソコンには、Windows は
不適だ。教育用 ・官公庁用のパソコンには、Windows でなく、Mac を
使うのがいいと思う。) ( cf. codekoku.htm#uni )
《 ICカードの問題 》
ICカードについては、どうか? ( cf. codekoku.htm#jissi )
「常用漢字に対応する正字」(旧字)は、
・ 少なくとも一部は、人名漢字に使ってよいこと
・ 常用漢字(新字)とは、包摂されないこと
の2点が、法律等で公式に決まっている。
にもかかわらず、現在のJISでは使えない。もちろん、現状では、IC
カードでも使えない。だが、3年後と目される期限までに、使えるように
なる必要がある。
当然、自治省(新・総務省)は、その作業をするだろう。そこで、次期
JISを決定する権限は、自治省に渡せばよい。工業技術院にいるJIS
の担当者は、自治省に移管し、下級職員として薄給で下働きさせる。
なお、厚生省などの各種ICカード(保険証など)も、自治省で所管す
ればよい。自治省はすべてを握れて、大喜びだろう。
国民も、これでパソコンで旧字が使えるメドが立つので、大喜び。
工業技術院の職員も、サボってもクビにならない分、喜ぶべきだ。
《 情報 》
月刊誌「Mac Power」 2001年1月号。
・ Unicode の Variant (異体字)タグの情報。
・ Mac OS X の文字コード情報。
(あまり新味はないが、面白い話も。電子メールで Unicode を使い、
多大な文字化けを引き起こす、という話。いかにもアップルらしい。
電子メールで Unicode を使うなら、HTMLメール [UTF-8] にして、
添付する形を取れば、問題はあまりない。だが、あえて問題を引き
起こす方式を選択するわけ。自称、「他に先んじる最新技術」。それ
をメールでやるわけ。自分で自分にメールを出す人に最適。)
国語審議会のサイト。
・ 「印刷標準字体」の答申の内容
WWW上の情報
・ 「ITSCJ のページ」および「ほら貝」の「エディトリアル」
(工業技術院 と自治省が、別の規格で、覇権を競いはじめた?? )
(「南堂がけしかけるからだ」と非難する声あり。そ、そんなこと。……)
※ 政府内で2種類の文字規格が並立した場合、どうなるか?
政府内で文字化けが頻発する。
( ∵ ネットワーク時代に、情報を孤立させるのは不可能ゆえ。)
すると、どうなるか? 国民は他人の責任を負わされ、身の覚えの
ない罪に問われて、監獄行き。または、巨額の税金請求。
[ 免許証、保険証、旅券、年金、納税者番号、などでも混乱。]
Q 解決策は?
A 半年以内に次期JIS [大幅拡充] を策定して、一本化。
Q 解決されない場合は?
A 一方の側がつぶれるザマを見物。
Q 規格が並立したら、数年後にどうなる?
A 双方の責任者が監獄行き。
cf. 2000-12-28 朝刊
厚生省の役人が無為無策を問われ、禁固三年。
氏 名 南堂久史
メール nando@js2.so-net.ne.jp
URL 文字コードをめぐって (文字講堂) (表紙ページ)
[END]