※ JCS案に多大な問題がある、ということは、すでに別のページでも記した。
「JISの新規格の試案」(codesian.lzh)
「私案」の「補足」(codesia2.htm)
などでだ。
ただ、最終案についてよく調べた末、新たに詳しく記述し直すことする。
【 修正履歴 】 [ 2000.8.01. ]
絶対温度記号について、付記した。 → [そこへジャンプ]
この「文字講堂」の読者なら、公開レビューについては数多くの問題があることを、すでに知っているはずだろう。
ただ、それらを知らないまま、この文章を読んでいるような、初歩の読者もいるだろう。そこで、重複を厭わず、すでに述べた批判を、ここにふたたび列挙する。
【 付記 】 現JISを残しての外字利用
JCSがいかに独自の思想によって外字を禁じても、実際に使う必要のある人はいる。
となると、どうしても使いたい人は、新JISでなく、古いシステムの上で使うことになりそうだ。
つまり、新JISの環境から離れて、現JIS のもとで(既存の外字システムの併用で)、外字を使うことになる。
この方法は、別に禁じられているわけではない。新JISができても、現JISが禁止されるわけではないから、こういう方法も、立派に生き残る。(必要性に迫られて、やむなく生き残らせざるを得ない。)
となると、結局、現JISと新JISとの両方が流通することになるわけだ。JCS案のもとでは、新JISに統一することは不可能となり、両者を併用せざるを得なくなる。
しかしそうなれば、当然、二つの規格の併存により、混乱をもたらす。(後述の文字化けの問題)
というわけで、JCS案の方針は、およそ論外といえるものである。
【 付記 】 単語登録との類似
「外字」という機能は、IMEの「単語登録」機能に似ている。
IMEの辞書は、一般的な用途にはいいが、個人の特殊な用途まで網羅しているわけではない。そこで、足りない言葉を補うために、「単語登録」機能を使う。
外字も、同様だ。既存の文字セットは、一般的な用途にはいいが、個人の特殊な用途まで網羅しているわけではない。そこで、足りない文字を補うために、「外字」機能を使うわけだ。
「外字」機能は、「単語登録」機能と同様に、重要なものである。
【 付記 】 私案における外字の扱い
私案の方式では、JCS案のような問題は生じない。なぜなら:(1) 外字領域がある……結局、以上のような対策法を取っているので、私案では外字の問題はない。
したがって、個人的な用途で、必要な外字を使いたければ、使える。
たとえば、点字を使いたければ、使える。
また、マンガの「え゛」のような文字も使える。
(2) 外字領域が小さい
外字領域は小さく限定されている。ユーザが外字として使うのはこの領域だけである。
だから、文字化けが生じるとしても、この領域に限られている。比較的、問題が少ない。
一方、JCS案の場合は、新JISのかわりに現JISの外字領域を使うことを強いられるが、この場合、現在のWindows の広い外字領域をすべて使うことになる。(特定の狭い領域を使え、とは限定されないので。)……となると、文字化けするとしても、広い領域のどこで文字化けが起こるかも予測がしづらく、混乱は多大なものとなる。
(3) 第五水準
私案では、Windows の外字領域は、当面は新JISでは使わないこととしている。(第五水準)
一定の経過期間を経て、これらの新JIS領域を使うわけだから、もちろん、文字化けの恐れはない。というわけで、その間は、既存の外字を使うことのトラブルを避けることができる。
【 例示 】 文字化けの例 その1
たとえば、「黒」の正字を見よう。
これは、次のように配置される。
シフトJIS ── 区点 9278 (16進で eeec )
区点 11912 (16進で fc4b )
JCS案 ── 区点 9482 (16進で eff0 )
すると、どうなるか?
現JISフォントのWindows環境でこの文字を書いて、新JISでその文書を開いたとする。
この場合、次のように文字化けする。
「黒」の正字( eeec ) → 「〓」(焉+おおざと) (UCS 9122)
「黒」の正字( fc4b ) → 「〓」(金+且)
とんでもない文字化けである。そして、このようなことは、Windowsの機種依存文字を使ったあらゆる文字について成立する。
逆も同様である。
Windowsの機種依存文字の領域にある、新JISの文字を使えば、それを現JIS + Windows で開いたとき、文字化けする。
たとえば、「社」の正字(JCS最終案で区点 8919) がそうだ。これを新JISで書いて、現JISフォントのWindows環境で開いたとき、「社」の正字であったのが、「〓」(にんべん+必)に文字化けする。
以上のように、恐ろしい文字化けが生じるわけだ。
しかも、文字化けしたかどうかが、まったく判別できない。新JISと現JISとは、フォント切り替えによって区別されるだけであり、原理的には何の区別の方法がないからだ。
つまり、JCS案の方法では、途方もない混乱が引き起こされるわけだ。
そもそも、JCS案は根本的におかしい。
「黒」の正字は、すでに現在流通しているフォントには、もともと備わっている。そしてそのコードポイントがある。なのに、なぜ、新たに別のコードポイントを割り当てるのか? あまりにも馬鹿げているとしか言いようがない。同じ文字に、現JISと新JISで、別々のコードポイントを割り当てれば、混乱は必然である。
実際、83JIS改訂時には、そういうひどいことをして、世間に多大な迷惑をまき散らした。
今回、また、JCSはその轍を踏もうとしているわけだ。神経を疑う。
【 付記 】 文字化けの例 その2
機種依存文字なんか、めったに使わない……と思い込んでいる人もいるかもしれない。
しかし、さにあらず。115区のローマ数字や省略記号は、かなり使われている。JISの字形で真似て示せば、次のような記号だ。
i, ii, … , v, …, x,… , I, II, …,V ,…, X,…
さらに言えば、JCS案におけるこれらの文字の配置も、またメチャクチャである。
ローマ数字小文字は、既存の機種依存文字では 92区と 115区にあるのに、JCS案では、そのどちらでもない 12区に移動して置いている。
ローマ数字大文字は、それよりはいくらかマシである。既存の機種依存文字では 13区と 115区にあるが、JCS案ではそのうち13区の方の領域に重ねている。その点ではいくらかマシだが、やはり問題がある。
というのは、Windowsでは、「ローマ数字大文字は原則として 13区でなく 115区を使う」ことになっているのだ。MS-IME やATOK でローマ数字大文字を出力すれば、(たとえ画面で13区の文字を選択したとしても、)自動的に115区の文字が使われる。つまり、世間で流通しているローマ数字のほとんどは、115区の文字なのだ。 (そのように統一されている。)
にもかかわらず、それとは異なる 13区の領域をJCSは指定する。このことは、次のような問題をもたらす。
・ 同じ文字を使うのに、二つのコードポイントがともに使われることの問題。(検索など)
・ 文字化けする問題。(現JISで書いたローマ数字が新JISで漢字に化ける。)
この2点は、ローマ数字だけでなく、 (株) や No. や TEL でも同様である。
【 追記 】 正誤 修正
上記の最後で、「……も同様である」と記したのは、誤りであった。
これらの No. KK. (株) などは、ローマ数字とは事情が異なる。
Windows では、115区の文字ではなく、13区の文字が使われる。
したがって、これらの文字は、JCS案のままで、別に問題ない。
(ローマ数字については、前述の通り、問題がある。)
【 付記 】 トラブルに対するメーカのサポート
ついでに言えば、このようなトラブルにともない、初心者は混乱する。
となると、パソコンメーカには、サポートの電話がいっぱいかかってくるだろう。
そうしたサポートのためにメーカ側は多大な出費を強いられることになる。
JCSはいくらか費用を補償してくれるのだろうか?【 追記 】 トラブルの例
メーカに寄せられるトラブル報告としては、次のような例が考えられる。
「 文書を HTML にしたら、文字化けしてしまった。漢字がローマ数字に。ローマ数字が漢字に。……全然別の字になってしまった! 会社の名前も化けてしまった! 大変だあ!」 → 「社の名誉失墜で、おまえはクビ! リストラだ!」
「 おい、貴社の『×××』という IME はバグがあるぞ! IMEのツールで、『ローマ数字』という一覧表があるが、そこにある文字は、ローマ数字じゃなくて、漢字じゃないか! ローマ数字を探しても、記号一覧のどこにも見つからない。こんなバグソフトで金取るな! 金返せ! インターネットのホームページで、訴えてやるぞ! 『貴社の製品はバグだらけだ』と画像つきで」
【 付記 】 私案における対処
私案では、これらの文字化けの問題は生じない。どういう方法によるかは、私案で詳しく説明したので、そちらを参照。
このように、文字化けの問題を解消する方法が、(私案の形で)ずっと前から知られているわけだ。にもかかわらず、JCSはあえて、問題を起こす方式を採用しているわけだ。まともな判断力があるのかどうか、疑いたくなる。
【 付記 】 JCSの言い分
ここで、JCSの言い分を少し推測してみよう。JCSは次のように考えているのかもしれない。
「機種依存文字のトラブルは、やむをえない。機種依存文字というものは、メーカが規格外の文字を勝手に使っているから起こるだけだ。JISの関知することではない。」
これは、理屈の上から言えば、もっともである。
しかしこれは、現実を無視している。現在、Windows がデファクトスタンダードとなっている。規格があるか否かが問題なのではない。現実に世の中のコンピュータがどうなっているかが問題なのだ。
紙に書かれた規則ばかりを重視して、現実を無視するのを、「官僚主義」という。
「法律ではこうなっておりますので、できかねます」
「前例がありませんので、できかねます」
こういう理屈を並べて、国民に大迷惑をかけるわけだ。
JCSは民間団体のくせに、へんなところばかり、官僚的で困る。
なお、ついでに一言。
機種依存文字の領域のほか、外字の領域でも、文字化けは生じる。この件については、すでに先に述べた。
【 付記 】 文字コード表との関係
JCSは、もしかしたら、「文字コード表をきれいに整えたい」と思っているのかもしれない。
しかし、これは、初心者の考えそうな勘違いである。
文字コード表というのは、規格の制定時には使うが、制定したあとは、普通のユーザはまったく使わないものだ。(一部の頭が固いユーザは除く。)
普通のユーザは、IMEのツールを使う。これによって、部首順とか、音読みとか、訓読みとか、画数順とか、あるいはそれらの組み合わせとか、または手書き自動認識ツールとか、そういった方法で漢字を出す。同時に、文字コードを知ることもできる。
また、このようなIMEのツールがなければ、単なるテキストファイルに「画数順」とかのデータをまとめて、それを見ればよい。 (そのあと別のテキストファイルで文字コード番号を知ることもできる。)
はっきり言って、文字コード表を使って漢字を出すのは、賢明な方法ではない。そうした賢明でない方法をあえて行なう場合の便宜のために、大多数の人が文字化けのトラブルを耐えねばならないいわれはない。
【 付記 】 Unicode の番号
上の「青」「間」の正字という2字は、Unicode にある。だから、この2字がないことは、csv 表から確認できる。Unicode の番号はそれぞれ、9751, 9592 である。
なお、Unicode 番号 9AD9 には、「はしご高」があるが、これもJCS案にはない。
【 付記 】 正字のかわりに採択したもの
JCS案では、正字がかなり不足しているが、そのわりには、余計なものがたくさん入っている。このような変なものを入れてまで、なぜ正字を排除するのか、疑問である。
余計な文字としては、次のようなものがある。
(a) 略字
正字については原則として採択しないくせに、たいていの人が見たこともないような略字は採択されている。それは次の4字である。( 福田雅史氏の調査 による)
・ 「月+斉」 (1字)
・ 「齟」「齧」「齬」の「齒」のところを「歯」にした文字 (3字)
これらは採択の根拠が不可思議である。
・ なぜこれらの略字だけを選んだのか?
・ これらは公開レビューでは示されない文字なのに、なぜ採択したのか?
「朝日新聞でよく使われる略字」かとも思ったが、そんなこともないようだ。
(b) 珍妙な人名字
「一般向けの漢和字典には掲載されていないような人名漢字」
というものがやたらとたくさん採択されている。
これらは、漢和字典に載っていないのだから、普通の人には、読みようがない。また、これらの文字は、中国に典拠がなくて、日本で作られた個人的用途の文字、つまり、勝手に発明された文字である。
たとえば、「百合」の2字を上下に並べて1字にした文字(f1a8)がある。「ユリ」と読むのだそうだ。まず間違いなく、「百合」の2字を勝手に合成した文字だろう。こんなものまで採択する理由がわからない。
なお、次のような意見があるかもしれない。
「人名字を採択すれば、コンピュータで業務用に人名のデータ処理をするのに便利だ」
しかし、これは間違いである。
JISにいくらたくさんの人名漢字を採択しても、すべてを漏らさず網羅することはとうていできない。となると、業務用の処理には、(すべてを漏らさず網羅するため)独自の外字システムが必要となる。たとえば XKP など。というわけで、JISにいくらたくさんの人名字を入れても、業務用には何の意味もない。
だから、使うことがあるとすれば、せいぜい、その人が個人的に使うぐらいだろう。これは、本来、外字などでも代用できるはずであるが。
なお、「その人の知人が使う」ということは、あまり考えられない。第一に、そんな特殊な文字は、他人には、読み方も書き方もわからず、使いにくい。第二に、当の本人が、普通はひらがなで書くものである。というのは、漢字で書いても、読んでもらえないからだ。私の周辺でも、難読の氏名文字の人は、名刺などで、ひらがな書きにすることが多いようだ。つまり、漢和字典にもないような風変わりな人名文字は、当の本人でさえ、あまり使わない。要するに、用途がほとんどない。
こういう珍妙な文字がたくさんあるわけだから、新JISは、一種の「珍字字典」の趣を呈している。
まともな正字はろくになくて、珍字は盛りだくさんなわけだ。珍字がたくさんあるから、「珍字s」となる。したがって、「新JIS」転じて、「珍JIS」となりそうだ。
(c) 2バイトの欧文特殊文字
珍妙な文字は、他にもある。
漢字ではなく、非漢字の領域で、2バイトの欧文特殊文字が多量に採択されている。
しかし、これは、誰も使わない文字である。というより、使ってはならない文字である。使うとしたら、せいぜい、その文字を示す「画像」のかわりだろう。これは文字ではなくて、一種の絵である。つまり、雪だるまのマークと同じようなものだ。
こんな珍妙なものを採択するのもおかしな話だ。
※ 2バイト欧文特殊文字は、使い道がない、ということは、すでに示した。
「私案」および「私案をめぐるQ&A」を参照。
(d) 特殊分野の文字
歯科用の変な記号があるが、点字など、いろいろと必要な文字がない。
特に、雪だるまや太陽の絵文字があるくせに、気象記号がない。これもおかしな話だ。気象記号は個人の日記などで非常に多く使われる。小学校でもそうさせることがある。普通の新聞の紙面にも載っている。また、ジャストシステムの日記用のソフトでは、これらの気象記号をフォント変換方式で利用できる。
このような平易な記号を排除して、かわりに、日本人にはなじみのない変な絵記号を採用する。「Unicode にもあるぞ」と主張するのかもしれないが、頭が外国かぶれしているんじゃないの? 雪だるまの絵があるようだが、あれは雪だるまではなくて、snowman である。JISは英米の人々のためにあるわけではないのだが。
【 付記 】 [ 2000.8.01. ]
絶対温度記号として ゜K という字形の文字を、以前、提出した。
しかし、読者からご指摘を受けたところでは、絶対温度を示す記号は、ただの K である。つまり ゜ が付かない。このことは国際単位系(SI)で定められている。
というわけで、正式な書法を使う限り、 ゜K という字形の特殊文字は、別に必要ない。だから、特に追加採択しなくてもいい、とも言える。
ただし、学術的なことだけで話が済むわけでもない。世の中には、慣用とか何とか、いろいろあるのだ。
実際、各種の書籍を見ると、最新の書籍ではたいてい K と記述されているが、古い書籍では ゜K と記述されていることも多い。いくつかの百科事典でそうだし、また、ブックシェルフにある小学館国語大辞典でもそうである。
となると、現在の国際単位系では K だとしても、古い国際単位系では ゜K であった可能性がある。
つまり、現在の正式な書法はともかく、歴史的・慣用的に見れば、 ゜K という書法も多く見られるわけだ。というわけで、 ゜K という記号は、必ずしも排除すべきものでもないようだ。あればあったで、それなりの使い道もあるようだ。(現在の正式な書法を使う限りは、不要の記号ではあるが、いやなら使わなければいいだけの話。)
なお、 K という記号は、絶対温度以外にも、さまざまな意味で使われる。「カラット」「キロ」(キログラム,キロメートル)など。というわけで、普通の書籍では、 ゜K という記法を用いたとしても、非難するべきことでもなさそうだ。それはそれで、他の意味の K との誤解を避けられる、という長所があるからだ。
csv ファイルの読み方
JCS 最終案は、pdf ファイルと csv ファイルで示されている。
このうち、 csv ファイルの読み方について、若干、説明を加えておく。
(1) 二つの平面
pdf ファイルは二つあり、二つの平面に対応している。
csv ファイルは、ひとつである。ここには、二つの平面のデータがともにある。
そこで、単に区点番号を見ると、どちらの平面か、勘違いすることもあるかもしれない。
csv ファイルの前半は、第一平面であり、後半は、第二平面である。この点、勘違いしないよう、注意した方がいいだろう。……老婆心ながら。
(2) 正字の調査
今回の csv ファイルでは、データが大幅に欠落しているので、調査はできなかったが、そのうち、ちゃんとデータを補充した csv ファイルも公開されるだろう。たぶん。……
その時点で、正字は、次のようにして調査できる。
・ データを並べ替えて、「補助漢字にない文字」を探す。(約500字 : 非漢字を含む)
・ そのうち、「大漢語林」には番号のあるものを探す。
この文書を書いている現時点での csv ファイルでは、以上の調査では、見つかる文字は一つもない。
ただ、「補助漢字にない正字」があれば、上の方法で見つかるはずだから、正字をざっと探すことができるだろう。
(現時点では、これはできない。「大漢語林」の番号が欠落しているので。たとえば「蝉」「嘘」の正字は、実際にはJCS最終案にあるが、csv ファイルでは「大漢語林」の番号が欠落しているので、見つからない。)
機種依存文字の収録
JCS最終案における機種依存文字の収録について、コンピュータでざっと調査した結果は、次の通り。 (機種依存文字を使っているので、Windows 環境でないと、見えない。)
( データの作成にはJCSの csv ファイルを利用した。)
h(4E28) i(4EE1) k(4F00) l(4F03) n(4F56) p(4F8A) o(4F92) r(4F94) q(4F9A) a(4FC9) w(501E) u(5022) t(5040) z(5042) x(5046) y(5070) {(5094) ~(514A) =i519D) пi5215) (52A6) w(52AF) (52DB) 堰i5300) 梶i5307) 求i5324) 香i5393) 氏i53B2) 秩i548A) 早i549C) 刀i54A9) 煤i54FF) 普i5586) (57AC) 噤i57C7) 凵i57C8) 掾i589E) 氈i590B) 。(595B) 「(595D) 、(59A4) ヲ(5B56) ァ(5BC0) ゥ(5BD8) ェ(5BEC) ォ(5C1E) ャ(5CA6) ュ(5CBA) ッ(5D27) イ(5D42) ー(5D53) ウ(5D6D) エ(5DB8) オ(5DB9) ク(5F34) g(5F45) ケ(5F67) コ(5FB7) サ(5FDE) セ(608A) タ(60D5) ツ(60F2) ナ(6130) ト(6137) ニ(6198) ネ(62A6) ノ(63F5) ハ(6460) ヒ(649D) フ(64CE) ホ(6600) ム(6609) マ(6615) モ(661E) ヤ(6624) c(6631) ヨ(6657) ラ(6659) ユ(6665) ル(6673) レ(6699) ロ(66A0) ワ(66B2) ン(66BF) ゙(66FA) f(66FB) 瘁i6766) 竅i67BB) 艨i67C0) 蛛i6801) 諱i6844) 縺i6852) d(68C8) 轣i68CF) 驕i6968) (6998) (69E2) (6A30) (6A46) (6A6B) (6A73) (6A7E) (6AE4) (6BD6) (6C3F) (6C5C) (6C86) (6CDA) (6D04) (6D87) A(6DAC) B(6DCF) E(6DFC) H(6E27) I(6E3C) G(6E5C) J(6EBF) K(6F88) L(6FB5) M(6FF5) N(7005) O(7007) P(7028) Q(7085) R(70AB) b(70BB) T(7104) S(710F) V(7146) W(7147) U(715C) Y(71C1) Z(71FE) [(72B1) \(72BE) _(7377) a(73C9) b(73D6) c(73E3) e(7407) g(7426) h(742A) j(742E) k(7462) l(7489) m(749F) n(7501) ィ(752F) o(756F) s(769B) q(769C) r(769E) t(76A6) v(7746) x(7821) y(784E) z(7864) |(7930) =i7994) メi799B) пi7AD1) (7AE7) (7AEB) (7B9E) 梶i7D48) 求i7D5C) 香i7DA0) 戟i7DB7) 氏i7DD6) 潤i7E52) \(7E8A) 吹i7F47) 刀i8301) 煤i8362) 普i837F) 磨i83C7) (8448) 凵i84B4) `(84DC) 噤i8553) 宦i8559) 栫i85B0) 「(88F5) ](891C) 」(8A12) 、(8A37) ・(8A79) ヲ(8AA7) ァ(8ABE) ィ(8ADF) ェ(8AF6) ャ(8B7F) ュ(8CF0) ョ(8CF4) ッ(8D12) カ(90DE) ク(9115) ケ(9127) サ(91D7) コ(91DA) ソ(91E4) タ(91E5) ス(91ED) セ(91EE) テ(920A) ツ(9210) ハ(9239) ト(923A) ニ(923C) ナ(9240) ヌ(924E) ノ(9251) ネ(9259) ヒ(9267) ホ(9278) _(9288) フ(92A7) メ(92D0) ヨ(92D3) ミ(92D7) ム(92D9) ユ(92E0) マ(92E7) e(92F9) ル(92FB) ワ(92FF) ゙(9302) ン(931D) ロ(931E) リ(9321) ラ(9325) ^(9348) 焉i9357) ゚(9370) 竅i93C6) 縺i93DE) 諱i9445) (969D) (96AF) (9733) (973B) (974D) (974F) (9755) (9857) (9865) (999E) (9A4E) @(9ADC) B(9B72) A(9B75) C(9B8F) D(9BB1) F(9C00) H(9D6B) G(9D70) J(9E19) K(9ED1) 焉iF929) 驕iF9DC) 宦iFA0F) 怐iFA10) ア(FA11) 閨iFA13) 黶iFA14) X(FA15) ^(FA16) ~(FA19) (FA1A) aiFA1B) 掾iFA1F) 氈iFA20) ゥ(FA22) ウ(FA24) キ(FA26)
j(4EFC) m(4F39) s(4FCD) v(4FFF) }(50D8) |(50F4) (5164) ai51BE) メi51EC) (529C) (52C0) 戟i5372) 潤i53DD) 磨i5759) 浴i5765) 栫i58B2) (5953) 」(5963) ・(59BA) ョ(5CF5) カ(5DD0) キ(5F21) シ(605D) ス(6085) ソ(60DE) テ(6111) チ(6120) ヌ(6213) ヘ(654E) メ(662E) ミ(663B) ゚(670E) (6AE2) (6C6F) (6D6F) @(6D96) D(6DF2) C(6DF8) F(6E39) ](7324) `(73BD) d(73D2) f(73F5) i(7429) p(7682) {(787A) 早i7FA1) 浴i83F6) 怐i856B) 。(8807) ォ(8B53) ー(8D76) イ(8ECF) オ(9067) シ(91DE) チ(9206) ヘ(9277) ヤ(92D5) 瘁i93A4) 艨i93F8) 蛛i9431) 轣i9448) 閨i9592) (9743) (9751) (9927) (9AD9) E(9BBB) 吹iFA0E) リ(FA12) u(FA17) }(FA18) (FA1C) 堰iFA1D) 秩iFA1E) (FA21) ア(FA23) エ(FA25) モ(FA27) レ(FA28) 黶iFA29) (FA2A) (FA2B) (FA2C) I(FA2D)
これらを番号なしで単純に列挙すれば、次の通り。
j m s v } | a@メ@ 戟@潤@磨@浴@栫@ 」 ・ ョ カ キ シ ス ソ テ チ ヌ ヘ メ ミ ゚ @ D C F ] ` d f i p { 早@浴@怐@。 ォ ー イ オ シ チ ヘ ヤ 瘁@艨@ 蛛@轣@閨@ E 吹@リ u } 堰@秩@ ア エ モ レ 黶@ I
ここにある文字のうちで、VJE-Delta の「人名字辞書」に含まれるものは、次の 17字。
( 私案の「VJE」の箇所も参照。これらは世間ですでに使われていると思える文字。)
m 潤@・ リ @ C ] 秩@ チ E I
ここにはいくつかの正字が見られる。 (「リC蹄」の4字 )(「」は人名漢字に対応。)
常用漢字に対応する正字を人名に使うことは、「当分の間」ということで、法律的に許容されている(いた)。 ( cf. 書籍版「小学館国語大辞典」巻末付録)
なのに、そうした文字が使えないというのは、一種の法律無視になる。困ったことだ。 (つまり、人名用の珍字はたくさん採択するが、よく使う人名用の正字は排除する、というわけ。)
漏れたうち、次の文字は、常用漢字に対応する正字。(計8字)
ス ヘ 閨@} 堰@
結局、残りは、次の 59字だけ。 (これらだけが、特に必要性を指摘できなかった機種依存文字。)
j s v } | a@メ@ 戟@浴@栫@ 」 ョ カ キ シ ソ テ
チ ヌ メ ミ ゚ D F ` d f i p { 早@浴@怐@。
ォ ー イ オ シ ヘ ヤ 瘁@艨@蛛@轣@ 吹@u ア エ モ レ 黶@
* * * * * * *
さて、ついでにちょっと、別方面から調べよう。もちろん、対象は機種依存文字とする。
JCS最終案にある「常用漢字に対応する正字」は、私の見落としがなければ、次の16字。
香@氏@潤@栫@ョ カ ク K 焉@怐@^ ~ a@ゥ キ
一方、JCS最終案にない「常用漢字に対応する正字」は、先の 4字+8字で、計12字。
リ C 秩@ ス ヘ 閨@} 堰@
16字と12字をあわせて、28字。これが正字の総数。
JCS案に収録された正字は、28字中の16字だから、約6割となる。つまり、残りの4割が漏れている。これは、機種依存文字における割合だが、常用漢字全体について調べても、同じようになりそうだ。つまり、だいたい4割ぐらいの正字が漏れていると推定される。
なお、「常用漢字に対応する正字」の総数は、1945字のうち、500〜600字程度と推定される。その4割というと、200字あまりとなる。
結局、200字あまりの正字がJCS最終案から漏れている、と推定されるわけだ。
(誤差を考えると、170字〜250字、と見ていい。)
(「2バイト欧文特殊文字」など、無意味なものを排除すれば、これらの正字は収録できる。)
【 追記 】 ( 再訂正 !)
「 」という文字(部首)がない、と以前は記したが、これは正しくなかった。
「經」の右半分の字形は、下側が「土」でなく「工」になる。そのような字形 ( UCS で 5DE0 ) は、JCS最終案にある。
一方、機種依存文字の「 」 という文字は、UCS で 5759 。これはJCS最終案にないが、特に必要性は高くないので、問題ない。 (人名用の誤字か ? )
なお、上述の「4割」というのは少な目に概算した数字なので(正確には 43% )、以前の結論から差は生じない。
※ なお、「磨vという字の下側が「土」か「工」かは、拡大しないとよくわから
ないことが多いので、注意。
※ 余談だが、「巛」は、「川」の正字で、JISにある。 5DE0 は部首ではない。
最後に
いろいろと駄弁をつらねてきたが、浅学非才の身ゆえ、間違いがあるかも
しれない。もし間違いを見つけたら、ご連絡をくださるよう、お願いします。
また、JCSへの誹謗と読める文章もありますが、これは悪口ではなくて、
一般読者向けの「お遊び」ふうの軽口なので、悪意と曲解しないよう、
関係者にお願いします。また、非礼をお詫びします。
【 後日記 】 [2000年末]
表紙ページにも記したことですが、この文書を書いた時点では、X 0213 は制定・実施されると予想されました。そのため、かなり激烈な悪口を書いてしまいました。
ところが、予想に反して、X 0213 は実施されないことになったようです。となると、本文書の悪口は、きつすぎたと反省します。
きつい悪口は、いくらか効果を波及したのかもしれませんが、あとになって読み直すと、逆に、「死者に鞭打つ」というふうにも感じられます。
今さら書き直すことはできないので、このまま公開しますが、とりあえず、悪口が過ぎたことについては、お詫びします。
※ とはいっても、この文書を公開した時点では、
「そこらの市民が勝手に、何言っているんだ。しょせん『犬の遠吠え』に
すぎない。こっちは天下の公的機関だ。蟻の声など無視してしまえ!」
「略字万歳! 正字なんていう古くさいものは消してしまえ!」
という意見が圧倒的に優勢だったんですけどね。政治的には。
(今から思えば、あとで「悪口ばかりで下品だ」なんて批判される
※ 念のために当時の事情を説明しておくと:
くらいなら、私も当時、黙っていればよかったかも。世間の大半は、
「長いものには巻かれろ」と黙ったなかで、出る杭は打たれるし。)
(また、「悪口を言わずに、上品に指摘するだけ」という手もあった。
それなら、本文書は「学術的」と見なされて、尊敬されていたかも。
でも、そのかわり、「ご意見は拝聴いたします」と言われただけで、
JCS案は可決されていたでしょうね。きっと。……その証明 :悪口
なしで学術的に述べた「私案」は、まるっきり無視された。)
JCSの最終案が公開されたのは、1999-08 のころ。予告もなしに、突然
公開されたので、知らなかった人も多い。
私が気づいて、あわてて最終案を調査し、この文書を公開したのが、同年
9月初め。以後、9月 〜 10月にかけて、少しずつ、調査と追記を加えた。
一方、JCS案の正式決定の日取りは 10月。あっという間である。その短
期間中に、意見を述べたのは、WWW上ではこの文書のほかは、前述の
「福田氏のページ」だけだったと思える。
(他にも、感想などを述べた人もいるかもしれないが、私は知らない。
実際、それが狙いで、検証期間が短かったのかも。)
(マスコミはどうかというと、朝日新聞が、JCS礼賛一辺倒であった。
『次期JISはすばらしい! 使える文字が増える! 万歳!』と。
ほとんど御用新聞状態であった。大政翼賛会ふうに。)
当然、10月中には、JCS案がそのまま正式決定されるはずだった。私さえ
黙っていれば、欠点を指摘する人はろくにいなかったのだから、正式決定
されるのは当然である。 (もしそうなったら、多くの正字は排除されたまま
となる。かくて日本語は略字に征服される。朝日新聞も大喜び。)
……ところが、突然、JCS案は上位機関で、実質的に否決された。この
ようなことは、前代未聞のことであって、多くの人が不審に思ったようだ。
(この上位機関は、JISの規格を細かく審議するところではなくて、
単に承認するためだけの機関であるから、否決などということは、
通常、ありえない。)
ただ、略字派の人は、事の意外な展開が、腹に据えかねたらしい。私の
ところに非難が寄せられたりした。今もときどき、チラホラと非難が。……
(だから私は安眠できない。)
※ なお、一般的に言えば、
「権力をもつ組織は批判されるのが当然」
と私は考える。政府や権力は、世間からの批判をたえず受けねばならない。
さもなくば、独裁者と化してしまうだろう。
JCSという「権力組織」は、批判や悪口を言われるべき立場にあるはずだ。
(でも、「お上の悪口を言ってはいかん! お上には敬意を払え!」
と怒る人もいますけどね。……ま、「南堂の悪口を言え! 南堂には
敬意を払うな!」というのは、別に、構わないんですけどね。)
[ この「後日記」は、2000年12月末 に記す。]
[ 以上 ]