~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~      ★ 後日補記 ★                     ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~     資料の「略字&正字」には記述しなかったことを補記する。       (A) 国語審議会の調査方法 (1998-06)           国語審議会がどのような調査方法を取ったか。       (B) Q&A           略字に関する質疑応答       (C) 「冉」の包摂について       (D) 「字形の変更」について         [1999.10.06.]       (E) FA明朝と78JISの字形差       [2000.07.23.]       (F) 国語審議会答申を受けての修正案     [2000.12.10.]       (G) 修正履歴                [2000.07.23.]           資料を最初に公開したあとの修正履歴。           ※ 資料の最新版では「目次」にも記述されている。  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━   (A) 国語審議会の調査方法  国語審議会がどのような調査方法を取ったかを示す。  国語審議会では、大手出版会社3社(凸版印刷,大日本印刷,共同印刷)の漢字 出現頻度数調査で上位に現れたものを検討対象とした。  詳しくいえば、次の通り。  ・ 凸版印刷で3200字まで。これを基本とする。  ・ 大日本印刷と共同印刷の資料で2000位までに独自に現れるものを追加。  ・ 法務省が平成3年から戸籍で新たに使える字体として認めた略字140字。    (これは参考)  調査対象文字数は:  ・ 凸版印刷で 漢字の延べ字数 2765万3334字  ・ 大日本印刷で         863万3570字  ・ 共同印刷で          122万2578字  これらの頻度調査とは、印刷原稿上での回数のことであって、書籍の出版点数の ことではないようだ。つまり、何十万部発行されようと、少部数発行されようと、 出現が1回なら1回と数えられる。そういうことであるようだ。  以上の調査対象から、次のものが除かれた。  ・ 常用漢字,人名漢字の異体字 (新字,旧字)  ・ 中国の人名地名にのみ使う漢字    その結果、残ったのが、978字である。  この978字について検討したわけである。  ……というのが、国語審議会の調査方法である。  ここで注目すべきは、調査対象が、凸版印刷の頻度調査の上位3200字プラス アルファに限られている、ということだ。  ということはつまり、それ以下の部分(あまり使われない漢字の集合)は、検討 対象から省かれたことになる。  したがって、これらは、検討されなかったわけであり、検討の漏れとなる。  今回、私が検討したのは、この「漏れ」となる分である。  ※ この点、誤解しないように。    検討対象となった978字から215字を取ったときに漏れが生じた、    と言っているわけではない。978字を取った時点で、そこから漏れた    ものがある、と言っている。    漏れは、国語審議会の検討段階で生じたものではなく、標本を取る段階    で生じたわけだ。(これはごく当たり前のことであるが。)  さて、この「漏れ」を検討するのに、3200字より頻度の低い文字をすべて検討 する必要はない。パソコンの略字というものは、JISの文字に限られているのだか ら、JISの文字だけを調べればよい。  特に、83JISの略字は、第一水準に限られているのだから、第一水準だけを調べ ればよい。  また、83JISの変更によって生じたものは、299字の資料がすでに知られてい るのだから、これを利用すればよい。  今回の調査では、上のような手順で、調査対象を得た。  今回の調査は、国語審議会調査を批判するものではなく、補足するものである。        ……………………………………………    【 国語審議会の報告 の参考となる wwwページ 】   国語審議会    http://www.monbu.go.jp/singi/kokugo/   毎日新聞社の記事    http://dokusyars.mainichi.co.jp/old-news/199806/24/0625m154-400.html   FONTWORKS - 週刊「字々放談」    http://www.fontworks.co.jp/n/typography/talk/084.html  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━   (B) Q&A  Q 「鴎」という字は、除くべき「人名漢字」にあたるのではないか?  A ここでいう「人名漢字」とは「常用漢字」に対置するもの。    内閣で告示した「人名漢字」であって、単なる「人名に使われる漢字」    ではない。「鴎」は単独で「かもめ」ともなる。    「人名にも使われる」漢字を除くなら、全漢字を除くことになる。       ^^  Q 「蒋」という字は、除くべき「中国人名」にあたるのではないか?   A たしかに「蒋介石」以外にはほとんど使われない。    大辞林 CD-ROM で検索したところ、該当 30 件で、「蒋介石」に合致    しないものは「蒋良騏」など若干あるが、いずれも人名。    ただし、「蒋介石」に合致しても、「蒋政権」「反蒋」などと、普通    名詞化したものもある。    そう考えてみると、「蒋介石」そのものが単なる人名名詞ではなくて、    歴史上の重要なキーワードになっていることに気づかされる。百科事    典の独立項目となるのだ。もはや単なる個人的な人名ではないのであ    る。    そこで、「なぜ人名用の漢字をはずすか」という当初の理由に立ち返    ってみれば、この種の文字は、「はずすべきものには該当しない」と    考えるのが妥当であろう。      Q 「祁」はどうなの? 用例は、地名だけじゃないの?   A ブックシェルフで検索してみたところ、地名に散見されるほか、古事    記などの万葉仮名で多用されるようだ。    まず、そもそも、「地名」は除外対象になっていない。「中国地名」    はともかく、「日本地名」は除外対象でない。そして、そのほとんど    の用例は、正字であると考えてよい。(1983年以前からある地名だか    ら。)    ただ、そもそも、話の原点に立ち返ってほしい。この文字はJISに    ある。それが肝心な点だ。「祁」の正字用例が少ないとしても、それ    より、まず、「祁」の略字用例が全然ない、という点が問題なのだ。    まったく用例のない「祁」の略字を使うことにするよりは、「祁」の    正字を使うことにした方がいいに決まっている。(だから「要変更分」    とする。「追加分」には入れない。)    とにかく、へんてこりんな略字の排除が問題なのであって、国語審議    会の作業量を減らすことが目的なのではない。  Q 国語審議会の「綬」は正字になっていないのでは?   A それはどういう意味? 「淫」の略字と正字のように、「ツ」の部分    を、下に広がる形にしろ、ということ?     いいかげんな質問する前に、まず、漢和字典を見てください。そうす    れば、間違った質問を出さずに済みます。  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━  (C) 「冉」の包摂について  data-add.htm では、表の「冉」のところで、次のように記述した。 > 「冉」部の字形統一。「 媾 搆 稱 苒 覯 遘 」が該当。 > 「冉」の字形差は、両字体が広く使われているので、異体字と見なして > 区別するのは適当でない。厳密にはデザイン差や狭義の包摂とは異なるが、 > それと同等と見なす。  しかしこれは、他の箇所と矛盾する。というのは、別表の右の欄で、「溝」 の新字・正字を区別することにしているからである。これと不統一となる。    つまり「溝」については、「略字・正字を区別する」という方針を立てながら、 他の「冉」と「 媾 搆 稱 苒 覯 遘 」については、「略字・正字を区別しない」 としているわけで、論旨が不統一である。  となると「 冉 媾 搆 稱 苒 覯 遘 」についても、「略字・正字を区別する」 とした方がいいかもしれない。  ただし、人名漢字である「溝」についてだけ、「これは例外扱いとする」(新 字・正字を区別する)としてもいいかもしれない。(これは現状。不統一である が。)  あるいは逆に、「すべて包摂の扱いで、いずれも区別しない」としていいかも しれない。  いずれにせよ、いろいろと考えるべきことが多くなる。話は簡単ではない。 ここでは、問題点を指摘しておくだけにとどめる。  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━  (D) 「字形の変更」について  betu-hyo.htm や conc-jis.htm では、字形の修正をするべき分と、追加分と を、具体的に示した。  ただ、そのあと、Unicode との関係を考慮して、以下のように修正する。   ・ 字形の変更をすると、Unicode との関係が問題となる。   ・ そこで、次のようにする。     (1) 原則として、Unicode上においても、同時に字形の変更をする。     (2) ただし、Unicode ですでに正字がある文字[「鴎」など]に       ついては、字形の変更をせず、正字を追加する。(字数は僅か。)  以上のことにより、Unicode との対応でも混乱なく、字形の変更をすること ができる。   ※ Unicode における字形は、国別に異なっている。(それが「統合」     の意味。) だから、日本が独自に字形の変更をしても、差し支え     ない。そもそも、83JIS の略字のほとんどは日本で新たに発明され     たもの。  なお、字形の変更をしても、従来の略字は、「副規格」として利用が可能 である。つまり「MS 明朝"略"」などというフォントを使えば、従来のまま、 略字を利用できる。また、現在の83JISのフォントも、そのまま利用して よい。これらの略字の規格を、排除することはせず、共存させる。  ただ、それは、あくまで「規格の共存」である。JCSのように「同一の 文字として包摂する」わけではない。仮に「包摂」であれば、文字ごとに、 略字にしたり正字にしたり、チャンポンに混ぜてもいいわけだが、そうはし ない。通常は正字となり、一方、「略字」と明示した場合には"一括して"略 字となる。  ※ 上の"一括"という点に注意。それゆえ、タグ字により略字フォント上    の字体差を明示できる。(個別の「包摂」ではそうは行かない。)  ※ 略字にする範囲は、「299+2字」など、いろいろと考えられる。朝日    字体のように、JIS第二水準まで一括して略字にする、という強い    略字フォントの副規格も許容してよい。     この意味で、私の方針は、略字を排除するものではない。あくまで、    混乱を避けることを優先する。JCS案のように「正字を追加」とし    た場合、ひどい混乱が起こることは、「略字 侃侃諤諤」などで、すで    に述べた。  [付記]  字形の変更をする理由は、「略字 侃侃諤諤」に詳しく述べた。   「字形の変更をすると、83JISの"コードポイントの交換"の二の舞だ」  などと勘違いしている人は、上記ページを読んでほしい。  簡単に言えば、字形の変更の理由は、「文字化けを防ぐため」である。現在、 「鴎外」などは、正字で書いているつもりなのに、略字に化けてしまっている。 こうした文字化けを修正したいわけだ。「誤字の修正」と同様に。  83JISでは、いくつかの文字で、「誤字の修正」をした。おかげで、今日、 「この文字は使ってはいけない。正しい別の文字を使うべきだ」などと、妙に 気苦労せずに済む。  もちろん、83JISの「誤字の修正」を批判する人はいない。   ※ ただしJCSだけは別。JCS案では、誤字をそのまま残す、という     方針を打ち立てている。よほど誤字が好きらしい。類は友を呼ぶ。  [付記]  「字形の変更」を原則とするからと言って、従来の略字を残すことは、必ず しも妨げられない。私見では、「榊」のように、略字が人名で多用されている 文字は、別扱いにして、「字形の変更」でなく、「正字の追加」にしてもいい、 とも思う。  これに該当するのは、betu-hyo.htm の左上の欄のうち、次の文字だろう。     葛 榊 樽 鄭 灘 楢 樋 鱒 餅 芦  これら10字は、略字が人名で多用されていると思えるので、「正字の追加」 としてもよさそうだ。( 10字はあくまでおおよそのメド。変更の余地あり。 なお、この10字については、人名字が多用されていることを確認済み。)  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━  (E) FA明朝と78JISの字形差       [2000.07.23.]  FA明朝と78JISとは、実は、同じではない。この点について、読者から ご教示を得たので、修正する。  読者(高橋洋八 氏)からのご指摘によると、NECの「FA明朝」は、78 JISの字形とは同じではない。このことはNEC自身が認めている。  今回の話で問題となるのは、次の4字である。       「概」「冴」「捌」「蛛」  これらについては、私の記述では、「78JISと83JISで字形差はほとん ど見出されない」と示していた。(今までは)  その記述の元となったのは、78JIS字形はNECの「FA明朝」であり、 83JIS字形は「MS明朝」であった。この両者の字形を比較したわけだ。  ところが、読者のご指摘によると、「FA明朝」は、78JISの字形と同じ ではない。上の4字は、「FA明朝」では、(78JIS文字セットを選択して いるにもかかわらず)、78JISの字形でなく83JISの字形が出るのだそう だ。しかも、これは、NECの故意による設計によるらしい。   (つまり、78JIS字形でも83JIS字形でもない、それらのチャンポン    であるような文字セットを、NECは「78JISの文字セット」として    公開しているわけだ。)  どうしてNECがこういう奇々怪々なチャンポンをしたのかは、不明である。 たぶん、「83JIS字形の方が一般的だから、こちらを使え」と思ったのだろう、 と推察はつく。しかし、それならそれで、もっとまともなチャンポン文字セット をつくるべきだったろう。たとえば、   ・ 78JISにある誤った字形[誤字]を83JIS字形に訂正する   ・ 78JISにはない記号[数学記号など]を追加採択する  こういうチャンポンをするのならば、まだわけがわかる。しかし、そうでなく、 ごく一部だけの変更をしたチャンポンな文字セットを公開したわけだ。このあた りは、理解に苦しむ。   [ 参考 1]    上の4字の字形差は[78JIS/83JIS]で、次の通り。    ・冴 ……[「牙」の左側縦線が斜めに傾く/傾かずに直立する]    ・概 …… 上の 「冴」 と同様    ・捌 ……[「万」の部分の「一」が「ノ」に、くっつかない/くっつく]    ・蛛 ……[「朱」の部分の中央縦線が、はねる(亅)/はねない(|)]   [ 参考 2]    上の4字以外でも、FA明朝と78JISの字形差が見られるものがある。    審議会表以外の分(data-add.htm)では、上の4字だけのはずだ。    審議会表にある分(data-215.htm)にも、いくらかある。たとえば、         「逢」「芦」「辻」「迄」    この4字は、78JIS規格書の第1刷に依拠しているので、83JISの    字形になっている。      (ただし、私の公開した資料にある画像では、当初から訂正済み。       この画像では、審議会表の文字として、国語審議会の示した画像       の字形と照合してあるので、ミスはないはずだ。)   [ 参考 3]    上の4字のうち、特に「捌」については、若干、追記したことがある。    それについては、 data-add.htm の「捌」の解説を参照してほしい。     (代表字形に関する記述。)   [ 参考 4]    本項に述べた修正にともない、 data-add.htm の記述を変更した。    また、 data-add.htm の画像も若干変更した。    (画像はこれまで NECのFA明朝の字形だったが、正しく78JISの     字形に直した。)    ※ 《 付記 》      本項の修正は、前記の読者に全面的に依拠している。      感謝の意とともに、ここに付記しておきます。  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━  (F) 国語審議会答申を受けての修正案     [2000.12.10.]  国語審議会では 2000-12-08 の答申を出した。これを受けて、JISでは 「字形の変更」(パソコン略字から正字への変更)をする見通しとなった。  さて、これを受けて、文字講堂においても、従来案に若干の追加・修正を 施したい。  旧来の案では、「字形の変更」の例外として、次の2項目を挙げていた。    ・ unicode にすでに正字があるもの:       鴎 (などの若干字)    ・ 78JISでも略字であったもの:       嘘汲饗倶箭揃歎簾逞叛      (cf. 「略字&正字」の betu-hyo.htm)  さて。私がこれらを例外扱いとしたのは、略字主義者に配慮して、遠慮した ためであった。どちらかといえば、政治的な妥協としての案である。  しかし、国語審議会は「略字排除」の方針を打ち出し、JISの側でもその 立場を取ることとなった。ならば、勝ち戦である以上、遠慮はいらない。上記 の2項目の文字もすべて、略字から正字にしてもいいと思う。   ※ ただし、明確には主張しない。私としては、どちらでもよい。     つまり、上記の文字については、略字のままでも、正字に直しても、     どちらでもよい。  その他、追記すべきことがある。  国語審議会の正式答申では、中間報告(1998-06)のときとは、簡易慣用字体 が異なる。中間報告では34字であったが、正式答申では22字となった。列挙 すれば、次の通り。       唖頴鴎撹麹鹸噛繍蒋醤曽掻痩祷屏并桝麺〓芦蝋弯       (注:「〓」は「さんずい+戸」)  したがって、簡易慣用字体は、資料の「略字&正字」に記述したところとは、 いくらか異なる。その点に注意されたい。   ※ 本来ならば、「略字&正字」の本文の記述を修正・付加すべきである     が、面倒なので、そちらには何も書かず、ここに注記しておくだけに     する。読者のお手数については、お詫びします。   ※ 上記の簡易慣用字体に対する正字の字形は、資料の「略字&正字」の     data-215.htm に示してある。(画像で)  ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━  (G) 修正履歴 (資料「略字&正字」の)    (1) 「頓」という字は、「要変更分」から「現状維持分」の欄へ移した。       というのは、「噸」と同様の理由をもつので。    (2) 「柵 珊」の2字は、「要変更分」から「現状維持分」に移した。       というのは、83JISが正字で、78JIS字形は異体字であるから。       それにともない、記述などを変更した。    (3) 「珊」は、「冊」の中央横線が突き出ていない別体字があるので、       その記述を追加した。     (4) 「data-ext」(遺漏分)にある「JISに旧字のある文字(新字体)」       において、「人名」と「常用」の区切りがずれていた。「亜」という       文字が間違って「人名」の欄にあったので、直した。    (5) 国語審議会の用字調査の対象を「凸版印刷」としたのは誤りで、      正しくは、「凸版印刷など(大手印刷会社3社)」。 (修正済み)      なお、この3社とは、「凸版印刷,大日本印刷,共同印刷」のこと。    (6) 修正と言うほどではないが、「册」「并」という文字はある。本文      中では、これらの字形をいちいち記述したが、直接この字形を示して      もよかった。(「柵」「迸」の説明のところで。)    (7) 別表の左上の欄に「兔」の文字があるが、これは正しい。      一方、右上の欄にも同じ文字が重複してあったが、こちらは誤り。      ゆえに、最新版[99.8.05.]では、右上の欄の「兔」を削除した。      これにともない、右上の欄の文字数を 33字 → 32 字と変更。      conc-jis.htm に記してある該当の文字数も、それぞれ変更した。    (8) 「昂」という字は人名漢字表には含まれない、と記述したが、      これは勘違いであった。この字は人名漢字表に含まれる。      最新版[99.11.04.]では、その旨、記述を変更した。      ( 該当のファイルは、 data-add.htm )。    (9) 上では 「 data-add.htm の記述を変更した」と記したが、実際      には、変更されていなかった。(手違いで、古いファイルのまま      公開してしまった。)      そこで、あらためて data-add.htm の記述を変更して公開した。      [2000.07.23]          (10) 「概」「冴」「捌」「蛛」の4字について data-add.htm に      おける記述(字形差の説明)を、変更した。      この点については、詳しくは coderya2.txt (この文書)の      最後の方の (E) で説明した。そちらを参照。  [2000.07.23]    (11) 国語審議会の正式答申(2000-12-08)を受けて、旧来の記述に      若干の追加・修正を、この補足文書で加えた。      (本体の「略字&正字」の方は、そのまま。)  [2000.12.10.]                              [ 了 ]