ルビのために
このホームページは、ルビについての情報を示します。
目次
(1) ルビの語源
(2) ルビの目的と効用
(3) ルビの用い方
(4) 問題解決用のソフト
(5) ルビの設定
(6) その他のソフト
(7) 互換性
(8) HTMLファイルでルビを使う方法
(9) ルビ用ソフトの入手先
(10) ルビなしにするなら
[付] HTMLと unicode のルビタグ ( 【 追記 】 あり )
[付] ルビと傍点(圏点・脇点)
(1) ルビの語源
フリガナ(振り仮名)を、ルビと呼ぶ。ルビという言葉を使うのは、印刷業界の語法による。
印刷業界では、ルビとは、そもそも単に活字のサイズのことを意味していた。五号活字に用いたフリガナ用の活字のサイズが、七号活字であり、これが印刷業界では、ルビと呼ばれたのである。
ではなぜ、印刷業界では、七号活字をルビと呼んだか? それは、七号活字が英国で「ruby」と呼ばれる活字と、ほぼ同じ大きさだったからである。
【 注記 】
ruby という活字サイズは、英国では5ポイント活字を意味し、米国では3ポイント活字を意味するのだそうだ。[ 小学館「プログレッシブ英和中辞典」 による。]
ただし、日本語の「ルビ」は、英国の方から転用されたので、5ポイント活字である。
なお、三省堂「大辞林」によれば、主に4〜6ポイントの小活字だという。
また、学研「国語大辞典」によれば、5ポイントではなく、5.5 ポイントである。
また、岩波「英和大辞典」によっても、5.5 ポイントである。どうやら、この数値が一番確からしい。
※ なお、あとで調べたところでは、下記サイトに、詳しい対応表がある。
http://www.apricoweb.ne.jp/museum/fonthouse/tips22.html
さて、それではなぜ、英語ではその小さなサイズの活字を、ruby と呼んだか? これについては、私のおぼろな記憶によれば、たしか、印刷業界の隠語だったはずである。つまり、いちいち数字で活字サイズを示すのでは、間違いが起こりやすい。たとえば、
「1号活字取ってくれ」
「はいよ、7号活字ね」
なんていう聞き間違いを起こしやすい。こうした間違いを防ぐためにも、特別な名称で呼ぶことは便利であったはずだ。(英語では「いち」「しち」の聞き間違えはないが、かわりにtwo, four, eightなどの語をtoo, for, A などと混同しやすいのではないか、と推察される。)
ついでながら、昔、電信を使ったときには、「A,B,C……」の羅列を示すときに、電信局の口頭で、人名や地名による読み替えを行なったらしい。たとえば、「Mary , Elizabeth , Nancy」と発音して、「MEN」を示す、など。
また、今でも米国では台風の名を、1号、2号、……などと呼ぶかわりに、キャサリン、ジェーン、……などの名で呼ぶ。(日本も昔はアメリカ式だったらしい。)
そういうのと同様にして、印刷業界では、活字サイズの別称として、宝石名を用いたのだろう。たとえば、 pearl , diamond , emerald などの言葉が用いられている。これらは印刷業界で、それぞれ固有の活字サイズを意味する。(岩波英和大辞典で確認。)
なお、ついでに言えば、ruby という英語の語源は、ラテン語の rubeus であるが、これは reddish (赤っぽい)を意味する。 ruby , red , rouge(フランス語の「赤」で「口紅」の意も)は、ひょっとしたら、親類関係にあるのかもしれない。(これは当てずっぽうだが)
余談だが、ruby の英語発音は「ルビー」ではなく「ルービ」である。
(2) ルビの目的と効用
ルビの目的は何か? 漢字の読み方を知らない人に読み方を教えることだ、と誤解している人も多い。だが、そうではない。
読者にいちいち国語教育するためにルビを用いているわけではない。もし国語教育が目的なら、常用漢字のすべてにルビを付けるべきだろう。たとえば、小学生用の新聞のように。
つまり、ルビに教育的効果があるとしても、それはあくまで副次的なことだ。ルビの主目的は別にある。
では、ルビの主目的は何か? それは、漢字にカナを付けることではない。逆に、カナに漢字を付けることである。
たとえば、
「彼らががい骨を見た」
なんていう表記も、ルビを用いれば、
がいこつ
「彼らが骸骨を見た」
と漢字で表記できる。
つまり、「がい骨」「終えん」「語い」なんていう妙なカナ漢字交じりの表記を避けること。それが、ルビの目的である。
※ いくつかの新聞社では、前記のような妙なカナ混じり表記をしばしば用いる。
たとえ組版システムがルビに対応しても、いまだにこうした表記を用いるのだから呆れる。
システムより、頭に問題があるようだ。たとえば「子ども」と書く。これなど、「子」に対する
侮蔑的な表現としか思えない。愚か者どもにはわからないだろうが。
※ なお「終えん」「語い」というのは、「しゅうえん」「ごい」と読むよりも、むしろ
「おえん」「かたらい」と読むべきかもしれない。書き手がそのつもりで書いて
いるならば、私は別に文句は言わない。
ルビはこのように、漢字の使用の幅を広げてくれる。そのことで、語彙を豊かにして、表現を豊かにできるのが、ルビの効用である。
「終焉」 → 「おしまい」
「静謐な」 → 「静かな」
「麗しの」 → 「美しい」
などと、いちいち平易に言い換えていったら、日本語は貧しくなってしまう。こうした日本語の貧困化を避けることが、ルビの効用である。
【付記】
しかしこのことに、一部の人は異論を唱える。
「難しい漢字は使うべきでない。漢字はわかりやすいものだけを使えばよい。単語も簡単な単語だけ使うことにすればよい。だから、ルビも不要だ」
こういうふうに唱えたい人は、シェークスピアや三島由紀夫のような文豪に向かって言えばいい。
「あなたの作品は難しい単語がいっぱいある。平易な言葉だけで作品を書いてくれ。つまり、お子様ランチみたいな作品だけを」
ついでに、数学の専門家に向かっても、同じようなことを言うがいい。
「難しい高度な数学は不要だ。足し算と引き算さえあれば十分だ。微分や積分なんて学問は廃止せよ」
とはいえ、世の中には、こういう人がけっこういるものだ。自分の言語レベルの低さを恥じるかわりに、世間の言語レベルを、自分のレベルまで引き下げようとするのだ。
実に恥知らずで、傲慢である。しかし、こういう人に「傲慢だ」と言っても、無駄だろう。言語レベルが低くて、「傲慢」という単語を知らないので、「え? 何それ?」と聞き返されるのがオチだろう。
【付記】
以上のことは、あくまで小説などの文学における話である。
新聞記事などの実用的な文章においては、話は異なる。妙に芸術家気取りになるよりは、平易な文章で書く方が好ましい。ごく普通の実用的な文章のなかで、「終わり」と書けば済むところを、「終えん」と気取って書く記者もいるが、妙に気取らないでほしいものだ。本人は得意で鼻高々なのだろうが、その臭さが、鼻につく。 (ただし「終えん」なんていうカナ混じりの三枚目な表現を使っているところを見ると、気取っているのではなく、馬鹿をやって 道化ているつもりなのかもしれない。)
(3) ルビの用い方
ワープロ専用機やコンピュータでルビを使うことは、昔は難しかった。単に 1/4 サイズの文字(上付・下付)を、行間に置いただけだった。
このやり方では、印刷はできても、本文の文字挿入・文字削除に対応しない。つまり、これでは、ルビを印刷はできても、ルビ機能はないに等しい。
ただし、現在のパソコン上のワープロソフト(一太郎・MS-Wordなど)では、この問題はない。ルビと漢字は一体化しており、文字の挿入・削除に対応して、ルビは漢字と一緒に動く。
とはいっても、パソコン上のワープロソフトが完全にルビに対応できているわけではない。
なぜか? ルビつきの漢字は、その部分が「文字ではなくなっている」ことがあるのだ。たとえ形の上でルビと漢字が表示されていても、そのように見えるだけで、データとしては、文字にはなっていないのだ。
これは、MS-Wordでは顕著である。MS-Wordでは、ルビつきの漢字部分が、文字ではなく「フィールド」という特殊な領域となっている。そのため、次のような不具合が生じる。
・ 文書校正機能をすると、その「ルビ+漢字」部分が欠落していると見なされる。
・ txt ファイルで保存すると、その「ルビ+漢字」部分が丸ごと消えてしまう。
【 注記 】
一太郎の場合は、前者の問題は生じないが、後者の問題は半分だけある。つまり、 txt ファイルで保存すると、(漢字は残るが)ルビの部分は消えてしまう。
市販のワープロソフトには、このような問題がある。その意味で、現在のパソコン上のワープロソフトは、ルビを正常に扱えない、と言ってよい。
(4) 問題解決用のソフト
とはいえ、現実には、これを解決する手段がある。
MS-Wordでは、前記のような問題が生じるが、この不具合を解決するソフトが、フリーソフトとして公開されている。
このフリーソフトを用いれば、前述の不具合は一切なくなる。つまり、ルビは問題なく使えるようになる。
なお、MS-Wordには、「ルビを使うと、行間隔が狂ってしまう」という問題がある。ルビのある部分だけ、行間隔が広がってしまう。印刷すると、見苦しくなる。
この問題も、前記のフリーソフトを利用すれば、簡単に解決できる。
なお、このフリーソフトの入手先は、最後に記した。
(5) ルビの設定
市販のワープロソフトでは、ルビを設定するのに、やや面倒な手続きが必要となる。ワンタッチとは行かない。
しかし、この点は、比較的簡単に解決が付く。ワープロのカスタマイズ機能を使って、ルビの設定をキーボードのファンクション・キーに割り当てるのである。たとえばF7キーに「ルビ設定」を割り当てる。
こうすれば、F7キーを押すだけで、あとは簡単にルビを設定できるようになる。
※ このようにカスタマイズ機能を使うには、解説書やヘルプを参照。
ただし、先にも記したソフトを使えば、初めからルビはF7キーに設定されているので、
いちいち設定する手間はなくなる。
(6) その他のソフト
ルビを使うには、MS-Wordや一太郎などのワープロソフトを使うのが普通である。これらは広く普及している。企業や学術関係なら、どちらかがあるはずだ。(もっとはっきり言えば、MS-Wordの方が普及している。特に企業では。)
どうしても txtファイル(とエディタ)でルビを使いたいなら、QXというエディタで使える。しかしこれだと、たとえば、
彼らが{ルビ がいこつ}骸骨{/ルビ}を見た。
というふうに示すので、見やすいとは言えない。あくまで特殊な用途のためだろう。
また、QXというエディタ自体が、MS-Wordや一太郎と比べると、ほとんど普及していない。互換性を考えても、やはりあまりお勧めできない。
ワープロ専用機もある。
だが、これについては、何か言っても仕方あるまい。使っている人はそのまま使うだろう。パソコンのように「ソフトを買い換えれば済む」というものではないからだ。
ただ、ワープロ専用機の文書は、互換性に問題がある。たとえファイルのコンバータを用いても、ルビについてまでは互換性を保てないことが十分ありうる。というわけで、他人とルビのあるファイルをやりとりするなら、ワープロ専用機よりは、パソコン上でワープロソフトを使う方がいいだろう。
なお、出版用の原稿の元となる電子ファイルとしてなら、どのファイル形式でもあまり問題ないようだ。たいていの場合、組版システムが、ワープロソフトのルビには対応していないらしい。そこで、いったんただの txt に戻してから、いちいち手動であらためてルビを入れているらしい。つまり、電子ファイルにあるルビは無視される。 ( 参考情報1 )
とはいえ、今は組版システムがワープロソフトのルビに対応していないとしても、将来的には、対応可能になりそうだ。というわけで、将来を考えるなら、やはり、ワープロ専用機よりも、パソコンのワープロソフトを使う方がいいだろう。
なお、「どうしても今すぐ」というのなら、「TeX を使う」という手もある。 TeX は、ワープロと違って初心者には扱いにくいが、組版システムに組み込みやすいという美点がある。 ( 参考情報2 )
余談だが、数式については、ロータス・ワードプロに、TeX へのコンバータが付いている。こうして数式のある文書を作成すれば、印刷へ回すのが楽になる。 (この場合、文章は txt で書いて、数式だけ TeX にする。)
(7) 互換性
文書の互換性を考えるなら、MS-Word形式(またはRTF形式)がベストである。
MS-Word形式(またはRTF形式)のルビ入り文書は、一太郎の9以降で読みとれる。(一太郎8はダメ。)
一太郎形式のルビ入り文書は、MS-Word95,97,98のいずれでも読みとれない。
というわけで、MS-Word形式かRTF形式がよい。
この二つのうち、どちらがいいかと言えば、RTF形式の方が好ましい。こちらの方が互換性の範囲が少し広い。何より、ウイルスに感染しない、という美点がある。MS-Wordファイルはウイルスの感染の危険があり、他人には渡さない方がよい。渡しても、拒絶される可能性がある。RTFファイルは、ファイルサイズが多少増えるが、圧縮すれば大差はなくなる。
なお、これは言うまでもないことだが、ワープロの形式で保存する際は、なるべく古いバージョンの形式を用いるべきだ。(他人に渡すときは、だが。)新しいバージョンの形式だと、古いソフトしかもっていない人は読みとれない。また、新しいバージョンの形式だと、ファイルサイズがやたら大きくなることも多い。特に、Word97 ,98形式のファイルは、嫌われているので、避けるようにしたい。(Word95 形式 または ワードパッド形式 の doc ファイルならば、問題ない。ただしワードパッド形式はルビを使えない。)
(8) HTMLファイルでルビを使う方法
HTMLファイルでルビを使うことは、あまりお勧めできない。なるべくMS-Word形式(またはRTF形式)のファイルをそのままインターネット上で頒布することをお勧めする。
どうしてもHTMLファイルでルビを使いたければ、先に述べたワープロ専用機の方法を使うしかない。つまり、行間に小さな文字を置くわけだ。しかしこの方式は、文字の位置がずれたり、いろいろと問題がある。通常の文書にはまず無理で、1行ごとに改行をする詩や和歌や例文などでしか使えまい。
どうしてもこの方法を使うなら、次の点に注意することが必要だ。
・プロポーショナルフォントでなく、固定ピットフォントを使う。
・位置の指定には、半角空白でなく、全角空白を使う。
このようなHTMLファイル上のルビの例としては、次のホームページを参照。
新訳「悪の華」 (ボードレールの訳詞)
【 付記 】
ここでは、HTMLファイルだけでなく、ワープロファイルについても、行間に小さな文字を使う方法を用いている。これは、ワードパッドのように、ルビを扱えないソフトでも読みとれるようにするためである。なお、このような方法が使えるのは、1行ごとに改行が入る詩だからである。
なお、参考までに、言い添えておく。
HTMLファイルでルビを使う規格は、現在、検討中であるそうだ。(もしかしたらすでにできているかもしれない。)だから、将来は、HTMLファイル上でも使えるようになるかもしれない。
だが、実際に使えるのは、かなり先の話である。なぜなら、規格が定まっただけではダメで、その規格に対応するソフトが普及していなければならないからだ。というわけで、HTMLで正式のルビを使うことは、当分の間は無理のようだ。
ところで、ルビという形式にこだわらなければ、HTMLファイル中に漢字の読みを入れる方法は他にもある。それは、たとえば、
彼らが骸骨(がいこつ)を見た。
というふうに、ひらがなを付加する方式である。なるべく多くのマシン環境での互換性を最優先するなら、この方式がベストである。
これにも、二つの方式がある。
・一つは、今述べた例のように、読みを、小さな文字で記す方法。
・もう一つは、読みを、本文と同じ大きさの文字で記す方法。
もちろん前者の方が好ましいが、やり方がわからなければ、特にこだわることもあるまい。実際にやるには、ワイルドカードの置換などの手続きが必要なので、初心者には少々、ハードルが高い。
【付記】
ワイルドカードを使う具体的な手順は、ここには記さない。ワイルドカードをすでに使える人ならば、すぐに自分でわかるだろうし、使えない人ならば、説明しても困難だろう。
ただ、念のために、少々言い添えておく。 後述のように < や > という半角記号があると、ワイルドカードは使えないはずだ。その場合は、< や > という半角記号を、いったん適当な全角記号に全置換しておく。そのあと、ワイルドカードで、漢字の読みの箇所をすべて小さなフォントにする。(ワイルドカードによる書式置換。) そうしてから、先に全角記号に全置換した箇所を、すべて元に戻す。
なお、ワイルドカードを使えなくとも、HTMLファイル上でソースをいじっても、適当に置換処理により、うまくできるはずだ。そのやり方は、わかる人なら、わかるだろう。
なお、このような形式(漢字+小さな文字の読み)を使った文書の例は、次で入手できる。
皇后陛下の講演 (IBBY基調講演)
さて、今ここに、ルビ入りのMS-Word文書があるとする。
そういう場合は、この文書を適当に変換して、「漢字+読み」の文書を作ることは、簡単である。
それには、前述のフリーソフトを用いる。このソフトを使えば、文中のあらゆるルビ箇所について、たとえば、
彼らが骸骨<がいこつ>を見た
というふうに、自動的に「漢字<読み>」の形式に変換してくれる。
あるいは、読みを削除して、単に
彼らが骸骨を見た
というふうに変換してくれる。
( 「漢字」 と 「漢字<読み>」 のいずれにするかは、ユーザが指定できる。)
結局、このソフトをもっていれば、たいていの問題は片が付く。
(9) ルビ用ソフトの入手先
先に述べたように、MS-Word用のルビの問題を解決するソフトがある。
(MS-Word用のみ。一太郎用はない。)
これの入手先は、下記。
MS-Word用フリーソフト ( 上級者用/初心者用 )
このソフトは、非常に多くのユーザがいるが、特に問題は見つかっていない。
なお、このソフトを使うと、文中の漢字に対して、一挙にルビを付けることもできる。たとえば、文中にたくさんの「骸骨」という文字がある場合、それらに一挙に「がいこつ」とルビを振れる。
また、「骸骨」「終焉」「静謐」などというリスト(ルビつき漢字のリスト)をあらかじめ作っておけば、文書にある何種類もの語に一挙にルビを付けることができる。
【付記】
ここからリンクをたどると、「MS-IME ,ATOK 用のソフト」を入手できる。
このソフトを使うと、 「ゐ」 「ゑ」 を 「YI」 「YE」 という打鍵で入力できるようになる。
(なお 「WI」 「WE」 は、「うぃ」「うぇ」である。これは通常と同様。)
というわけで、文語のカナの「ゐ」「ゑ」を楽に入力できるようになる。
ただし、このソフトを用いなくても、自分でローマ字カスタマイズができれば、
自分でそう設定してもよい。(やり方は、ヘルプなどを参照のこと。)
(10) ルビなしにするなら
「どうしてもルビつきはイヤだ」「漢字カナ混じり文がいい」──そう言う人もいるかもしれない。(特に新聞記者などで)
それならそれでもいい。だが、せめて、「ひらがな」はやめて、「カタカナ」にしてもらいたいものだ。
たとえば、
「終えんだ」 → 「終エンだ」
「語いが」 → 「語イが」
など。これならば、その部分が漢字の一部分だと理解されるので、助詞や送りがなと混同されずに済む。
そもそも、昔はこのようにカタカナで書いていたのだ。それが、いつからか、「終えん」なんていう(ひらがなの)書き方をするようになった。「人類の言語能力は退化するばかりだ」という説があるか、その一例かもしれない。
このような「漢字・ひらがな混じり文」は、小学生の文章によく見られる。
「きょうは学こうへ行きました。こう長せん生が朝れいでお話をしました」
など。今の新聞記事というのは、だいたい、こういうレベルである。
日本の新聞も、せめてカタカナの使い方ぐらい、まともにできるようになってほしいものだ。とはいえ、「true」を「トゥルー」と書くくらいだから、とても無理だろう、とは思うが。
【 余談 】 国名の表記
新聞の書き方といえば、「日露」を「日ロ」と書くのは困りものだ。この伝で行くと、米国や英国とは「日ユ」になり、イタリア(伊)やインド(印)とは「日イ」となり、カナダとは「ニッカ」になるかも。
ま、カタカナも、ひらがなも、漢字も、みんなメチャクチャだ、というのなら、それはそれで、新聞もちゃんと統一が取れているのかもしれない。
【 追記 】
読売新聞は、98-12-30 以前の記事では「日ロ」と書いていたが、99-01-03 以降の記事では「日露」 に変えた。えらい! 見識がある!
もしかして、このホームページを読んだから???
ついでに言えば、読売は正字も(ルビといっしょに)よく使う。ま、自分の会社の名前も、正字ですしね。保守的に見えて、けっこう頭は進んでいるんですね。コンピュータ関連の記事も多いし、時代の流れに乗っている。
なお、朝日の方は、 99-02-21 の記事でもなお、「日ロ」という表現を使っている。朝日って、ルビもなかなか使おうとしないし、進歩的に見えて、頭は古いんですね。
※
読売新聞の表記法変更については、99-1-29 の朝刊一面コラム「編集手帳」に記述がある。
・ 以前は帝政ロシアとの区別で、〈 露 〉から〈 ロ 〉に変えた。
・ しかし「くち」と読み間違えやすいので、1月から〈 露 〉に戻した。
という意味のことが記してある。ま、当り前のことばかりで、特に情報があるわけではない。
( 「くち」と読み間違えやすいという点は、数年前からわかっていたことである。
なのに、なぜ 今になって 急に変更したかは、記事には記されていない。)
ただ、「帝政ロシアとの区別で〈 露 〉から〈 ロ 〉に変えた」というのは、もっともなようでいて、あまりにひどい論理である。(誰がこんなことを考えたのか知らないが。)
そんなことを言い出したら、政体が変化するたびに、国名表記を変えなくてはならなくなる。たとえば日本自身、長い歴史の上では、卑弥呼、豪族、貴族、武家、朝廷、軍、GHQ、……などと、さまざまな政体の変化があった。そのたびに国名表記を変えていたら、キリがない。「日本史」という言葉自体が成立しなくなる。「政体が変化するたびに、国名表記を変える」というのは、あまりにもでたらめな方針である。 (こういう態度は、言葉というものを軽んじているとさえ言える。一般に、物事はコロコロと変化するが、それを示す言葉はたやすく変化してはならないのだ。万物は無限であり、言葉は有限である。おお、ホレーショ。)
そもそも、「ロシア」とか「露」という表記は、日本語なのだから、いちいち相手国の事情にあわせて変える必要はない。ちなみに、英語表記ではソ連さえ、昔からずっと「 Russia 」であった。
ソ連解体以前の西側英字新聞はソ連を、「 Soviet 」とは表記せず、「 Russia 」
と表記した。これは俗称ふうの表記だが、正式名称の「 USSR 」は公式の場合
以外ほとんど使われなかったようだ。
[付] HTMLと unicode のルビタグ
※ 以下は、やや専門的な話です。一般の人向けではありません。
HTMLでルビが使えるように、ルビタグというものが検討されているそうだ。(将来の話)
これを用いると、たとえば、次のようにソースを記述する。
骸骨<ruby>(がいこつ)</ruby>を見た。
このソースを、ルビタグ対応のブラウザで見れば、正しくルビが表記される。
一方、ルビタグ非対応のブラウザで見れば、タグが無視されて、次のように表示される。
骸骨(がいこつ)を見た。
このように、ルビタグ非対応のブラウザで見ると、ルビ部分がカッコで囲まれる。だから、そうなるように、ソースにおいては、カッコでカナを囲むことが大切である。[対応ブラウザでルビを表示するときは、カッコを省いて処理する。]
もしソースにおいてカッコを用いないと、次のようになる。
骸骨がいこつを見た。
これでは何のことやらわからなくなってしまう。( 「骸骨が遺骨を見た」?)
もっとひどい例だと、次のような例文もある。
彼女は薔薇になった → 彼女は薔薇ばらになった
葉山のそばだから → 葉山はやまのそばだから
次に発言しました → 次つぎに発言しました
野原が空っぽだ → 野原のはらが空っぽだ
高そうな諸刃だ → 高そうな諸刃もろはだ
瓦をもってこい → 瓦かわらをもってこい
この話にしたい → この話はなしにしたい
このように、カッコを使わずにルビタグを用いることは、混乱を招き、問題がある。
しかし、だからといって「ルビタグを用いるな」ということにはならない。カッコを併用すれば、問題なく使えるからである。
【 追記 】 仕様の現状
実は、ルビタグを使うには、もう少し違った方法が必要となる。(前述の方法は、わかりやすく簡単に示しただけで、実際には、ちょっと別の方法にする。)
前述の方法では、ルビの部分だけをルビタグで指定した。しかし、実際には、ルビだけでなく、ルビのかかる元字(たとえば「骸骨」という漢字)も指定する必要がある。さもないと、そのルビがどの漢字にかかるか、わからないからである。
これを明示するには、次のようにして、漢字とカナをともに指定すればよい。
<ruby><rb>話<rt>(はなし)</ruby>
つまり、要点は次の三つ。
・ 全体を <ruby> </ruby> で囲む。
・ <rb> のあとに漢字を記す。
・ <rt> のあとに読みのカナを記す。
これが、現時点(1999-02)における、HTML のルビタグの規格素案である。URLは下記。
http://www.doraneko.org/misc/ruby/WD981221.html
http://www.doraneko.org/archives/misc/i18n-format-990127.zip
※ これらは原文の和訳である。原文(英語)は、下記から入手できる。
http://www.w3.org/TR/WD-ruby/#a2-4
http://www.w3.org/TR/WD-i18n-format/#a8
ただし、実をいうと、この規格素案で公開されている方法は、上に述べた方法と、一つだけ異なる点がある。それは、カッコを用いない、という点である。
したがって、先に述べたように、一種の文字化けが起こる。たとえば、「この話(はなし)にする」とはならず、「この話はなしにする」となる。(ルビタグに非対応のブラウザで見た場合。)
このような問題がある。ただ、この点は、私が担当委員会に指摘しておいたので、将来的には是正される可能性が高い。
[ 注 ]
仮に、この点が是正されなければ、そのようなルビ表記の規格は、既存のブラウザとの互換性がなくなる。つまり、欠陥のある規格となる。このような規格に従ってルビタグを用いるべきではない。絶対に。 (この規格を使ってはいけない。絶対に。 ) その旨、ここに警告しておく。
[ 注 ]
なお、HTML の担当委員会では、この問題を十分に認識している。
ただ、問題の解決策として、 <rp> というタグを使う別種の案を考慮中である。しかし、これはほとんど無意味なので、たぶん使われないだろう。
★ この <rp> というタグについては、表紙ページにある [ 補足 ]
でも、後日、追記した。 必ず参照のこと。
実をいうと、上のルビタグの案は、実はあまり好ましいものではない。いちいちタグを3種類も使わなくてはならず、面倒だからである。
もっとうまい案がある。次のようなタグの記述を用いるのだ。
<ruby>話(はなし)</ruby>
これだけで、十分にルビを付けることができる。(なぜならば、カッコの左半分が区切りの役割を果たして、区切りが検出されるからだ。しかも、このように、カッコという文字で区切りを検出すれば、処理は高速化する。)
要するに、 <ruby> という1種類のタグがあれば十分であり、 <rb> <rt> というタグは不要なのである。邪魔なだけで、何の意味もないのである。
この点は、やはり、HTML の規格担当委員会に私が指摘しておいた。だから、おそらく受け入れられるはずだ。つまり、上に述べたように、 <ruby> </ruby> という一種類のタグだけでルビを記述できるようになるはずだ。これならば、初心者でも簡単に扱えるだろう。また、仮にエラーが起こっても、深刻な問題は生じないはずだ。 (現在の素案の方法では、エラーが起こった場合、妙なことが起こる可能性がある。)
※ 現時点での HTML のルビ表記の規格は、1998-12-21 のものである。これは
draft (草案)と記してある。今後変更されることはありうるとも記してある。だか
ら、まだ実装されるべきではないらしい。
※ にもかかわらず、MS-IE 5.0 はこのルビタグをすでに実装しているそうだ。
下記に情報がある。
「 INTERNET magazine 」(1999-3月号) p.283
この記述によれば、MS-IE 5.0 がこの HTML ルビタグに対応しているそうだ。
MS-IE 5.0 が対応するとなると、この不完全なルビタグに対応した迷惑ホーム
ページが氾濫するかもしれない。そうならないことを望みたいが。
※ もしどうしてもこの HTML 規格に従ってルビを使いたければ、ユーザが勝手に
カッコを付け足すべきだろう。その場合、ルビタグに対応するブラウザでは、カナ
の前後にカッコがついて表示されてしまい、見栄えが悪くなるが、やむを得ない。
デタラメな情報が出回るよりは、マシである。
なお、勝手にこのように付け足したとしても、将来の正式なルビタグ規格では、
そのようなカッコ付きの表記に対応するはずだ。つまり、カッコを自動的に省いて
表示するようになるはずだ。 (規格制定者がまともに決めれば、の話だが。)
【 追記 】 T-Time のルビタグ
T-Time というソフトがある。これは HTML 文書を見やすく表示するソフトである。
このソフトは、独自のタグを使って、ルビを正しく表示することができる。たとえばソースで、
<!R>骸骨(がいこつ)を見た
と記しておけば、これを T-Time で表示したとき、前述のようにルビが正しく表示される。
(……らしい。私は未確認。)
なお、ここではカッコを使っていることに注意。 T-Time の関係者は、HTML のルビタグの規格の制定者よりは、ずっとまともな頭をしているようだ。
このソフトについての情報は、下記。
http://www.voyager.co.jp/T-Time/
http://www.voyager.co.jp/T-Time/HTML.html
ルビのある HTML 文書の例は、下記から入手できる。 (芥川龍之介「猿蟹合戦」など)
http://www.voyager.co.jp/aozora/
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * *
※ 以下は専門的な細かな情報である。専門家以外、読む必要はない。
[ 参考 ]全角カッコと半角カッコ
ルビタグに使うカッコは、原則として、全角のカッコにするべきである。半角のカッコでは好ましくない。
これには理由がある。簡単に言えば、もし半角のカッコを使うと、一部の有名なワープロで処理にエラーが生じるからである。詳しくは、下記ホームページの 24 番を参照してほしい。
http://hp.vector.co.jp/authors/VA011700/
にある「知の道具箱」というページのなかの
「よくある質問」というページ。
【 追記 】
ただ、たとえ「全角カッコにせよ」と指定しても、ユーザが間違って半角のカッコを使う場合もあるだろう。また、そもそも欧文環境では、全角カッコが使えない。
だから、「半角カッコでもかまわない」というふうに、規格には定めておく必要がある。その上で、「なるべく全角カッコを使うこと」と勧奨するべきであろう。
[ 参考 ]unicode のルビタグ
unicode では、「文字コードとしてのルビタグを用いる」という案があるそうだ。これについては、月刊アスキー(1998-12号,480頁)に記述がある。
ただ、「ルビタグは絶対ダメだ」とさんざん否定しているが、この記述では、実は、「カッコを併用しないルビタグ」について否定しているだけである。「カッコを併用するルビタグ」を用いれば大丈夫なのだが、そのことについては考慮されていない。
[ 参考 ]現状のルビ処理
上記雑誌記事では、unicode のルビタグが激しく批判されている。
批判している人たちは unicode のルビタグについては、十分理解しているようだが、しかし、現状のルビ処理がどうなっているかは、よく理解していないようだ。
現状では、ルビは次のような状態にある。
(1) アプリがそれぞれ独自の処理形式を用いている。
そのため、アプリ間の互換性がない。
例: 一太郎 ⇔ ロータスワードプロ ⇔ Word95
(2) 現在の標準的な文書形式は、RTF だが、これは「フィールド」を用いる。
( MS-Word形式も同じく「フィールド」を用いる。)
しかしフィールドは、文字としては扱われない。そこで、次のような問題が発生する。
・ txt 形式で保存すると、ルビのある部分が丸ごと消えてしまう。
例: 彼が骸骨(がいこつ)を見た → 彼がを見た
( ※ クリップボードを経由して、txt 形式のエディタへ貼りつけても、同様である。)
・ その部分が検索から漏れてしまう。
例:「骸骨」で検索しても、発見されない。
現状の処理方式には、これだけの問題がある。
一方、unicode のルビタグを用いれば、こうした問題は解決する。少なくとも、カッコ付きのカナは生き残るからである。その意味で、unicode のルビタグは、素性として悪くはない。
なお、「HTMLやXMLのタグを用いればよい」という主張もある。
しかしこれはこれで、問題がある。次のように。
・クリップボードを経由すると、ルビという書式が消えてしまう。
結局、unicode 以外の他の方式でも、それなりの問題点がある。こうしたことを把握しておくべきだろう。unicode のルビタグを批判するのは構わないが、その前に、他の方式の問題点についても理解しておくべきだろう。
なお、一般的な話をすると……
「さまざまな制御記号を、文字コードとして入れる」というのは、時代に逆行する方式だと思えるかもしれない。昔はこうした処理方法がけっこう使われた。これはどちらかといえば「エディター的」または「ワープロ専用機的」な方式で、現在一般的な「WYSIWYG的」な方式とは異なる。
しかし、私の個人的感想をいえば、この古くさい方式も、なかなか良い方法だと思える。長所も短所もあるが、私としては嫌いではない。素朴な味わいがある。
※ この方式を一般記号で実行したものに、WZなどのエディタがある。
これは ● などの記号で書式や見出しを指定するものである。
[ 参考 ]画面表示
unicode のルビタグを、画面に表示するか否かは、ルビタグの設定、および、ソフトの設計しだいである。
通常、次のいずれかとなる。
(1) 表示しないで、解釈する
…… WYSIWYG 表示のワープロなど。
(ルビタグは表示されないが、それが解釈されて、正しくルビの形で表示される)
(2) 表示しないで、無視する
……ドラフト表示のワープロや、エディタなど。
(ルビタグは表示されず、単に無視される。HTMLのタグ同様。)
(3) 表示する (解釈はしない)
……ドラフト表示のワープロや、エディタなど。
(ルビタグは特別な形で表示される。たとえば [r] のような形の記号。
これは画面上だけに現れる特殊記号である。印刷すると、そこは空白となる。)
(4) unicode 自体が無視される。
…… unicode 非対応のソフト。
( unicode 文字のかわりに ? という文字が表示される。[または別の文字化け])
こうしたことは、もちろん、他の制御記号についても当てはまる。
なお、unicode 非対応アプリにおいて生じる問題一般については、表紙ページから、「補助漢字の一覧」を得てほしい。そこに詳しく記してある。
[ 参考 ]ルビタグと文字コード
unicode でルビタグを用いる、というのは、実は、あまり良い方法ではない。
すでに上で述べたように、unicode でルビタグを指定しても、それを txtファイルに落とすこと(コンバートすること)はできない。 txtファイルに落とすことのできるのは、JISの文字だけである。( unicode の文字は、文字化けしてしまう。)
しかしそもそも、ルビタグを用いるのは、各種ワープロファイル間で、ルビの互換性を保つためである。(互換性を保たないのなら、それぞれのアプリの専用の形式でも十分。)
互換性のためには、txt ファイルに落とせることが大事である。unicode テキストという、一部のアプリでしか使えない形式でだけ扱えるのであっては、互換性の意味がない。だから、ルビタグは、unicode の文字ではなく、JISの文字である必要がある。
だから、もしルビタグというものを定めるとすれば、unicode で定めるのではなく、JISの新規格で定めるべきであろう。
※ ただし、その場合、言語間の互換性はなくなる。これはこれで問題かもしれない。が、
やむをえないとも言える。文字コードレベルのルビタグは簡易的なものにすぎないからだ。
(詳細は、「JISの新規格の私案」のページを参照。)
[付] ルビと傍点(圏点・脇点)
ルビに似たものに、傍点(圏点・脇点)がある。 、、、、 や .... などである。つまり、強調したい文字列の脇に添えられた、読点やピリオドのような字形の点である。
これは、ルビに似ているが、( 1/4 角ではなく ) 全角の文字だ、という点が異なる。
これをコンピュータで扱うには、次の二つの方法がある。
・ 字形(読点など)を具体的に指定して、それを適当な位置(行間)に配置する。
・ 列挙されたもののなかから、任意に選択することで、字形と位置が指定される。
後者に類するものとしては、HTML の LI タグがある。これは、
<OL TYPE=i>
<LI>□□□□</LI>
<LI>□□□□</LI>
<LI>□□□□</LI>
<OL>
などと記すことで、適当な箇条書き番号が指定される。
上の例では、TYPE が i と選択されたが、この場合は、
- □□□□
- □□□□
- □□□□
のように表示される。 ( ブラウザによっては対応していないこともある。)
同様にして、 i のかわりに 1 を選択すれば、
- □□□□
- □□□□
- □□□□
となる。 ( a を選択すれば、 a , b , c , ... となる。 A を選択すれば、 A , B , C , ... となる。)
このように TYPE を選択するだけで、箇条書きの種類が指定される。 (いちいち個々の連番をつけなくても済む。)
傍点もまた、このように、TYPE を選択するだけで、傍点の種類(読点やピリオドなど)が指定されるとよい。(もう一つの方法[二つの方法のうち前者の方法]は、いちいち位置などを細かく指定しなくてはならないので、面倒である。) ただし、このように選択するだけで済ませるには、あらかじめ、このような規格を定めておくことが必要である。
JCSでは、このような組版の新規格を提案している。
http://www.jagat.or.jp/article/title/koukai.htm
この新規格が一般に普及すれば、組版では傍点が自由に実現できる。( ただし組版というものは印刷のプロ向け。一般の人向けではない。)
一般の人向けでは、MS-Wordなどが、独自の方式で指定できるようになっている。ただし、互換性はない。 ( Word2000 はファイルを HTML 化できるが、これは XML を使っているので、要するに、独自の HTML タグを設定しているだけである。)
HTML では、現時点では、このような傍点タグの規格はできていない。
というわけで、傍点やルビが、ひろく一般に使えるようになるのは、かなり先のことになりそうだ。
< 付記 >
HTML で傍点を独自のタグで設定した場合、そのタグに対応していないブラウザでは、傍点が消失してしまう。これは困る。
これを避けるには、傍点タグに対応していないブラウザでは、傍点が下線に化けるようにすればよい。つまり、傍点を、下線の上位規格とすればよい。これで解決する。
※ 具体的なタグの指定法は、話が専門的になるので、省略する。ただ、
考えればすぐにわかる程度のものである。 (上の LI タグと同様。)
※ 下線ではなく、斜体や太字に化けるようにする、という案もある。
( JCSの組版指定方式では、EM や STRONG が傍点に対応する。
ただし HTML では EM は斜体だし、 STRONG は太字である。
つまり 斜体や太字に化けることになりそうだ。)
ま、それはそれでわからなくもないが、斜体は和文では見にくいし、
太字は字画が潰れやすい。やはり、下線にした方がいいだろう。
そもそも下線は、縦書きにしたときは傍線になるし、傍線と傍点は、
形がちょっと違うだけの同類であるからだ。 (ともに脇に添える。)
つまり、下線 ・傍線 ・傍点は、同類なのだ。 (斜体 ・太字は別。)
< 参考 >
箇条書きを上記のように TYPE で指定した場合は、問題が一つある。その HTML ファイルを txt 形式で保存した場合、冒頭に来る付番( a, i, 1 など)が消失してしまうのである。
傍点を同じように指定した場合も、 txt 形式で保存した場合に傍点が消失するという問題が生じる。このことは、注意する必要がある。
ただ、ルビならばそのカナを残す必要があるが、傍点ならばその点々を残せなくても仕方ないだろう。傍点というのは一種の書式情報であるし、「 txt 形式では書式情報が消失する」というのは当然だからだ。
以上、いろいろと述べてきた。 (駄弁が多くて恐縮だが。)
ともあれ、このホームページが、ルビを愛好する人々のお役に立てれば、幸いである。
氏 名 南堂久史
メール nando@js2.so-net.ne.jp
URL 文字コードをめぐって (文字講堂) (表紙ページ)
[END]