たてがき君のページ 解説編 分身の術4(Plug-in) 変身の術4(横→縦) 復活の術4(縦→横) まるやるま君 縦書の考察

たてがき君〜復活の術4

↓縦書きHTMLスクリプト入力↓  :  ※他ソフトで TABLE+BR 方式のものは【<BR>】ボタンを使用のこと

↓変換後「横書き」文章↓

 「たてがき君〜変身の術」で作成した縦書きHTMLスクリプトをタグ入りのまま入力欄に放り込めば、元の横書きテキスト形式に復活するのじゃな。縦書きブロックが複数である場合や、更にそれぞれのブロックの大きさが異なる場合でもそのまま復活させることができるのじゃ。因みに「たてがき君」以外のソフトで作成したものも、HTMLスクリプト毎変換してみると復活することもあるのでお試しあれ。
 ただし、元々「横書き→縦書き」変換が不可逆変換である上、下記の制限があり完全復活というわけではないことに注意。

  1. IE4/NC4以上でないと全く機能しない。
  2. 括弧は、「」『』()【】に復活。変換時の対応表は解説編を参照されたし。
  3. HTMLタグはコメントタグ内も含め全て取り去る。タグの閉じ忘れなどがあると縦書き部分までなくなることもあるので注意されたし。 < > などを(タグでなく)文字として使っていると悲惨な事になるじゃろう。(特にNN4.01-4.05ユーザー)
  4. 「縦書き」ブロック以外の記述も全て取去る。
  5. 原稿用紙ルールと同じく、改行時先頭に空白一字を付けないと改行と認識できないことがある。
 「縦書き」ブロックは次のようにして判定。
  1. HTMLタグをコメントを含め全て削除。縦書き部分の文字修飾のためのタグもタグのみ削除。但し、スクリプトの削除は不得意
  2. 右端の「全角スペース+二桁数字」を全て削除。(「たてがき君」デバッグモードの場合で自動判定)
    (ここまでで、通常の文章+純粋な「縦書き」ブロックが残る)
  3. 括弧・句読点・記号等の「縦⇒横」逆変換。
  4. 半角スペースを全て削除。
  5. 横列(横方向、改行部分まで)を上から順番に走査し「連続して5回以上『同じ字数(半角1字、全角2字で計算)』、且つ横列の文字数が『全角4字(半角8字分)以上』」となる部分を、縦書きブロックと判定。
  6. 縦書きブロックの左端が全て「全角スペース」の場合、一個分だけ削除。(たてがき君の仕様⇒IEのPREタグ対策)
  7. 縦書きブロックの「行数・列数」を自動計算の上、横書き変換。
 厄介なのが「改行」なのじゃが、次の場合に行末(改行)と判定。
  1. 縦列(縦方向)の途中で文章が終わっている場合(禁則処理用空白除く)。
  2. 縦列の第一字が空白の場合。但し、改行直前の文末の「禁則処理」の位置に、「空白文字」か「行頭禁則文字」がある場合に限定。
    ⇒ 縦列の第一字が空白の場合全て改行処理させる方法もあるが、この場合?とか!など感嘆符の直後に空白があると(本当は空白を入れてはいかんらしい)、この空白が縦書変換後行頭に来た場合に改行してしまう。)
  3. 「行末禁則処理文字」が行頭にくる場合 1. のルールで改行されてしまうので、「『行末禁則処理文字』が行頭にあり、かつ『禁則処理』の位置とその直前が『空白』の場合」には改行しない。(例外処理)
 《既知の問題》
 「改行直後の文が括弧で始まる場合には『一文字下げる』必要はない」との原稿用紙ルールも存在するようじゃが、この場合、直前の文章が丁度行の終わりまで来てしまった場合に改行と認識しないのが上記の「改行判定ルール」じゃ。改行を伴わない文中での括弧との区別ができない為でありどうしようもない。

 従い、他のソフトで作成した縦書き文章に関しても、横書き文章に復活させる事が出来ることもあるのじゃな。
 但し、行末禁則処理用に全角一文字を確保していない場合や、全角二文字分を確保している場合などは、途中で改行したり、改行せずに余分な空白が混じったりするなど、完全ではない。このような場合でも、あとは手作業でやれば復活も楽じゃろう。

 なお、次のようなものは全く復活できないのじゃな。

  1. <TABLE>タグの中で<BR>タグで一字一字囲むもの。
    ⇒ ver0.6 よりおまけ【<BR>】ボタンで簡易対応
  2. 全角一文字があるはずの場所に、半角二文字を使っているもの。例えば、数字を 95 などとしているもの。
    (この場合、半角を使っている列の前後を無視して変換することがあるのでおかしくなる⇒下の例参照)

    ⇒ ver0.2bより変換可。ただし「半角一字+半角空白」や「半角空白二文字」はだめ
  3. その他、HTMLスクリプトを見ても、一見して「縦書きブロック」がどこか分からないようなもの。
  4. 「縦書きブロック」があっても、文字のあるべき行の空白部分を「全角」空白でなく「半角」空白を使っているもの。

 <たてがきブロックの例>

    □ は「全角空白」文字を示す。
 
□  □  □  で  □  □ ┏┓ 
□  お   ┐ ご  お  □  お  
□  よ  お  ざ  よ  □  よ  
□  よ  よ  る  よ  □  よ  
□  は  よ   ゜ の  □  95  
□  お   ` □  朝  □ ┗┛ 
□  よ  お  □  は  □  □  
□  よ  よ  □  お  □  □  
□  じ  よ  □  よ  □  <font color="red"></font>  
□  ゃ  !  □  よ  □  □    
□   ゜└   □  □  □  □    
 
 ┏┓ は「全角二文字」括弧。
 
 行間は「半角空白」文字を使っている事。
 
 「半角二文字」の95 も変換可(数字と ?! のみ)
 
 
 □ の代わりに「半角空白二文字」を使っていると逆変換できない。
 文字装飾用タグは削除してから判定する。
 
←禁則処理用スペース(ないと改行を誤認識する)

 特別な機能。(おまけ)

  1. 【ファイル参照】 Win版 IE4以上のみの機能
     縦書きHTMLファイルの読込み。
  2. 【消去】
     入力欄の消去。
  3. 【長音】
     「うん」のを長音記号と呼ぶのじゃが、縦書き変換時に全角英字の小文字であるを使っているソフトもあるようじゃ。確かに縦書時の見栄えはいいのだが、これは英語の「エル」であるから逆変換しないのが普通でごじゃるな。これを長音記号として扱う(逆変換する)為の切替ボタンじゃ。
  4. 【厳密】
     縦書きブロック以外の記述を「縦書きブロック」と認識してしまう可能性もあることから、「縦書きブロック」以外の記述が混入する場合に使ってみられたし。最初の縦書きブロックと同じ縦列数(縦方向)の場合のみ、縦書きブロックと認識する。
    通常モードでは、縦書きブロックの大きさ(字数×行数)が違う場合にもさくさく復活させてくれるじゃろう。(因みに、この機能を使う必要がある文章にはいまだお目に掛かった事がない...)
  5. 【<>】横→縦変換の際に()を∧∨と変換する場合(変身の術の【完縦】)もあることから、∧∨を()と変換するモード。通常は<>に逆変換する。
  6. 【――】
     横→縦変換の際に|が2回連続する場合 −− ではなく ―― に変換する。
  7. 【英数】
     全角英数字を半角に変換する。数字は123などのアラビア数字のみが対象となる。
  8. 【記号】
     全角記号 「@!#$%&’(),./:;=?[¥]^{|} 」を半角変換。
  9. 【漢数】
     「十千百万億兆」を含む形式の漢数字を半角数字に逆変換。「千差万別」「一方」「七五三」「億万長者」「一九九〇年」など、単独での漢数字、数字としておかしいものは出来る限り変換しない。
    但し、「十五夜」⇒「15夜」、「一万億五千三百」⇒「一万億5300」に変換したり、「三月十五日」⇒「三月15日」としてしまうなど、まだまだ不完全じゃ。「年月日」の直前の漢数字は一字でも変換するようにする必要があるのぉ ⇒ 削除部のみ ver0.1fで改善。
  10. 【<BR>】
     「<TABLE> タグ内で各文字を <BR> で挟む」方式を使った他ソフトによる縦書きHTMLの復活。「TABLE タグ内を取り出し、中の<BR>タグの個数で縦書きブロック判定をする」といういいかげんなものじゃ。この方式ではファイル容量が巨大となり、NC4.x では入力できる文字数の制限(NC4.70で約30KB程度)にすぐに引っかかるので注意。TABLE を使った通常横書き部分が混入することもあるので、判定用の BR タグの最低個数を入力するダイアログも出る。通常はデフォルトの 30 で充分じゃが、余計な部分が混入する場合には数字を大きくし、逆に縦書き部分が無くなる場合には数字を小さくする。
    ※ 各行の終わりが </TD> と閉じタグがないと逆変換不能。
  11. 【選択】
     逆変換後テキストの一括選択(あとは右クリックの[コピー]等を利用して、ファイルとして保存すればよいじゃろう)
  12. 【保存】 Win版 IE4以上のみの機能
     逆変換後のファイル保存。保存先は「たてがき君」がインストールされているフォルダー固定
    ⇒ ver0.6a より、「たてがき君」がインストールされたフォルダーの中の「復活の術」フォルダーに保存されます。

 その他

  1. NN4.01-4.05では Unicode が扱えない為稀ではあるが文字化けが起こりうる。
  2. ver0.5 より「山[改行]山」⇒「山[改行]々」への逆変換機能を装備(IE4/NC4.06以上のみ)。バグあるかもしれない。
  3. ver0.5 より Win版のIE4以上でのみファイルの読み書きができるようにしている。(使用できない場合はたてがき君〜変身の術のヘルプ参照)
  4. ver0.6 より TABLE + BR タグ方式にも簡易対応。括弧・記号・句読点などを画像で表示しているものでも復活できることもある。
  5. ver0.8 より PRE タグ方式で括弧・記号・句読点などを画像で表示しているものでも復活できることもある。
  6. ver0.9 より Netscape6 PR2 でも動作可。(遅い...が、TEXAREAの入力文字数制限がなくなったようだ)


最終更新日:2001年9月24日 by 縦の会