[タイトル]
UTF-8,UTF-16相互変換 utf8to16, utf16to8, utf16swap, utftype, mstoutf16, cp932toutf16, sjistoutf16, utf16toms

[機能]
utf8to16 [-p code] [-bBl] [files...] 
UTF-8をUTF-16に変換します。文字の途中でEOF(End Of File)になった場合はその
コードシーケンスは文字出力しません。
-p code 不正コードを置き換える文字をコードで指定します。10進数(例 63)、
        16進数(例 0x3f)、8進数(例 077)を使えます。UCS-4のU+110000以降の文字は
        使用できません。
        指定しない場合は不正コードは出力しません。
        出力しないようにすべき特別な理由が無いかぎり指定すべきです。
-b      BOM(Byte Order Mark)(U+FEFF)を追加で出力します。
        指定しない場合はBOMは出力しません。
-B      入力に含まれるBOM(U+FEFF)を削除します。
        指定しない場合はBOMは削除しません。
-l      little endianで出力します。
        指定しない場合はbig endianで出力します。
files   ファイルを変換します。ファイルの指定が無い場合は標準入力を変換します。


utf16to8 [-p code] [-bBL] [files...] 
UTF-16をUTF-8に変換します。文字の途中でEOFになった場合はそのコードシーケンス
は文字出力しません。
-p code 不正コードを置き換える文字をコードで指定します。10進数(例 63)、
        16進数(例 0x3f)、8進数(例 077)を使えます。UCS-4のU+110000以降の文字は
        使用できません。
        指定しない場合は不正コードは出力しません。
        出力しないようにすべき特別な理由が無いかぎり指定すべきです。
-b      BOM(U+FEFF)を追加で出力します。
        指定しない場合はBOMは出力しません。
-B      入力に含まれるBOM(U+FEFF)を削除しません。
        指定しない場合はBOMは削除します。
-L      BOMを持たない入力をlittle endianとして処理します。
        指定しない場合はBOMを持たない入力をbig endianとして処理します。
        BOMで始まる入力は-Lの指定の有無にかかわらずそのendianで処理します。
files   ファイルを変換します。ファイルの指定が無い場合は標準入力を変換します。


utf16swap [files...]
UTF-16のlittle endianとbig endianを相互に変換します。文字の途中でEOFになった
場合はそのコードシーケンスは文字出力しません。
files   ファイルを変換します。ファイルの指定が無い場合は標準入力を変換します。


utftype [files...] 
UTF-8 BOMあり、UTF-16 little endian BOMあり、UTF-16 big endian BOMあり、
BOMなし、空に分類します。
files   ファイルを分類します。ファイルの指定が無い場合は標準入力を分類します。


mstoutf16 [-p code] [-blyovzedfjsak] [files...] 
Microsoft コードページ932をUTF-16に変換します。文字の途中でEOFになった場合は
そのコードシーケンスは文字出力しません。オプションにより一部の文字の変換方法を
変更できます。
変換表はms2uni.cです。
-p code 不正コードを置き換える文字をコードで指定します。10進数(例 63)、
        16進数(例 0x3f)、8進数(例 077)を使えます。UCS-4のU+110000以降の文字は
        使用できません。
        指定しない場合は不正コードは出力しません。
        出力しないようにすべき特別な理由が無いかぎり指定すべきです。
-b      BOM(U+FEFF)を出力します。
        指定しない場合はBOMは出力しません。
-l      little endianで出力します。
        指定しない場合はbig endianで出力します。
-y      0x5c(\) を
        U+00A5 YEN SIGN に変換します。
        指定しない場合は
        U+005C REVERSE SOLIDUS に変換します。
-o      0x7e(~) を
        U+203E OVERLINE に変換します。
        指定しない場合は
        U+007E TILDE に変換します。
-v      0x7c(|) VERTICAL LINE を
        U+00A6 BROKEN BAR に変換します。
        指定しない場合は
        U+007C VERTICAL LINE に変換します。
-z      216f 0x818F(￥) YEN SIGN を
        U+00A5 YEN SIGN に変換します。
        指定しない場合は
        U+FFE5 FULLWIDTH YEN SIGN に変換します。
-e      213d 0x815c(―) EM DASH を
        U+2014 EM DASH に変換します。
        指定しない場合は
        U+2015 HORIZONTAL BAR に変換します。
-d      2141 0x8160(～) WAVE DASH, 
        2142 0x8161(∥) DOUBLE VERTICAL LINE, 
        215d 0x817c(－) MINUS SIGN を
        U+301C WAVE DASH, 
        U+2016 DOUBLE VERTICAL LINE,
        U+2212 MINUS SIGN に変換します。
        指定しない場合は
        U+FF5E FULLWIDTH TILDE, 
        U+2225 PARALLEL TO, 
        U+FF0D FULLWIDTH HYPHEN-MINUS に変換します。
-f      2171 0x8191(￠) CENT SIGN, 
        2172 0x8192(￡) POUND SIGN, 
        224c 0x81ca(￢) NOT SIGN を非FULLWIDTHに変換します。それぞれ 
        U+00A2 CENT SIGN, 
        U+00A3 POUND SIGN, 
        U+00AC NOT SIGN です。
        指定しない場合はFULLWIDTHに変換します。それぞれ 
        U+FFE0 FULLWIDTH CENT SIGN, 
        U+FFE1 FULLWIDTH POUND SIGN, 
        U+FFE2 FULLWIDTH NOT SIGN です。
-j      2131 0x8150(￣) OVERLINE を
        U+203E OVERLINE に変換します。
        指定しない場合は
        U+FFE3 FULLWIDTH MACRON に変換します。
-s      2140 0x815F(＼) REVERSE SOLIDUS を
        U+005C REVERSE SOLIDUS に変換します。
        指定しない場合は
        U+FF3C FULLWIDTH REVERSE SOLIDUS に変換します。
-a      2144 0x8163(…) HORIZONTAL ELLIPSIS を
        U+22EF MIDLINE HORIZONTAL ELLIPSIS に変換します。
        指定しない場合は
        U+2026 HORIZONTAL ELLIPSIS に変換します。
-k      7c7c 0xeefa(￤) NEC BROKEN BAR, 
        ---- 0xfa55(￤) IBM BROKEN BAR, を
        U+00A6 BROKEN BAR, 
        U+00A6 BROKEN BAR に変換します。
        指定しない場合は
        U+FFE4 FULLWIDTH BROKEN BAR, 
        U+FFE4 FULLWIDTH BROKEN BAR に変換します。
files   ファイルを変換します。ファイルの指定が無い場合は標準入力を変換します。


cp932toutf16 [-p code] [-blyovzedfjsak] [files...]  
unicode.orgのCP932.TXTに従ってUTF-16に変換します。文字の途中でEOFになった場合は
そのコードシーケンスは文字出力しません。オプションにより一部の文字の変換方法を
変更できます。
変換表はcp2uni.cです。
オプションの処理はmstoutf16と同じです。
---- 0xf040からの外字領域がUnicodeのU+E000からの私用領域 (Private Use Area)に
マッピングされません。
0x80が未定義扱いになります。


sjistoutf16 [-p code] [-blyovzedfjsa] [files...] 
unicode.orgのSHIFTJIS.TXTに従ってシフトJISをUTF-16に変換します。文字の途中でEOF
になった場合はそのコードシーケンスは文字出力しません。オプションにより一部の
文字の変換方法を変更できます。
変換表はsjis2uni.cです。
2d21 0x8740からのNEC特殊文字がマッピングされません。
7921 0xed40からのNEC選定IBM拡張文字がマッピングされません。
---- 0xfa40からのIBM拡張文字がマッピングされません。
---- 0xf040からの外字領域がUnicodeのU+E000からの私用領域 (Private Use Area)に
マッピングされません。
0x80が未定義扱いになります。
一部の文字のデフォルトのマッピングが異なります。
0x5c(\)         U+00A5 YEN SIGN             -y U+005C REVERSE SOLIDUS
0x7e(~)         U+203E OVERLINE             -o U+007E TILDE
2140 0x815F(＼) U+005C REVERSE SOLIDUS      -s U+FF3C FULLWIDTH REVERSE SOLIDUS
2141 0x8160(～) U+301C WAVE DASH            -d U+FF5E FULLWIDTH TILDE
2142 0x8161(∥) U+2016 DOUBLE VERTICAL LINE -d U+2225 PARALLEL TO
215d 0x817c(－) U+2212 MINUS SIGN           -d U+FF0D FULLWIDTH HYPHEN-MINUS
2171 0x8191(￠) U+00A2 CENT SIGN            -f U+FFE0 FULLWIDTH CENT SIGN
2172 0x8192(￡) U+00A3 POUND SIGN           -f U+FFE1 FULLWIDTH POUND SIGN
224c 0x81ca(￢) U+00AC NOT SIGN             -f U+FFE2 FULLWIDTH NOT SIGN
-p code 不正コードを置き換える文字をコードで指定します。10進数(例 63)、
        16進数(例 0x3f)、8進数(例 077)を使えます。UCS-4のU+110000以降の文字は
        使用できません。
        指定しない場合は不正コードは出力しません。
        出力しないようにすべき特別な理由が無いかぎり指定すべきです。
-b      BOM(U+FEFF)を出力します。
        指定しない場合はBOMは出力しません。
-l      little endianで出力します。
        指定しない場合はbig endianで出力します。
-y      0x5c(\) を
        U+005C REVERSE SOLIDUS に変換します。
        指定しない場合は
        U+00A5 YEN SIGN に変換します。
-o      0x7e(~) を
        U+007E TILDE に変換します。
        指定しない場合は
        U+203E OVERLINE に変換します。
-v      0x7c(|) VERTICAL LINE を
        U+00A6 BROKEN BAR に変換します。
        指定しない場合は
        U+007C VERTICAL LINE に変換します。
-z      216f 0x818F(￥) YEN SIGN を
        U+00A5 YEN SIGN に変換します。
        指定しない場合は
        U+FFE5 FULLWIDTH YEN SIGN に変換します。
-e      213d 0x815c(―) EM DASH を
        U+2014 EM DASH に変換します。
        指定しない場合は
        U+2015 HORIZONTAL BAR に変換します。
-d      2141 0x8160(～) WAVE DASH, 
        2142 0x8161(∥) DOUBLE VERTICAL LINE, 
        215d 0x817c(－) MINUS SIGN を
        U+FF5E FULLWIDTH TILDE, 
        U+2225 PARALLEL TO, 
        U+FF0D FULLWIDTH HYPHEN-MINUS に変換します。
        指定しない場合は
        U+301C WAVE DASH, 
        U+2016 DOUBLE VERTICAL LINE,
        U+2212 MINUS SIGN に変換します。
-f      2171 0x8191(￠) CENT SIGN, 
        2172 0x8192(￡) POUND SIGN, 
        224c 0x81ca(￢) NOT SIGN をFULLWIDTHに変換します。それぞれ 
        U+FFE0 FULLWIDTH CENT SIGN, 
        U+FFE1 FULLWIDTH POUND SIGN, 
        U+FFE2 FULLWIDTH NOT SIGN です。
        指定しない場合は非FULLWIDTHに変換します。それぞれ 
        U+00A2 CENT SIGN, 
        U+00A3 POUND SIGN, 
        U+00AC NOT SIGN です。
-j      2131 0x8150(￣) OVERLINE を
        U+203E OVERLINE に変換します。
        指定しない場合は
        U+FFE3 FULLWIDTH MACRON に変換します。
-s      2140 0x815F(＼) REVERSE SOLIDUS を
        U+FF3C FULLWIDTH REVERSE SOLIDUS に変換します。
        指定しない場合は
        U+005C REVERSE SOLIDUS に変換します。
-a      2144 0x8163(…) HORIZONTAL ELLIPSIS を
        U+22EF MIDLINE HORIZONTAL ELLIPSIS に変換します。
        指定しない場合は
        U+2026 HORIZONTAL ELLIPSIS に変換します。
files   ファイルを変換します。ファイルの指定が無い場合は標準入力を変換します。


utf16toms [-p code] [-gxLyrzsoijevbdtfnavkqc] [files...] 
UTF-16をMicrosoft コードページ932に変換します。文字の途中でEOFになった場合は
そのコードシーケンスは文字出力しません。オプションにより一部の文字の変換方法を
変更できます。
変換表はuni2ms.cです。
-p code 不正コードを置き換える文字をコードで指定します。10進数(例 63)、
        16進数(例 0x3f)、8進数(例 077)を使えます。Microsoft コードページ932
        の文字コードで指定します。
        指定しない場合は不正コードは出力しません。
        出力しないようにすべき特別な理由が無いかぎり指定すべきです。
-g      対応する文字が無い場合、HTML4.0の数値文字参照(10進数)で出力します。
        &#123456; という形式です。
-x      対応する文字が無い場合、HTML4.0の数値文字参照(16進数)で出力します。
        &#xabcd; という形式です。
-L      BOMを持たない入力をlittle endianとして処理します。
        指定しない場合はBOMを持たない入力をbig endianとして処理します。
        BOMで始まる入力は-Lの指定の有無にかかわらずそのendianで処理します。
-y      U+00A5 YEN SIGN を
        0x5c(\) に変換します。
        指定しない場合は変換しません。
        -yと-rの動作は無関係です。
-r      U+005C REVERSE SOLIDUS を変換しません。
        指定しない場合は
        0x5c(\) に変換します。
        -yと-rの動作は無関係です。
-z      U+00A5 YEN SIGN を
        216f 0x818F(￥) YEN SIGN に変換します。
        指定しない場合は変換しません。
        -yと-zの動作は排他です。同時に指定できません。
-s      U+005C REVERSE SOLIDUS を
        2140 0x815F(＼) REVERSE SOLIDUS に変換します。
        指定しない場合は
        0x5c(\) に変換します。
        -rと-sの動作は排他です。同時に指定できません。
-o      U+203E OVERLINE を
        0x7e(~) に変換します。
        指定しない場合は変換しません。
-i      U+007E TILDE を変換しません。
        指定しない場合は
        0x7e(~) に変換します。
        -oと-iの動作は無関係です。
-j      U+203E OVERLINE を
        2131 0x8150(￣) OVERLINE に変換します。
        指定しない場合は変換しません。
        -oと-jの動作は排他です。同時に指定できません。
-v      U+00A6 BROKEN BAR を
        0x7c(|) VERTICAL LINE に変換します。
        指定しない場合は変換しません 。
        -vと-kの動作は排他です。同時に指定できません。
-e      U+2014 EM DASH を
        213d 0x815c(―) EM DASH に変換します。
        指定しない場合は変換しません。
-b      U+2015 HORIZONTAL BAR を変換しません。
        指定しない場合は
        213d 0x815c(―) EM DASH に変換します。
        -eと-bの動作は無関係です。
-d      U+301C WAVE DASH, 
        U+2016 DOUBLE VERTICAL LINE,
        U+2212 MINUS SIGN を
        2141 0x8160(～) WAVE DASH, 
        2142 0x8161(∥) DOUBLE VERTICAL LINE,
        215d 0x817c(－) MINUS SIGN に変換します。
        指定しない場合は変換しません。
-t      U+FF5E FULLWIDTH TILDE, 
        U+2225 PARALLEL TO, 
        U+FF0D FULLWIDTH HYPHEN-MINUS を変換しません。
        指定しない場合は
        2141 0x8160(～) WAVE DASH, 
        2142 0x8161(∥) DOUBLE VERTICAL LINE,
        215d 0x817c(－) MINUS SIGN に変換します。
        -dと-tの動作は無関係です。
-f      U+00A2 CENT SIGN,
        U+00A3 POUND SIGN, 
        U+00AC NOT SIGN をそれぞれ
        2171 0x8191(￠) CENT SIGN,
        2172 0x8192(￡) POUND SIGN, 
        224c 0x81ca(￢) NOT SIGN に変換します。
        指定しない場合は変換しません。
-n      U+FFE0 FULLWIDTH CENT SIGN, 
        U+FFE1 FULLWIDTH POUND SIGN, 
        U+FFE2 FULLWIDTH NOT SIGN を変換しません。
        指定しない場合は
        2171 0x8191(￠) CENT SIGN,
        2172 0x8192(￡) POUND SIGN, 
        224c 0x81ca(￢) NOT SIGN に変換します。
        -fと-nの動作は無関係です。
-a      U+22EF MIDLINE HORIZONTAL ELLIPSIS を
        2144 0x8163(…) HORIZONTAL ELLIPSIS に変換します。
        指定しない場合は変換しません。
-k      U+00A6 BROKEN BAR を
        ---- 0xfa55(￤) IBM BROKEN BAR に変換します。
        指定しない場合は変換しません 。
        -vと-kの動作は排他です。同時に指定できません。
-q      U+2116 NUMERO SIGN, 
        U+2121 TELEPHONE SIGN, 
        U+2160 ROMAN NUMERAL ONE, 
        U+2161 ROMAN NUMERAL TWO, 
        U+2162 ROMAN NUMERAL THREE, 
        U+2163 ROMAN NUMERAL FOUR, 
        U+2164 ROMAN NUMERAL FIVE, 
        U+2165 ROMAN NUMERAL SIX, 
        U+2166 ROMAN NUMERAL SEVEN, 
        U+2167 ROMAN NUMERAL EIGHT, 
        U+2168 ROMAN NUMERAL NINE, 
        U+2169 ROMAN NUMERAL TEN,
        U+3231 PARENTHESIZED IDEOGRAPH STOCK を
        ---- 0xfa59(№) IBM NUMERO SIGN, 
        ---- 0xfa5a(℡) IBM TELEPHONE SIGN, 
        ---- 0xfa4a(Ⅰ) IBM ROMAN NUMERAL ONE, 
        ---- 0xfa4b(Ⅱ) IBM ROMAN NUMERAL TWO, 
        ---- 0xfa4c(Ⅲ) IBM ROMAN NUMERAL THREE, 
        ---- 0xfa4d(Ⅳ) IBM ROMAN NUMERAL FOUR, 
        ---- 0xfa4e(Ⅴ) IBM ROMAN NUMERAL FIVE, 
        ---- 0xfa4f(Ⅵ) IBM ROMAN NUMERAL SIX, 
        ---- 0xfa50(Ⅶ) IBM ROMAN NUMERAL SEVEN, 
        ---- 0xfa51(Ⅷ) IBM ROMAN NUMERAL EIGHT, 
        ---- 0xfa52(Ⅸ) IBM ROMAN NUMERAL NINE, 
        ---- 0xfa53(Ⅹ) IBM ROMAN NUMERAL TEN,
        ---- 0xfa58(㈱) IBM PARENTHESIZED IDEOGRAPH STOCK に変換します。
        指定しない場合は
        2d62 0x8782(№) NUMERO SIGN, 
        2d64 0x8784(℡) TELEPHONE SIGN, 
        2d35 0x8754(Ⅰ) ROMAN NUMERAL ONE, 
        2d36 0x8755(Ⅱ) ROMAN NUMERAL TWO, 
        2d37 0x8756(Ⅲ) ROMAN NUMERAL THREE, 
        2d38 0x8757(Ⅳ) ROMAN NUMERAL FOUR, 
        2d39 0x8758(Ⅴ) ROMAN NUMERAL FIVE, 
        2d3a 0x8759(Ⅵ) ROMAN NUMERAL SIX, 
        2d3b 0x875a(Ⅶ) ROMAN NUMERAL SEVEN, 
        2d3c 0x875b(Ⅷ) ROMAN NUMERAL EIGHT, 
        2d3d 0x875c(Ⅸ) ROMAN NUMERAL NINE, 
        2d3e 0x875d(Ⅹ) ROMAN NUMERAL TEN,
        2d6a 0x878a(㈱) PARENTHESIZED IDEOGRAPH STOCK に変換します。
-m      "&<>をHTML4.0の文字実体参照で出力します。
        " &quot; 引用符 
        & &amp; アンパサンド 
        < &lt; 不等号（より小） 
        > &gt; 不等号（より大） 
files   ファイルを変換します。ファイルの指定が無い場合は標準入力を変換します。
例
他のシステムで作成されたUnicodeファイルをCP932にします。
utf16toms -p 0x3f -gyojedfak


[動作環境]
Windows 95/NT 4.0以降のコマンドプロンプト。(Win32 コンソール・
アプリケーション)
Windows 2000 Professional SP4 & IE6SP1で動作確認しています。
コマンドプロンプト(MS-DOSプロンプト)を開いて、コマンドプロンプトから実行
してください。


[インストール・アンインストール]
インストールは適当なフォルダにexeファイルを置いてください。
アンインストールはexeファイルを削除してください。
レジストリは使用していません。


[作者連絡先]
http://hp.vector.co.jp/authors/VA007219/#contact 


[その他]
Copyright (C) 2002-2007 VA007219 
src.zipに含まれる*.cファイルは修正BSDライセンスです。

このソフトウェアは無償で提供しています。
利用・再配布は無制限です。
不具合の報告、要望等ありましたら作者連絡先にメールをください。ただし対応できる
とは限りません。
Windows 2000の環境で開発しています。
RFCに適合していないかもしれません。参照 RFC 2781, 3629
UTF-7, UTF-9, UTF-18 への対応予定はありません。
Windowsの日本語環境で使われているシフトJISはコードページ932(CP932)といい、
Microsoftにより、それ以前のシフトJISに対してNEC特殊文字、NEC選定IBM拡張文字、
IBM拡張文字などが拡張されています。
IANAのCharacter Set Nameにはコードページ932がWindows-31J、拡張のないシフトJIS
がShift_JISで登録されています。
mstoutf16(Microsoft コードページ932からUTF-16)の変換表は、Windows 2000で下記
関数を使って作成しています。
MultiByteToWideChar(CP_OEMCP,MB_PRECOMPOSED ...)
utf16toms(UTF-16からMicrosoft コードページ932)の変換表は、Windows 2000で下記
関数を使って作成しています。
WideCharToMultiByte(CP_OEMCP,WC_NO_BEST_FIT_CHARS ...)
cp932toutf16はunicode.orgのCP932.TXTに従って変換表を作成しています。
CP932.TXT
#    Name:     cp932 to Unicode table
#    Unicode version: 2.0
#    Table version: 2.01
#    Table format:  Format A
#    Date:          04/15/98
#    Contact:       cpxlate@microsoft.com
sjistoutf16はunicode.orgのSHIFTJIS.TXTに従って変換表を作成しています。
#	Name:             Shift-JIS to Unicode
#	Unicode version:  1.1
#	Table version:    0.9
#	Table format:     Format A
#	Date:             8 March 1994
#	Copyright (c) 1991-1994 Unicode, Inc.  All Rights reserved.

CP932において同一の文字が二つの文字コードに重複して割り当てられている場合
がありUnicodeへの変換では一つのUnicodeへ変換されUnicodeからの逆変換では一方の
文字コードへ変換されます。
NEC特殊文字のうちJIS X0208-1983の文字と重複する0x8790,0x8791,0x8792,0x8795,
0x8796,0x8797,0x879a,0x879b,0x879c、NEC選定IBM拡張文字すべて、IBM拡張文字の
うちNEC特殊文字と重複する0xfa4a-0xf54,0xfa58-0xf5bはシフトJIS→Unicode→
シフトJISとすると別のコードになり元には戻りません。
Windows (NT系)上でこれらのシフトJISの文字をコピー・貼り付けすると文字が変更
されます。UnicodeにないコードはU+30FB 2126 0x8145(・)に置き換わるようです。
これらはWindows XPのメモ帳で確認しました。

NEC特殊文字
JIS X 0208: 13区 2d21-2d7c
シフトJIS: 0x8740-0x879c
NECによるJIS C6226-1978の拡張である「日本電気標準文字セット辞書〈基本〉」の
文字の13区の部分です。PC-9800シリーズは「日本電気標準文字セット辞書〈基本〉」
の一部領域を除いて実装していました。
PC-9800シリーズはJISをベースにした（シフトJISをベースにしなかった）ため
追加の文字はJIS C6226-1978の未使用領域に割り当てられています。
NEC特殊文字の一部はその後のJIS X0208-1983でJISに取り込まれたため、
JIS X0208-1983の文字との重複があります。
8740  ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩ ⑪ ⑫ ⑬ ⑭ ⑮ ⑯
8750  ⑰ ⑱ ⑲ ⑳ Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ・ ㍉
8760  ㌔ ㌢ ㍍ ㌘ ㌧ ㌃ ㌶ ㍑ ㍗ ㌍ ㌦ ㌣ ㌫ ㍊ ㌻ ㎜
8770  ㎝ ㎞ ㎎ ㎏ ㏄ ㎡ ・ ・ ・ ・ ・ ・ ・ ・ ㍻
8780  〝 〟 № ㏍ ℡ ㊤ ㊥ ㊦ ㊧ ㊨ ㈱ ㈲ ㈹ ㍾ ㍽ ㍼
8790  ≒ ≡ ∫ ∮ ∑ √ ⊥ ∠ ∟ ⊿ ∵ ∩ ∪

NEC選定IBM拡張文字
JIS X 0208: 89区-92区 7921-7c7e
シフトJIS: 0xed40-0xeefc
NECがPC-9800シリーズへIBMのメインフレームで用いる文字を追加したものです。
「日本電気標準文字セット辞書〈基本〉」に対する拡張です。
ed40  纊 褜 鍈 銈 蓜 俉 炻 昱 棈 鋹 曻 彅 丨 仡 仼 伀
ed50  伃 伹 佖 侒 侊 侚 侔 俍 偀 倢 俿 倞 偆 偰 偂 傔
ed60  僴 僘 兊 兤 冝 冾 凬 刕 劜 劦 勀 勛 匀 匇 匤 卲
ed70  厓 厲 叝 﨎 咜 咊 咩 哿 喆 坙 坥 垬 埈 埇 﨏
ed80  塚 增 墲 夋 奓 奛 奝 奣 妤 妺 孖 寀 甯 寘 寬 尞
ed90  岦 岺 峵 崧 嵓 﨑 嵂 嵭 嶸 嶹 巐 弡 弴 彧 德 忞
eda0  恝 悅 悊 惞 惕 愠 惲 愑 愷 愰 憘 戓 抦 揵 摠 撝
edb0  擎 敎 昀 昕 昻 昉 昮 昞 昤 晥 晗 晙 晴 晳 暙 暠
edc0  暲 暿 曺 朎 朗 杦 枻 桒 柀 栁 桄 棏 﨓 楨 﨔 榘
edd0  槢 樰 橫 橆 橳 橾 櫢 櫤 毖 氿 汜 沆 汯 泚 洄 涇
ede0  浯 涖 涬 淏 淸 淲 淼 渹 湜 渧 渼 溿 澈 澵 濵 瀅
edf0  瀇 瀨 炅 炫 焏 焄 煜 煆 煇 凞 燁 燾 犱
ee40  犾 猤 猪 獷 玽 珉 珖 珣 珒 琇 珵 琦 琪 琩 琮 瑢
ee50  璉 璟 甁 畯 皂 皜 皞 皛 皦 益 睆 劯 砡 硎 硤 硺
ee60  礰 礼 神 祥 禔 福 禛 竑 竧 靖 竫 箞 精 絈 絜 綷
ee70  綠 緖 繒 罇 羡 羽 茁 荢 荿 菇 菶 葈 蒴 蕓 蕙
ee80  蕫 﨟 薰 蘒 﨡 蠇 裵 訒 訷 詹 誧 誾 諟 諸 諶 譓
ee90  譿 賰 賴 贒 赶 﨣 軏 﨤 逸 遧 郞 都 鄕 鄧 釚 釗
eea0  釞 釭 釮 釤 釥 鈆 鈐 鈊 鈺 鉀 鈼 鉎 鉙 鉑 鈹 鉧
eeb0  銧 鉷 鉸 鋧 鋗 鋙 鋐 﨧 鋕 鋠 鋓 錥 錡 鋻 﨨 錞
eec0  鋿 錝 錂 鍰 鍗 鎤 鏆 鏞 鏸 鐱 鑅 鑈 閒 隆 﨩 隝
eed0  隯 霳 霻 靃 靍 靏 靑 靕 顗 顥 飯 飼 餧 館 馞 驎
eee0  髙 髜 魵 魲 鮏 鮱 鮻 鰀 鵰 鵫 鶴 鸙 黑 � � ⅰ
eef0  ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ ￢ ￤ ＇ ＂

IBM拡張文字
JIS X 0208: 対応なし
シフトJIS: 0xfa40-0xfc4b
IBMがDOSにおいてIBMのメインフレームで用いる文字を追加したものです。
JIS X0208-1983に対する拡張です。
シフトJISはJIS X 0208よりも表現可能な文字数が多く、JIS X 0208が対応しない部分
にIBM拡張文字を割り当てています。
DOSはシフトJISをベースにした（JISをベースにしなかった）ため追加する文字は
JISの範囲外に割り当てることが可能でした。
fa40  ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ
fa50  Ⅶ Ⅷ Ⅸ Ⅹ ￢ ￤ ＇ ＂ ㈱ № ℡ ∵ 纊 褜 鍈 銈
fa60  蓜 俉 炻 昱 棈 鋹 曻 彅 丨 仡 仼 伀 伃 伹 佖 侒
fa70  侊 侚 侔 俍 偀 倢 俿 倞 偆 偰 偂 傔 僴 僘 兊
fa80  兤 冝 冾 凬 刕 劜 劦 勀 勛 匀 匇 匤 卲 厓 厲 叝
fa90  﨎 咜 咊 咩 哿 喆 坙 坥 垬 埈 埇 﨏 塚 增 墲 夋
faa0  奓 奛 奝 奣 妤 妺 孖 寀 甯 寘 寬 尞 岦 岺 峵 崧
fab0  嵓 﨑 嵂 嵭 嶸 嶹 巐 弡 弴 彧 德 忞 恝 悅 悊 惞
fac0  惕 愠 惲 愑 愷 愰 憘 戓 抦 揵 摠 撝 擎 敎 昀 昕
fad0  昻 昉 昮 昞 昤 晥 晗 晙 晴 晳 暙 暠 暲 暿 曺 朎
fae0  朗 杦 枻 桒 柀 栁 桄 棏 﨓 楨 﨔 榘 槢 樰 橫 橆
faf0  橳 橾 櫢 櫤 毖 氿 汜 沆 汯 泚 洄 涇 浯
fb40  涖 涬 淏 淸 淲 淼 渹 湜 渧 渼 溿 澈 澵 濵 瀅 瀇
fb50  瀨 炅 炫 焏 焄 煜 煆 煇 凞 燁 燾 犱 犾 猤 猪 獷
fb60  玽 珉 珖 珣 珒 琇 珵 琦 琪 琩 琮 瑢 璉 璟 甁 畯
fb70  皂 皜 皞 皛 皦 益 睆 劯 砡 硎 硤 硺 礰 礼 神
fb80  祥 禔 福 禛 竑 竧 靖 竫 箞 精 絈 絜 綷 綠 緖 繒
fb90  罇 羡 羽 茁 荢 荿 菇 菶 葈 蒴 蕓 蕙 蕫 﨟 薰 蘒
fba0  﨡 蠇 裵 訒 訷 詹 誧 誾 諟 諸 諶 譓 譿 賰 賴 贒
fbb0  赶 﨣 軏 﨤 逸 遧 郞 都 鄕 鄧 釚 釗 釞 釭 釮 釤
fbc0  釥 鈆 鈐 鈊 鈺 鉀 鈼 鉎 鉙 鉑 鈹 鉧 銧 鉷 鉸 鋧
fbd0  鋗 鋙 鋐 﨧 鋕 鋠 鋓 錥 錡 鋻 﨨 錞 鋿 錝 錂 鍰
fbe0  鍗 鎤 鏆 鏞 鏸 鐱 鑅 鑈 閒 隆 﨩 隝 隯 霳 霻 靃
fbf0  靍 靏 靑 靕 顗 顥 飯 飼 餧 館 馞 驎 髙
fc40  髜 魵 魲 鮏 鮱 鮻 鰀 鵰 鵫 鶴 鸙 黑

ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP932.TXT
ftp://ftp.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/SHIFTJIS.TXT
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/intl/unicode_81rn.asp
http://www.microsoft.com/globaldev/reference/cphome.mspx
http://www.microsoft.com/globaldev/reference/dbcs/932.htm
http://support.microsoft.com/kb/170559
http://support.microsoft.com/kb/286776
http://www.iana.org/assignments/character-sets
http://www.opengroup.or.jp/jvc/cde/ucs-conv.html
http://www.debian.or.jp/~kubota/unicode-symbols.html
http://www.ingrid.org/java/i18n/encoding/ja-conv.html
http://www2d.biglobe.ne.jp/~msyk/charcode/cp932/uni2sjis.html
http://www.asahi-net.or.jp/~ez3k-msym/charsets/jis2ucs.htm
http://euc.jp/i18n/ucsnote.ja.html#width
http://www-6.ibm.com/jp/software/support/techflash/49256EC400280BF4.html
http://www.asahi-net.or.jp/~wq6k-yn/code/jisucs.html
http://www.asahi-net.or.jp/~wq6k-yn/code/wavedash.html
http://mikeneko.creator.club.ne.jp/~lab/kcode/vendor.html
http://www.unicode.org/unicode/faq/utf_bom.html#29
http://www.ffortune.net/comp/develop/data/utf.htm
http://software.nikkeibp.co.jp/software/special/jiscode/nc.html
http://msdn.microsoft.com/library/default.asp?url=/library/en-us/intl/unicode_192r.asp
http://www-306.ibm.com/software/globalization/icu/index.jsp
http://www.alphaworks.ibm.com/tech/unicodenormalizer
http://www2d.biglobe.ne.jp/~msyk/software/libiconv-patch.html

[修正履歴]
2版 2005-5-29
コマンド追加
3版 2006-1-8
utf16tomsの-gが&123456;という形式だったのを&#123456;に修正しました。
4版 2006-4-14
utf16tomsに-mを追加しました。
5版 2007-3-21
sjistoutf16の-yが無効だったのを修正しました。青木さんバグレポートありがとう
ございました。