cyrill

1.　コンピュータによる文字表示の基礎知識

　コンピュータの画面上に表れている文字は、コンピュータ内部では文字コードとして管理されている。

　文字コードにはヨーロッパ系のアルファベットを表すのに用いられる1バイト文字と、漢字(日本語、中国語)、ハングル文字(韓国語)等を表す2バイト文字がある。

　1バイト＝8ビット(二進法で8桁)では、全部で256文字を区別することができ、欧米のアルファベットを表すには十分である。しかし、日本語の漢字等、1バイトでは表現しきれない文字を表すのに、2バイト＝16ビット(二進法で16桁、65536文字の区別が可能)に拡張したコードが使用されている。

　それぞれの文字コード体系は、当該国の規格化団体が定め、アメリカではASCIIコード、日本では日本規格協会の定めたJIS漢字コードに基づき、WindowsやMacintoshではシフトJISコード、UNIXではEUCコードが用いられている。

　近年、世界のメジャーな言語の文字を統一的コードで表すことを目的に国際標準化機構(ISO)の定めたユニコード(Unicode)が普及しつつある。

文字コード表

ASCIIコード Shift JISコードの一部