コンピュータの画面上に表れている文字は、コンピュータ内部では文字コードとして管理されている。
文字コードにはヨーロッパ系のアルファベットを表すのに用いられる1バイト文字と、漢字(日本語、中国語)、ハングル文字(韓国語)等を表す2バイト文字がある。
1バイト=8ビット(二進法で8桁)では、全部で256文字を区別することができ、欧米のアルファベットを表すには十分である。しかし、日本語の漢字等、1バイトでは表現しきれない文字を表すのに、2バイト=16ビット(二進法で16桁、65536文字の区別が可能)に拡張したコードが使用されている。
それぞれの文字コード体系は、当該国の規格化団体が定め、アメリカではASCIIコード、日本では日本規格協会の定めたJIS漢字コードに基づき、WindowsやMacintoshではシフトJISコード、UNIXではEUCコードが用いられている。
近年、世界のメジャーな言語の文字を統一的コードで表すことを目的に国際標準化機構(ISO)の定めたユニコード(Unicode)が普及しつつある。
文字コード表
ASCIIコード Shift JISコードの一部