コンピュータが扱うデータの形式の一つ。
コンピュータで、文字として扱うことを前提とするデータ形式。
基本的には、このデータ形式で設計された領域に記憶されたデータは、コンピュータは文字コードとして取り扱う。
また、機械語レベルでは、キーボードやCRT、プリンタなどの標準的な入出力では、全て文字コードで文字として扱われる。
例えば、Excelのセルにキーボードから「1」「2」「3」「Enter」と入力した場合、
Excelは、数字しか入力されていないので、
入力された3文字を「123」という数値としてカレントセルに記憶し、
CRTには、各桁毎に文字コードに変換し「1」「2」「3」と表示する。
因みに、ASCIIコードの123番は「{」なので、
Excelが記憶している「123」という数値をそのままCRTに出力しようとすると「{」が表示されてしまう。
ただし、コンピュータ内部のデータは全て0と1の信号の羅列で、
それを文字コードとして扱うのか数値として扱うのか、は最終的には人間の都合なので、
文字コードで演算(例えばASCIIコードで、’A’~’Z’の文字コードに十進数値の32を加えると小文字になる)
を行なうこともある。
文字コードの体系は数種類有り、文字化けなどの原因となっている。
某アパレル系JIS規格ネタ。十進数65は’A’の文字のASCIIコード。
C言語で文字を扱う場合はcharを使う。
符号有り整数値のsigned char、符号無し整数値のunsigned char、
は、同じcharだが、それぞれ別のデータ型である。
C言語では、charは1バイトであると決められているが、そのビット数は決められていない。
C#やJavaでは、charは16ビットであると決められている。