キーワード辞典
Byteに纏わるエトセトラ

登録日 13/10/02   更新日 19/08/17



ビット

コンピュータが扱うデータのサイズの最小単位。英語の binary digit の略。 1個の、ドーナツ型の磁石の回転の向きや、コンデンサの電荷の量などの、状態の違いによって、 1ビットで、2つの値を表現する。


キャラクタ

キャラクタマシンにおいて、 そのコンピュータで使用する英数字コード1文字分、を意味する、データのサイズの単位。 そのビット数は規定されておらず、6だったり、7だったり、8だったり、コンピュータによってマチマチ。


バイト

「複数ビット」を意味する、データのサイズの単位。 1バイトのビット数は規定されておらず、実は、コンピュータによってマチマチであったが、 1980年頃から1バイトは8ビットであることが一般的になり、 2008年にISO(国際標準化機構)やIEC(国際電気標準会議)で 「1バイトは8ビット」という意見が採択されている(IEC_80000-13)。

C/C++の言語規格では、 「char型のサイズは1バイト」と定義されているが、 「1バイトが8ビット」という定義は無い。 char型のビット数は、CHAR_BITマクロで定義され、 CHAR_BIT マクロは、 ヘッダで定義されるマクロで、 少なくとも8以上に定義されることが保証されている。 よって、もし、1バイトが16ビットであったり、64ビットであったとしても、 規格上は何ら問題は無く、そうした処理系が実際に存在する。


オクテット

上記の理由により、敢て8ビットであることを明示する為に、バイトに換えて使用する言葉。


ワード

そのコンピュータがデータを処理をする際の、ひとかたまり。 「ワード」のビット数はコンピュータによって違う。 日本語で「語」と言ったりする。 例えば、COMET2は、1語が16ビット。





キャラクタマシン

「キャラクタ(1文字の文字コードのビット数)」という単位で文字を表現し、 この単位を基にしてデータを処理するコンピュータ。 バイトマシンが一般化する以前、大昔の事務処理用汎用コンピュータに多く、文字単位の処理を行うのが得意。 数値は二進化十進法の可変長データである為、計算過程での誤差が起きない特徴が有る。
「キャラクタ」のビット数は、6だったり、7だったり、8だったり、コンピュータや処理系によって違い、 更に、複数のキャラクタをまとめてワード単位として処理をするものが登場するが、処理の基本は文字単位。 COBOL経験者は、懐かしいかも。後述の「おまけ」も参照のこと。


ワードマシン

「ワード」のサイズを基にしてデータを処理するコンピュータ。 数値を、整数、短精度、倍精度、など、固定長のデータ型で表現する。科学技術系の汎用コンピュータ向け。 コンピュータのプロセッサの場合、そのプロセッサの汎用レジスタのサイズをワードとし、 その倍長を「ダブルワード」、半分を「ハーフワード」などと呼ぶものもある。
キャラクタマシンにもワードの概念は有るが、 「ワードマシン」は12ビット~36ビット程度のワードの扱いを得意とし、 「キャラクタマシン」は6ビット程度の「字」の扱いを得意とした。

バイトマシン

「バイト」という単位を基にしてデータを処理するコンピュータ。 物凄く乱暴に言うと、キャラクタマシンとワードマシンを一緒くたにした様なコンピュータ。 前述の様に、1バイト=8ビットとは限らない為に、 8ビットを明示するための語として「オクテット」があるが、オクテットマシンとはまず言わない。



おまけ

初期のコンピュータでは1文字は6ビット、すなわち八進法2桁分であり、 ワード長も6の倍数であることが多かったため 3ビットの八進法によって表現するのが都合良く、コンピュータ業界では八進法が広く使われた。 しかし、計算機のワード長が8ビット(オクテット)からなる バイトの倍数によって構成されることが一般的になると、 二進数4桁を1つにまとめた十六進数のほうが切りがよいため、 八進法が使われることは少なくなった。






[ 赤い玉の画像 ] 「キーワード辞典」の目次へ

[ 黒板消しとチョーク受けの画像 ]