少し

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

ビットは、コンピューティングおよびデジタル通信における情報最も基本的な単位です名前は2進数のかばん語です[1]このビットは、2つの可能な値のいずれかを持つ論理状態を表します。これらの値は、最も一般的には1」または「0」のいずれかとして表されますが、 true / falseyes / no+ / 、またはon / offなどの他の表現一般的に使用されます。

これらの値と基盤となるストレージまたはデバイスの物理状態との対応は慣例の問題であり、同じデバイスまたはプログラム内でも異なる割り当てを使用できますこれは、2つの状態のデバイスで物理的に実装できます。

2桁の記号は、 IEC 80000-13 :2008規格で推奨されている「ビット」 、またはIEEE1541-2002規格で推奨されている小文字の「b」のいずれかです。

2桁の連続したグループは、一般にビット文字列、ビットベクトル、または1次元(または多次元)ビット配列と呼ばれます。8桁の2進数のグループは1 バイトと呼ばれますが、歴史的にバイトのサイズは厳密には定義されていません。多くの場合、ハーフ、フル、ダブル、およびクワッドワードは、2の累乗の低いバイト数で構成されます。

情報理論では、1ビットは等しい確率で0または1であるバイナリ確率変数の情報エントロピー[2]、またはそのような変数の値がわかったときに得られる情報です。[3] [4]情報の単位として、このビットはシャノンとも呼ばれ[5]クロードE.シャノンにちなんで名付けられました

歴史

離散ビットによるデータのエンコードは、バジル・ブションとジャン・バプティスト・ファルコン(1732)によって発明され、ジョセフ・マリー・ジャカード(1804)によって開発され、後にセミヨン・コルサコフチャールズ・バベッジハーマン・ホレリスによって採用されたパンチカードで使用されました。 IBMのようなコンピューターメーカーそのアイデアの変形は、穴あき紙テープでした。これらすべてのシステムで、媒体(カードまたはテープ)は概念的に一連の穴の位置を運びました。各位置はパンチスルーされる場合とされない場合があり、1ビットの情報を伝達します。ビットによるテキストのエンコードは、モールス信号でも使用されました(1844)およびテレタイプ株式相場表示機(1870) などの初期のデジタル通信機。

ラルフ・ハートレーは、1928年に情報の対数測定の使用を提案しました。[6]クロード・E・シャノンは、1948年の独創的な論文「通信の数学的理論」で最初に「ビット」という単語を使用しました。[7] [8] [9]彼は、1947年1月9日にベル研究所のメモを書いたジョンW.テューキーにその起源を帰し、そこで彼は「バイナリ情報の数字」を単に「ビット」に縮小した。[7] Vannevar Bushは、1936年に、当時の機械式コンピューターで使用されていたパンチカードに保存できる「ちょっとした情報」を書いていました。[10] KonradZuseによって構築された最初のプログラム可能なコンピューター、数値に2進表記を使用しました。

物理的表現

ビットは、2つの可能な異なる状態のいずれかに存在するデジタルデバイスまたは他の物理システムによって格納できます。これらは、フリップフロップの2つの安定状態、電気スイッチの2つの位置、回路によって許可される2つの異なる電圧または電流レベル、2つの異なるレベルの光強度、2つの磁化または分極方向、可逆二重の方向である可能性があります。鎖状DNAなど

ビットはいくつかの形式で実装できます。最近のほとんどのコンピューティングデバイスでは、ビットは通常、電圧または電流パルス、あるいはフリップフロップ回路の電気的状態によって 表されます。

正論理を使用するデバイスの場合、 1の桁値(または真の論理値)は、 0の表現に比べてより正の電圧で表されます特定の電圧はロジックファミリごとに異なり、コンポーネントの経年劣化とノイズ耐性を考慮してバリエーションが許可されています。たとえば、トランジスタ-トランジスタロジック(TTL)および互換性のある回路では、デバイスの出力の桁値0および1は、それぞれ0.4ボルト以下および2.6ボルト以上で表されます。一方、TTL入力は、0.8ボルト以下を0として認識し、2.2ボルト以上を1として認識するように指定されています。

送信と処理

ビットは、シリアル送信では一度に1つずつ送信され、パラレル送信では複数のビットによって送信されます。ビット単位の演算は、オプションで一度に1つずつビットを処理します。データ転送速度は通常、kbit / sなどの単位ビット/秒(bit / s)の10進数のSI倍数で測定されます。

ストレージ

ジャカード織機やバベッジ分析エンジンなどの初期の非電子情報処理装置では、ビットは機械的なレバーやギアの位置、または紙のカードの特定のポイントに穴があるかどうかとして保存されることがよくありました。またはテープディスクリートロジック用の最初の電気機器(エレベータ信号機の制御回路電話スイッチ、コンラートツーゼのコンピュータなど)は、ビットを「開いた」または「閉じた」電気リレーの状態として表しました。リレーを真空管に交換したとき、1940年代以降、コンピュータービルダーは、水銀遅延線を伝わる圧力パルス、ブラウン管の内面に蓄積された電荷、フォトリソグラフィー技術によってガラスディスクに印刷された不透明なスポットなど、さまざまな記憶方法を実験しました。

1950年代と1960年代には、これらの方法は、磁気コアメモリ磁気テープドラムディスクなどの磁気ストレージデバイスに大きく取って代わられました。ビットは、強磁性の特定の領域の磁化の極性によって表されていました。ある方向から別の方向への極性の変化。同じ原理が後に1980年代に開発された磁気バブルメモリで使用され、メトロチケットや一部のクレジットカードなどのさまざまな磁気ストリップアイテムに今でも見られます

ダイナミックランダムアクセスメモリなどの最新の半導体メモリでは、ビットの2つの値は、コンデンサに蓄積された2つのレベルの電荷で表すことができます特定のタイプのプログラマブルロジックアレイおよび読み取り専用メモリでは、ビットは、回路の特定のポイントでの導通パスの有無によって表される場合があります。光ディスクでは、ビットは反射面上の微細なピットの有無としてエンコードされます。1次元バーコードでは、ビットは黒と白の交互の線の太さとしてエンコードされます。

単位と記号

このビットは、国際単位系(SI)では定義されていません。ただし、国際電気標準会議は標準IEC 60027を発行しました。これは、2桁の記号を「ビット」にする必要があり、これは「kbit」などのすべての倍数でキロビットとして使用する必要があることを指定しています。[11]ただし、小文字の「b」も広く使用されており、IEEE 1541標準(2002)で推奨されています。対照的に、大文字の「B」はバイトの標準的で慣習的な記号です。

10進数
価値  メトリック 
1000 kbit キロビット
1000 2 メガビット メガビット
1000 3 ギガビット ギガビット
1000 4 Tbit テラビット
1000 5 Pbit ペタビット
1000 6 Ebit エクサビット
1000 7 Zbit ゼタビット
1000 8 Ybit ヨタビット
バイナリ
価値  IEC  遺産 
1024 キビビット キビビット キロビット Kb キロビット
1024 2 ミビット メビビット メガビット Mb メガビット
1024 3 ギビビット ギビビット ギガビット Gb ギガビット
1024 4 テビビット テビビット Tbit Tb テラビット
1024 5 ペビビット ペビビット
1024 6 Eibit エクスビビット
1024 7 ジビット ゼビビット
1024 8 ヨビビット ヨビビット
データの桁数

複数ビット

複数のビットは、いくつかの方法で表現および表現できます。情報技術で一般的に繰り返されるビットのグループを表すのに便利なように、従来はいくつかの情報単位が使用されてきました。最も一般的なのは、 1956年6月にWerner Buchholzによって造られた単位バイトです。これは、歴史的に、コンピューターで1文字のテキストをエンコードするために使用されるビットのグループを表すために使用されていました( UTF-8マルチバイトエンコードが引き継がれるまで)[12]。[13] [14] [15] [16]このため、多くのコンピュータアーキテクチャで基本的なアドレス指定可能な要素として使用されていました。ハードウェア設計の傾向は、今日広く使用されているように、バイトあたり8ビットを使用する最も一般的な実装に収束しました。ただし、基礎となるハードウェア設計に依存することはあいまいであるため、単位オクテットは8ビットのシーケンスを明示的に示すように定義されました。

コンピュータは通常、固定サイズのグループでビットを操作します。これは通常「ワード」と呼ばれます。バイトと同様に、ワードのビット数もハードウェアの設計によって異なり、通常は8〜80ビット、または一部の特殊なコンピューターではさらに多くなります。21世紀では、小売用のパーソナルコンピュータまたはサーバーコンピュータのワードサイズは32ビットまたは64ビットです。

国際単位系は、ビットとバイトでも一般的に使用される、標準化された単位の倍数の一連の10進接頭辞を定義します接頭辞キロ(10 3)からヨタ(10 24)は、1000の倍数ずつ増加し、対応する単位は、キロビット(kbit)からヨタビット(Ybit)です。

情報容量と情報圧縮

ストレージシステムまたは通信チャネルの情報容量がビットまたはビット/秒で表される場合、これは多くの場合、バイナリデータ(0または1、アップまたはダウン、現在またはそうでない)を格納するためのコンピュータハードウェア容量であるバイナリ桁を指します。など)。[17]ストレージシステムの情報容量は、そこに保存される情報の量の上限にすぎません。1ビットのストレージの2つの可能な値が等しくない可能性がある場合、そのストレージビットには1ビット未満の情報が含まれます。値が完全に予測可能である場合、その値の読み取りは情報をまったく提供しません(不確実性の解決が行われないため、情報が利用できないため、エントロピービットはゼロです)。n ビットのストレージを使用するコンピュータファイルにm  <  n ビットの情報しか含まれていない場合、その情報は原則として 、少なくとも平均して約mビットでエンコードできます。この原則はデータ圧縮の基礎ですテクノロジー。類推を使用すると、ハードウェアの2桁の数字は、使用可能なストレージスペースの量(物を格納するために使用できるバケットの数など)と、さまざまなレベルの粒度(細かいまたは粗い、つまり、圧縮または非圧縮の情報)。粒度が細かい場合(情報がより圧縮されている場合)、同じバケットがより多くを保持できます。

たとえば、情報を保存するための世界の総合的な技術能力は、1,300エクサバイトのハードウェア桁を提供すると推定されています。ただし、このストレージスペースがいっぱいになり、対応するコンテンツが最適に圧縮されている場合、これは295エクサバイトの情報にすぎません。[18]最適に圧縮されると、結果として生じる環境収容力はシャノン情報または情報エントロピーに近づきます。[17]

ビットベースのコンピューティング

特定のビット単位のコンピュータプロセッサ命令(ビットセットなど)は、ビットの集合として解釈されるデータを操作するのではなく、ビットを操作するレベルで動作します。

1980年代に、ビットマップコンピュータディスプレイが普及したとき、一部のコンピュータは、画面上の特定の長方形の領域に対応するビットを設定またはコピーするための 特殊なビットブロック転送命令を提供しました。

ほとんどのコンピューターおよびプログラミング言語では、バイトやワードなどのビットのグループ内のビットが参照される場合、通常、バイトまたはワード内の位置に対応する0以上の数字で指定されます。ただし、0は、コンテキストに応じて 上位ビットまたは最下位ビットのいずれかを参照できます。

その他の情報ユニット

物理学のトルクエネルギーに似ています。情報理論的情報とデータストレージサイズは、測定単位の次元が同じですが、一方が他方の境界として機能する場合でも、一般に、単位を数学的に加算、減算、またはその他の方法で組み合わせる意味はありません。

情報理論で使用される情報の単位には、シャノン(Sh)、自然な情報の単位(nat)、およびハートレー(Hart)が含まれます。1シャノンは、ストレージの1ビットの状態を指定するために必要な情報の最大期待値です。これらは、1Sh≈0.693nat≈0.301Hartによって関連付けられています。

一部の作成者は、binitを、固定されているが指定されていないビット数に相当する任意の情報単位として定義しています。[19]

も参照してください

参考文献

  1. ^ マッケンジー、チャールズE.(1980)。コード化された文字セット、歴史と開発システムプログラミングシリーズ(1版)。Addison-Wesley Publishing Company、Inc.pバツ。ISBN 978-0-201-14460-4LCCN77-90165 _ 2016年11月18日にオリジナルからアーカイブされました2016年5月22日取得 [1]
  2. ^ アンダーソン、ジョンB。; Johnnesson、Rolf(2006)、情報伝達の理解
  3. ^ Haykin、Simon(2006)、デジタル通信
  4. ^ IEEE Std 260.1-2004
  5. ^ 「単位:B」2016年5月4日にオリジナルからアーカイブされました。
  6. ^ アブラムソン、ノーマン(1963)。情報理論とコーディングマグロウヒル
  7. ^ a b シャノン、クロード・エルウッド(1948年7月)。「コミュニケーションの数学的理論」(PDF)ベルシステムテクニカルジャーナル27(3):379–423。土井10.1002 /j.1538-7305.1948.tb01338.xhdl11858 / 00-001M-0000-002C-4314-21998年7月15日にオリジナル(PDF)からアーカイブされました対数基数の選択は、情報を測定するための単位の選択に対応します。基数2が使用される場合、結果の単位は2進数、またはより簡単にビットと呼ばれることがあります。これはJWTukeyによって提案された単語です。
  8. ^ シャノン、クロード・エルウッド(1948年10月)。「コミュニケーションの数学的理論」。ベルシステムテクニカルジャーナル27(4):623–666。土井10.1002 /j.1538-7305.1948.tb00917.xhdl11858 / 00-001M-0000-002C-4314-2
  9. ^ シャノン、クロード・エルウッド; ウィーバー、ウォーレン(1949)。コミュニケーションの数学的理論(PDF)イリノイ大学出版局ISBN  0-252-72548-41998年7月15日にオリジナル (PDF)からアーカイブされました
  10. ^ ブッシュ、ヴァネヴァー(1936)。「機器分析」アメリカ数学会紀要42(10):649–669。土井10.1090 / S0002-9904-1936-06390-12014-10-06にオリジナルからアーカイブされました。
  11. ^ 米国国立標準技術研究所(2008)、国際単位系の使用に関するガイドオンライン版。 ウェイバックマシンで2016年6月3日にアーカイブ
  12. ^ Bemer、Robert William(2000-08-08)。「なぜバイトは8ビットなのですか?それともそうですか?」コンピュータ履歴ビネット2017年4月3日にオリジナルからアーカイブされまし2017年4月3日取得[…] IBMSTRETCHコンピューターを背景として、8つのグループに分割可能な64文字の単語を処理します(私は、 「バイトという用語を作成したWerner Buchholz博士の指導の下、その文字セットを設計しました。 8ビットグループ化の場合)。[…] IBM 360直接ASCIIではありませんが、8ビット文字を使用しました。したがって、ブッフホルツの「バイト」はいたるところに見られました。私自身、多くの理由でその名前が気に入らなかった。[…]
  13. ^ Buchholz、Werner(1956-06-11)。「7.シフトマトリックス」(PDF)リンクシステムIBMpp。5–6。ストレッチメモNo.39G。2017年4月4日にオリジナルからアーカイブ(PDF)2016年4月4日取得[…]編集の観点から最も重要なのは、1〜6ビット長の任意の文字または数字を処理できることです[…]から来る60ビットワードを変換するために使用されるシフトマトリックス並列のメモリ、文字、または「バイト」と呼ばれるものに変換され、加算器に送信されます 連続して。60ビットは6つの異なるレベルで磁気コアにダンプされます。したがって、1が位置9から外れると、その下の6つのコアすべてに表示されます。[…]加算器は、すべてまたは一部のビットのみを受け入れる場合があります。[…]右から4ビットの10進数を操作することが望ましいと仮定します0-対角線が最初にパルス化され、0から5までの6ビットが送信され、そのうちAdderは最初の4つ(0-3)のみを受け入れます。ビット4と5は無視されます。次に、4つの対角線がパルスされます。これにより、ビット4から9が送信され、そのうち最後の2つは再び無視されます。[…]英数字の作業で6ビットすべてを使用したり、論理分析のために1ビットのみのバイトを処理したり、任意の数のビットでバイトをオフセットしたりするのも同じくらい簡単です。[…]
  14. ^ Buchholz、Werner(1977年2月)。「「バイト」という言葉は時代を迎えます...」バイトマガジン2(2):144 。[…]ファイルで最初に見つかった参照は、 Stretchの開発の初期の1956年6月に書かれた内部メモに含まれていましたバイト_ 1から6までの任意の数の並列ビットで構成されると説明されました。したがって、バイトはその場合に適した長さであると想定されました。その最初の使用は、一度に6ビットを処理する1950年代の入出力装置のコンテキストで行われました。8ビットバイトになる可能性は1956年8月に検討され、その後まもなくStretchの設計に組み込まれました。この用語への最初の公開された参照は、1959年にG A BlaauwF P Brooks Jr、およびWBuchholzによる「電子計算機のIREトランザクション」の論文「ProcessingDatain Bits and Pieces」、1959年6月、121ページで発生しました。コンピュータシステムの計画(プロジェクトストレッチ)の第4章で詳しく説明されています、W Buchholz、McGraw-Hill Book Company(1962)によって編集されました。この用語の造語の理論的根拠は、40ページで次のように説明されています。
    バイトは、文字のエンコードに使用されるビットのグループ、または入出力ユニットと並行して送受信されるビット数を示します。ここでは、文字以外の用語が使用されています。これは、特定の文字が異なるアプリケーションで複数のコードによって表される場合があり、異なるコードが異なるビット数(つまり、異なるバイトサイズ)を使用する場合があるためです。入出力伝送では、ビットのグループ化は完全に任意であり、実際の文字とは関係ありません。(この用語はバイトから造られましたが、ビットへの偶発的な突然変異を避けるためにリスペリングされています。)
    システム/ 3602の累乗である基本的なバイトおよびワードサイズを含むStretchの概念の多くを引き継ぎました。ただし、経済性のために、バイトサイズは最大8ビットに固定され、ビットレベルでのアドレス指定はバイトアドレス指定に置き換えられました。[…]
  15. ^ ブラウ、ゲリット・アン; Brooks、Jr.、Frederick Phillips ; Buchholz、Werner(1962)、"Chapter 4:Natural Data Units" (PDF)、in Buchholz、Werner(ed。)、Planning a Computer System – Project StretchMcGraw-Hill Book Company、Inc。 / The Maple Press Company、 York、PA。、pp。39–40 、 LCCN  61-10466、2017-04-03にオリジナル (PDF)からアーカイブ、2017-04-03を取得
  16. ^ Bemer、Robert William(1959)。「256文字の一般化されたカードコードの提案」。ACMの通信2(9):19–23。土井10.1145 /368424.368435S2CID36115735_ 
  17. ^ a b SmallBits の情報Informationin Small Bitsは、IEEE Information TheorySocietyの非営利アウトリーチプロジェクトの一環として作成された本です。この本は、関連性のある漫画の物語と問題解決活動を使用して、8歳以上の子供たちにクロードシャノンと情報理論の基本的な概念を紹介しています。
  18. ^ 「情報を保存、通信、および計算するための世界の技術的能力」 2013年7月27日、ウェイバックマシンでアーカイブ、特にオンライン資料のサポート 2011年5月31日、ウェイバックマシンでアーカイブ、Martin HilbertandPriscilaLópez(2011)、科学、332(6025)、60-65; ここから記事に無料でアクセスできます:martinhilbert.net/WorldInfoCapacity.html
  19. ^ バタチャリヤ、阿弥陀如来(2005)。デジタル通信タタマグロウヒルエデュケーションISBN 978-0-07059117-22017-03-27にオリジナルからアーカイブされました。

外部リンク

  • ビット計算機–ビット、バイト、キロビット、キロバイト、メガビット、メガバイト、ギガビット、ギガバイト間の変換を提供するツール
  • BitXByteConverter –さまざまな単位でファイルサイズ、ストレージ容量、およびデジタル情報を計算するためのツール