ASCII

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

ASCII
USASCIIコードchart.png
1972年以前のプリンタマニュアルのASCIIチャート
MIME / IANAus-ascii
エイリアスISO-IR-006、[1] ANSI_X3.4-1968、ANSI_X3.4-1986、ISO_646.irv:1991、ISO646-US、米国、IBM367、cp367 [2]
言語英語
分類ISO646シリーズ
拡張機能
前任者ITA 2FIELDATA
成功ISO 8859Unicode

ASCII/ æ S K I / 聞くこの音について ASSの-kee)、[3] :6 から略記情報交換用米国標準コードは、あるコードキャラクタの電子通信のための標準を。ASCIIコードは、コンピューター、通信機器、およびその他のデバイスのテキストを表します最新の文字エンコード方式のほとんどはASCIIに基づいていますが、多くの追加文字をサポートしています。

割り当て番号機関インターネット(IANA)が名を好むUS-ASCIIこの文字エンコーディングのために。[2]

ASCIIはIEEEマイルストーンの1つです

概要

ASCIIは電信コードから開発されました。その最初の商用利用は、ベルデータサービスによって促進された7ビット テレプリンターコードとしてでした。 ASCII標準に関する作業は、1961年5月に、米国規格協会(ASA)(現在は米国規格協会(ANSI))X3.2小委員会の最初の会議で始まりました。この規格の初版は1963年に発行され、[4] [5] 1967年に大幅な改訂が行われ[6] [7]、1986年に最新の更新が行われました。[8]以前の電信コードと比較して、提案されたベルコードとASCIIは両方とも、リストのより便利なソート(つまり、アルファベット順)と、テレプリンター以外のデバイスの追加機能のために注文されました。[要出典]

ネットワーク交換のためのASCII形式の使用は1969年に説明されました。[9]その文書は2015年にインターネット標準に正式に昇格されました。[10]

もともと英語のアルファベットに基づいていたASCIIは、上記のASCIIチャートに示されているように、128個の指定された文字を7ビット整数にエンコードします[11]エンコードされた文字の95は印刷可能です。これらには、0から9の数字、小文字のaからz、大文字のAからZ、および句読記号が含まれます。さらに、元のASCII仕様には、テレタイプマシンで作成された33の非印刷制御コード含まれていました。これらのほとんどは現在廃止されています[12]。ただし、キャリッジリターンラインフィードタブコードなど、まだ一般的に使用されているものがいくつかあります

たとえば、小文字のiは、ASCIIエンコーディングで2進数の1101001 = 16進数の69(iは9番目の文字)= 10進数の105で表されます。

歴史

ASCII(1963)。同等のコントロールのコントロール画像は、存在する場合は表示され、それ以外の場合は灰色の点で表示されます。

情報交換のためのアメリカ標準コード(ASCII)は、X3委員会と呼ばれるアメリカ標準協会(ASA)の委員会の後援の下、X3.2(後のX3L2)小委員会によって、そして後にその小委員会のX3によって開発されました。 2.4ワーキンググループ(現在はINCITS)。 ASAは、アメリカ合衆国規格協会(USASI)[3] :211に なり、最終的には米国規格協会(ANSI)になりました。

他の特殊文字と制御コードが入力されると、ASCIIはASA X3.4-1963として公開され[5] [13]、意味が割り当てられていない28のコード位置と、将来の標準化のために予約された1つの未割り当ての制御コードが残ります。[3] :66、245 当時、小文字のアルファベットではなく、より多くの制御文字を使用する必要があるかどうかについて、いくつかの議論がありました。[3] :435決定 は長くは続かなかった:1963年5月、新しい電信アルファベットに関するCCITT作業部会は、小文字をに割り当てることを提案した[a] [14] 6および7、[15]および国際標準化機構。TC 97 SC 2は、10月に、変更をドラフト標準に組み込むことを投票しました。[16] X3.2.4タスクグループは、1963年5月の会議でASCIIへの変更の承認に投票しました。[17]スティック[a] [14] 6および7で小文字を見つけると、文字のビットパターンが大文字と1ビット異なり、大文字と小文字を区別しない文字の照合とキーボードおよびプリンターの構成が簡素化されました

X3委員会は、他の新しい文字(中括弧縦棒の文字)、[18]一部の制御文字の名前の変更(SOMがヘッダーの開始(SOH)になりました)、他の文字の移動または削除(RUの削除)など、その他の変更を行いました。[3] :247–248  ASCIIは、その後USAS X3.4-1967、[6] [19]、USAS X3.4-1968、ANSI X3.4-1977、最後にANSIX3.4-1986として更新されました。[8] [20]

ASCII標準の改訂:

  • ASA X3.4-1963 [3] [5] [19] [20]
  • (それにもかかわらずで使用承認が、公開されていない、ASA X3.4-1965 IBM 2260および2265表示ステーション、IBM 2848表示制御)[3] :423、425から428まで、435から439  [21] [19] [20]
  • USAS X3.4-1967 [3] [6] [20]
  • USAS X3.4-1968 [3] [20]
  • ANSI X3.4-1977 [20]
  • ANSI X3.4-1986 [8] [20]
  • ANSI X3.4-1986(R1992)
  • ANSI X3.4-1986(R1997)
  • ANSI INCITS 4-1986(R2002)[22]
  • ANSI INCITS 4-1986(R2007)[23]
  • (ANSI)INCITS 4-1986 [R2012] [24]
  • (ANSI)INCITS 4-1986 [R2017] [25]

X3.15規格では、X3委員会はASCIIの送信方法(最下位ビットを最初に)[3] :249–253  [26]および穴あきテープへの記録方法についても取り上げました彼らは、磁気テープの9トラック標準を提案し、いくつかのパンチカード形式を処理しようとしました。

設計上の考慮事項

ビット幅

X3.2小委員会は、以前のテレプリンターエンコーディングシステムに基づいてASCIIを設計しました。他の文字エンコーディングと同様に、ASCIIはデジタルビットパターンと文字シンボル(つまり、書記素制御文字)の間の対応を指定します。これにより、デジタルデバイスは相互に通信し、書記言語などの文字指向の情報を処理、保存、および通信できます。 ASCIIが開発される前は、使用されていたエンコーディングには、26個のアルファベット文字、10個の数字、および11個から25個の特殊なグラフィック記号が含まれていました。これらすべてを含め、と互換性のある制御文字ComitéConsultatif国際TELEPHONIQUEらTélégraphique(CCITT)国際電信アルファベット2号1924年(ITA2)標準、[27] [28] FIELDATA(1956 [要出典])、および初期EBCDIC(1963)は、64の以上のコードが必要とされましたASCIIの場合。

ITA2は、エミール・ボドーが1870年に発明し、1874年に特許を取得した5ビットの電信コードに基づいていました。[28]

委員会は、64を超えるコードを6ビットコードで表すことができるシフト関数(ITA2などの可能性について議論しました。シフトされたコードでは、一部の文字コードが次の文字コードのオプション間の選択を決定します。コンパクトなエンコードが可能ですが、シフトコードの送信中にエラーが発生すると、通常、送信の大部分が読み取れなくなるため、データ送信の信頼性は低くなります。標準化委員会はシフトに反対することを決定したため、ASCIIには少なくとも7ビットのコードが必要でした。[3] :215、236§4 

委員会は8ビットコードを検討しました。8ビット(オクテット)を使用すると、2つの4ビットパターンで2進化10進数を使用して2桁を効率的にエンコードできるためです。ただし、7ビットで十分な場合は、すべてのデータ送信で8ビットを送信する必要があります。委員会は、データ送信に関連するコストを最小限に抑えるために7ビットコードを使用することに投票しました。当時の穴あきテープは1つの位置に8ビットを記録できるため、必要に応じエラーチェック用のパリティビットも使用できました[3] :217、236§5 パリティチェックを使用しなかった8ビットマシン(ネイティブデータ型としてオクテットを使用)は、通常、8ビットを0に設定します。[29]

内部組織

コード自体は、識別を容易にするために、ほとんどの制御コードが一緒になり、すべてのグラフィックコードが一緒になるようにパターン化されました。最初の2つのいわゆるASCIIスティック[a] [14](32位置)は、制御文字用に予約されていました。[3] :220、236 8、9) 「スペース」の文字が作るために、グラフィックスの前に来ていたソートそれは20位となりましたので、簡単に[3] :237§10 同じ理由で、区切り記号として一般的に使用される多くの特別な記号が数字の前に配置されました。委員会は、大文字の 64文字のアルファベットをサポートすることが重要であると判断しました、およびASCIIをパターン化することを選択したためDEC SIXBITコード(1963)で行われたように、使用可能な64文字のグラフィックコードセットに簡単に縮小できます。[3] :  228、237§14したがって、小文字は大文字とインターリーブされませんでした。小文字やその他のグラフィックのオプションを利用できるようにするために、文字の前に特殊コードと数値コードを配置し、対応する英国規格のドラフトと一致するように文字Aを41進数の位置に配置しました[3] :238§180〜9 の数字の前には011が付いていますが、残りの4ビットはバイナリのそれぞれの値に対応しており、次のように変換されます。2進化10進数は簡単です。

英数字以外の文字の多くは、タイプライターでのシフトされた位置に対応するように配置されました。重要な微妙な点は、これらが電動タイプライターではなく、機械式タイプライターに基づいていることです。[30]機械式タイプライターは、シフトキーを備えた最初のタイプライターであるRemington No. 2(1878)によって設定された標準に従い、のシフト値 –初期のタイプライターはO(大文字のo)とlを使用して01を省略しました(小文字のL)代わりに、0と1が一般的になると、ペアが標準になりました。したがって、ASCIIでは23456789-"#$%_&'()1!0)!"#$%隣接するスティックの1〜5の数字に対応する、2番目のスティック[a] [14]の位置1〜5に配置されました[a] [14]ただし、0対応する場所はスペース文字であるため、括弧は90に対応できませんでした。これは6から(アンダースコア)を削除し、残りの文字をシフトすることで対応されました。これは、括弧を89で配置した多くのヨーロッパのタイプライターに対応していました。タイプライターからのこの不一致は、ビットペアキーボード、特にテレタイプモデル33につながりました_、従来の機械式タイプライターではなく、ASCIIに対応する左シフトレイアウトを使用しました。電気タイプライター、特にIBM Selectric(1961)は、IBM PC(1981)、特にモデルM(1984)に続いて、コンピューターで標準となった多少異なるレイアウトを使用していたため、最新のキーボードのシンボルのシフト値は対応していません。以前のキーボードと同じくらいASCIIテーブルに近い。/?ペアも2番の日付、及び,< .>ペアは(シフトせず、第2号を含む他のいくつかのキーボードで使用された,(カンマ)または.それらがunshiftingずに大文字で使用することができるように(完全停止))。ただし、ASCIIは;:ペア(2番まで)、および数学記号(さまざまな規則、一般的に-* =+)をに再配置しました:* ;+ -=

一部の一般的な文字は含まれていませんでしたが、特に½¼¢^`~国際的な使用や<>数学的な使用のための発音区別符号として、単純な線の文字\|(commonに加えて/とともに含まれていました@の記号はヨーロッパ大陸で使用され、委員会は、それが、アクセントに置き換えられると期待されていなかったÀので、フランス語のバリエーションに@が40位に入れたの六角右の文字Aの前に、[3] :243 

データ送信に不可欠と思われる制御コードは、メッセージの開始(SOM)、アドレスの終了(EOA)、メッセージの終了(EOM)、送信の終了(EOT)、「あなたは誰ですか?」でした。(WRU)、「あなたは?」(RU)、予約済みデバイス制御(DC0)、同期アイドル(SYNC)、および肯定応答(ACK)。これらは、ビットパターン間ハミング距離を最大化するように配置されました。[3] :243–245 

文字の順序

ASCIIコードの順序はASCIIbetical順序とも呼ばれます。[31] データの照合は、「標準の」アルファベット順(照合順序ではなく、この順序で行われることがあります。ASCII順の主な逸脱は次のとおりです。

  • すべて大文字は小文字の前にあります。たとえば、「Z」は「a」の前にあります
  • 文字の前に数字と多くの句読点があります

中間順序は、ASCII値を比較する前に、大文字を小文字に変換します。

キャラクターグループ

制御文字

ASCIIは、制御文字用に最初の32コード(10進数の0〜31の数字)を予約します。元々は印刷可能な情報を表すのではなく、ASCIIを使用するデバイス(プリンターなどを制御したり、データに関するメタ情報を提供したりすることを目的としたコードです。磁気テープに保存されているようなストリーム。

たとえば、文字10は「改行」機能(プリンタが用紙を進める)を表し、文字8は「バックスペース」を表します。RFC  2822は、キャリッジリターン、改行または含まない制御文字を意味する空白非空白制御文字などを。[32]基本的な行指向のフォーマットを規定する制御文字を除いて、ASCIIはドキュメント内のテキストの構造または外観を記述するためのメカニズムを定義していません。マークアップ言語、アドレスページ、ドキュメントのレイアウトやフォーマットなどの他のスキーム

元のASCII標準では、各制御文字に短い説明句のみが使用されていました。これによって引き起こされたあいまいさは、たとえば、端末リンクデータストリーム文字がわずかに異なる方法で使用される場合など、意図的なものである場合もあれば、「削除」の意味で偶発的な場合もあります。

おそらく、これらの文字の解釈に最も影響を与えた単一のデバイスは、テレタイプモデル33 ASRでした。これは、利用可能な紙テープリーダー/パンチオプションを備えた印刷端末でした。紙テープは、1980年代までの長期プログラム保存に非常に人気のある媒体であり、磁気テープよりも安価で、ある意味では壊れにくいものでした。特に、コード17(Control-Q、DC1、XONとも呼ばれる)、19(Control-S、DC3、XOFFとも呼ばれる)、および127(削除)のテレタイプモデル33マシン割り当て)事実上の標準になりました。モデル33は、Control-G(コード7、BEL、オペレーターに音声で警告することを意味します)の説明を文字通りに解釈したことでも注目に値します。これは、ユニットにBEL文字を受信したときに鳴った実際のベルが含まれていたためです。 Oキーのキートップにも左矢印記号(アンダースコアの代わりにこの文字が含まれているASCII-1963から)が表示されたため、コード15(Control-O、Shift In)の非準拠の使用は「前の文字を削除」と解釈されましたまた、多くの初期のタイムシェアリングシステムで採用されましたが、最終的には無視されるようになりました。

自動紙テープリーダーを搭載したTeletype33 ASRがControl-S(XOFF、送信オフの略)を受信すると、テープリーダーが停止しました。 Control-Q(XON、「送信オン」)を受信すると、テープリーダーが再開しました。この手法は、オーバーフローが差し迫っているために送信者に送信を停止するよう警告する「ハンドシェイク」信号として、いくつかの初期のコンピュータオペレーティングシステムで採用されるようになりました。手動出力制御技術として、多くのシステムで今日まで存続しています。一部のシステムでは、Control-Sはその意味を保持しますが、出力を再開するためにControl-Qが2番目のControl-Sに置き換えられます。 33 ASRは、Control-R(DC2)およびControl-T(DC4)を使用してテープパンチを開始および停止するように構成することもできます。この機能を搭載した一部のユニットでは、文字の上のキーキャップの対応する制御文字の文字はTAPEであり、それぞれTAPE[33]

削除とバックスペース

Teletypeは頭を後方に動かすことができなかったため、BS(バックスペース)を送信するためのキーをキーボードに配置しませんでした。代わりに、RUB OUTコード127(DEL)を送信するマークが付けられたキーがありましたこのキーの目的は、手でタイプした紙テープの間違いを消去することでした。オペレーターは、テープパンチのボタンを押してバックアップし、すべての穴を開けて間違いを次のような文字に置き換えたラブアウトを入力する必要がありました。無視されることを意図していた。[34] Teletypesは、Digital Equipment Corporationの安価なコンピューターで一般的に使用されていたため、これらのシステムでは、使用可能なキー、つまりDELコードを使用して前の文字を消去する必要がありました。[35] [36]このため、DECビデオ端末(デフォルト)は「Backspace」とマークされたキーのDELコードを送信し、「Delete」とマークされたキーはエスケープシーケンスを送信しましたが、他の多くの端末はBackspaceキーのBSを送信しました。Unixターミナルドライバーは前の文字を消去するために1つのコードしか使用できませんでした。これはBSまたはDELに設定できましたが、両方に設定することはできませんでした。kshbashzshなどの行編集を可能にするものは両方を理解します)。どのキーもBSに送信されないという仮定は、Control + Hは、そのような中、「ヘルプ」prefixコマンドなど、他の目的に使用される原因となったGNU Emacsの[37]

エスケープ

さらに多くの制御コードには、元のコードとはまったく異なる意味が与えられています。たとえば、「エスケープ」文字(ESC、コード27)は、元々、他の制御文字をその意味を呼び出すのではなく、リテラルとして送信できるようにすることを目的としていました。これは、URLエンコード、C言語の文字列、および特定の文字が予約された意味を持つその他のシステムで発生する「エスケープ」と同じ意味です。時間の経過とともに、この意味は採用され、最終的には変更されました。最近の使用では、端末に送信されるESCは通常、コマンドシーケンスの開始を、通常、いわゆる「ANSIエスケープコード」(より正確には「制御シーケンスイントロデューサー」)の形式で示します。")ECMA-48(1972)およびその後継から、ESCで始まり、その後に" ["(左角かっこ)文字が続きます。端末から送信されるESCは、ほとんどの場合、終了に使用される帯域外文字として使用されます。TECOおよびvi テキストエディタの場合同様に、操作グラフィカルユーザーインターフェイス(GUI)およびウィンドウシステムでは、ESCは通常、アプリケーションに現在の操作を中止するか、完全終了(終了)させます。

行の終わり

多くの制御文字に固有のあいまいさは、それらの履歴の使用法と組み合わされて、システム間で「プレーンテキスト」ファイルを転送するときに問題を引き起こしました。この最良の例は、さまざまなオペレーティングシステムでの改行の問題です。テレタイプマシンでは、テキストの行を「キャリッジリターン」(プリントヘッドを行の先頭に移動する)と「ラインフィード」(プリントヘッドを移動せずに用紙を1行進める)の両方で終了する必要がありました。 「キャリッジリターン」という名前は、手動タイプライターでタイプバーがリボンに当たった位置が静止したままで、紙を保持しているキャリッジが移動しました。次の行のために用紙の左マージンを配置するために、キャリッジ全体を右に押す(戻す)必要がありました。

DECオペレーティングシステム(OS / 8RT-11RSX-11RSTSTOPS-10など)は、コンソールデバイス(元々はテレタイプマシン)が機能するように、両方の文字を使用して行の終わりをマークしました。いわゆる「ガラスTTY」(後にCRTまたは端末と呼ばれる)が登場するまでに、条約は十分に確立されていたため、下位互換性のために条約を継続する必要がありました。GaryKildallCP / M作成したとき、彼はDECRT-11で使用されているいくつかのコマンドラインインターフェイスの規則に触発されました1981年にPCDOS導入されるまでIBMは1970年代のオペレーティングシステムはASCIIではなくEBCDICを使用し、キャリッジリターンの概念が無意味なパンチカード入力とラインプリンタ出力を対象としていたため、これには何の役にも立ちませんでした。 IBMのPCDOSMicrosoftによってMS-DOSとしても販売されている)は、CP / Mに大まかに基づいているため[38]WindowsはMS-DOSから継承しました。

残念ながら、行の終わりをマークするために2文字を要求すると、不必要な複雑さが生じ、単独で遭遇したときに各文字をどのように解釈するかについて疑問が生じます。問題を単純化するために、Multics [39]のファイルを含むプレーンテキストデータストリームは、ラインターミネータとしてラインフィード(LF)のみを使用していました。UnixおよびUnixライクなシステム、およびAmigaシステムは、Multicsからこの規則を採用しました。一方、元のMacintosh OSApple DOS、およびProDOSは、ラインターミネータとしてキャリッジリターン(CR)のみを使用していました。ただし、AppleがこれらのオペレーティングシステムをUnixベースのmacOSに置き換えたためオペレーティングシステムでは、現在、改行(LF)も使用しています。Radio Shack TRS-80は、回線を終了するために1つのCRも使用しました。

ARPANETに接続されたコンピューターには、CR-LF行末を使用するTOPS-10やTENEXなどのオペレーティングシステムを実行するマシン、LF行末を使用するMulticsなどのオペレーティングシステムを実行するマシン、および行を表すOS / 360などのオペレーティングシステムを実行するマシンが含まれます。文字数の後に行の文字が続き、ASCIIではなくEBCDICを使用したもの。TelnetプロトコルがASCIIの定義された「ネットワーク仮想端末"(NVT)、ネットワークを介して標準のテキスト形式を送信することにより、異なる行末規則と文字セットを持つホスト間の接続をサポートできるようにします。TelnetはCR-LF行末とともにASCIIを使用し、他の規則を使用するソフトウェアは変換します地元の慣習とNVTの間。[40]ファイル転送プロトコルは、コマンドを送信し、デフォルトのASCIIモードでデータを転送する際に使用するため、ネットワーク仮想端末の使用を含め、Telnetプロトコルを採用した。[41] [42]これが追加されますNVTのCR-LF行末規則を使用しないシステムでの、これらのプロトコルの実装、および電子メールやワールドワイドウェブに使用されるものなどの他のネットワークプロトコルの複雑さ。[43][44]

ファイル/ストリームの終わり

PDP-6モニター[35]とその後継のTOPS-10 [36]は、端末からの入力のファイルの終わりを示すためにControl-Z(SUB)を使用していました。CP / Mなどの一部のオペレーティングシステムは、ディスクブロック単位でのみファイルの長さを追跡し、Control-Zを使用してファイル内の実際のテキストの終わりをマークしました。[45]これらの理由から、EOF、つまりファイルの終わりは、SUBstituteの代わりにControl-Zの3文字の頭字語として口語的かつ慣習的に使用されていました。Control-Cとも呼ばれるテキストの終わりコード(ETXは、さまざまな理由で不適切でしたが、ファイルを終了するための制御コードとしてZを使用することは、アルファベットを終了することに類似しており、非常に便利です。ニーモニックエイド歴史的に一般的で現在も普及している規則では、ETXコード規則を使用して、通常はキーボードからの入力データストリームを介してプログラムを中断および停止します。

CライブラリおよびUnixの規則では、ヌル文字はテキスト文字列を終了するために使用されますこのようなヌル終了文字列は、略してASCIZまたはASCIIZと呼ばれます。ここで、Zは「ゼロ」を表します。

制御コードチャート

バイナリ 10月 12月 16進数 略語 [NS] [NS] [NS] 名前(1967)
1963年 1965年 1967年
000 0000 000 0 00 ヌル NUL ^ @ \ 0 ヌル
000 0001 001 1 01 SOM SOH ^ A 見出しの開始
000 0010 002 2 02 EOA STX ^ B テキストの始まり
000 0011 003 3 03 EOM ETX ^ C テキストの終わり
000 0100 004 4 04 EOT ^ D 送信の終了
000 0101 005 5 05 WRU ENQ ^ E 問い合わせ
000 0110 006 6 06 RU ACK ^ F 了承
000 0111 007 7 07 ベル ベル ^ G \NS ベル
000 1000 010 8 08 FE0 BS ^ H \NS バックスペース[e] [f]
000 1001 011 9 09 HT / SK HT ^私 \NS 水平タブ[g]
000 1010 012 10 0A LF ^ J \NS 改行
000 1011 013 11 0B VTAB VT ^ K \ v 垂直タブ
000 1100 014 12 0C FF ^ L \NS フォームフィード
0001101 015 13 0D CR ^ M \NS キャリッジリターン[h]
000 1110 016 14 0E それで ^ N シフトアウト
000 1111 017 15 0F SI ^ O シフトイン
001 0000 020 16 10 DC0 DLE ^ P データリンクエスケープ
001 0001 021 17 11 DC1 ^ Q デバイス制御1(多くの場合XON
001 0010 022 18 12 DC2 ^ R デバイス制御2
001 0011 023 19 13 DC3 ^ S デバイス制御3(多くの場合XOFF
001 0100 024 20 14 DC4 ^ T デバイス制御4
001 0101 025 21 15 ERR NAK ^ U 否定的な謝辞
001 0110 026 22 16 SYNC SYN ^ V 同期アイドル
001 0111 027 23 17 LEM ETB ^ W 送信ブロックの終わり
001 1000 030 24 18 S0 できる ^ X キャンセル
001 1001 031 25 19 S1 EM ^ Y ミディアムの終わり
001 1010 032 26 1A S2 NS サブ ^ Z 代わりの
001 1011 033 27 1B S3 NS ^ [ \ e [i] エスケープ[j]
001 1100 034 28 1C S4 FS ^ \ ファイル区切り文字
001 1101 035 29 1D S5 GS ^] グループ区切り文字
001 1110 036 30 1E S6 RS ^^ [k] レコード区切り文字
001 1111 037 31 1F S7 我ら ^ _ ユニットセパレーター
111 1111 177 127 7F DEL ^? 削除[l] [f]

ISO 2047グラフィックスや16進など、他の表現が特殊な機器によって使用される場合があります。

印刷可能な文字

コードは207Eのに六角印刷可能文字として知られ、文字、数字、表す句読点、およびいくつかのその他のシンボルを。印刷可能な文字は全部で95文字あります。[NS]

コード20の16進数「スペース」文字は、キーボードのスペースバーによって生成される単語間のスペースを示します。スペース文字は(制御文字ではなく)非表示のグラフィックと見なされるため[3] :223  [46]、前のセクションではなく、以下の表にリストされています。

コード7Fの16進数は、印刷不可能な「削除」(DEL)制御文字に対応しているため、このチャートからは省略されています。前のセクションのチャートで説明されています。以前のバージョンのASCIIは、キャレット(5E hex)の代わりに上向き矢印を使用しアンダースコア(5F hex)の代わりに左矢印を使用していました[5] [47]

バイナリ 10月 12月 16進数 グリフ
1963年 1965年 1967年
010 0000 040 32 20  スペース
010 0001 041 33 21
010 0010 042 34 22 「」
010 0011 043 35 23
010 0100 044 36 24 $
010 0101 045 37 25
010 0110 046 38 26
010 0111 047 39 27 '
010 1000 050 40 28 ((
010 1001 051 41 29 )。
010 1010 052 42 2A *
010 1011 053 43 2B +
010 1100 054 44 2C
010 1101 055 45 2D -
010 1110 056 46 2E
010 1111 057 47 2F /
011 0000 060 48 30 0
011 0001 061 49 31 1
011 0010 062 50 32 2
011 0011 063 51 33 3
011 0100 064 52 34 4
011 0101 065 53 35 5
011 0110 066 54 36 6
011 0111 067 55 37 7
011 1000 070 56 38 8
011 1001 071 57 39 9
011 1010 072 58 3A
011 1011 073 59 3B ;
011 1100 074 60 3C <
011 1101 075 61 3D =
011 1110 076 62 3E >>
011 1111 077 63 3F
100 0000 100 64 40 @ ` @
100 0001 101 65 41 NS
100 0010 102 66 42 NS
100 0011 103 67 43 NS
100 0100 104 68 44 NS
100 0101 105 69 45 E
100 0110 106 70 46 NS
100 0111 107 71 47 NS
100 1000 110 72 48 NS
100 1001 111 73 49
100 1010 112 74 4A NS
100 1011 113 75 4B K
100 1100 114 76 4C L
100 1101 115 77 4D NS
100 1110 116 78 4E NS
100 1111 117 79 4F O
101 0000 120 80 50 NS
101 0001 121 81 51 NS
101 0010 122 82 52 NS
1010011 123 83 53 NS
101 0100 124 84 54 NS
101 0101 125 85 55 U
101 0110 126 86 56 V
101 0111 127 87 57 W
101 1000 130 88 58 NS
101 1001 131 89 59 Y
101 1010 132 90 5A Z
101 1011 133 91 5B [
101 1100 134 92 5C \ \
101 1101 135 93 5D ]
101 1110 136 94 5E ^
101 1111 137 95 5F _
110 0000 140 96 60 @ `
110 0001 141 97 61 NS
110 0010 142 98 62 NS
110 0011 143 99 63 NS
110 0100 144 100 64 NS
110 0101 145 101 65 e
110 0110 146 102 66 NS
110 0111 147 103 67 NS
110 1000 150 104 68 NS
110 1001 151 105 69
110 1010 152 106 6A NS
110 1011 153 107 6B k
110 1100 154 108 6C l
110 1101 155 109 6D NS
110 1110 156 110 6E NS
110 1111 157 111 6F o
111 0000 160 112 70 NS
111 0001 161 113 71 NS
111 0010 162 114 72 NS
111 0011 163 115 73 NS
111 0100 164 116 74 NS
111 0101 165 117 75 u
111 0110 166 118 76 v
111 0111 167 119 77 w
111 1000 170 120 78 NS
111 1001 171 121 79 y
111 1010 172 122 7A z
111 1011 173 123 7B {{
111 1100 174 124 7C ACK ¬ |
111 1101 175 125 7D }
111 1110 176 126 7E NS |

キャラクターセット

以前のバージョン(1963バージョンまたは1965ドラフト)で異なるキャラクターを表したポイントは、ボックスで示されています。1963バージョン以降に割り当てられたが、それ以外は変更されていないポイントは、凡例の色に比べて薄い色で表示されます。

ASCII(1977/1986)
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _NS _NS _NS _NS _E _NS
0_
0
NUL
0000
SOH
0001
STX
0002
ETX
0003
EOT
0004
ENQ
0005
ACK
0006
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
DC4
0014
NAK
0015
SYN
0016
ETB
0017
CAN
0018
EM
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
US
001F
2_
32
SP
0020

0021
"
0022

0023
$
0024

0025

0026
'
0027

0028

0029
*
002A
+
002B

002C
-
002D

002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039

003A
;
003B
<
003C
=
003D
>
003E

003F
4_
64
@
0040

0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
私は
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060

0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
私は
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D

007E
DEL
007F

  手紙  番号  句読点  シンボル  他の  未定義  1963年版または1965年ドラフトからキャラクターが変更されました

使用する

ASCIIは、1963年にAmerican Telephone&TelegraphのTWX(TeletypeWriter eXchange)ネットワーク用の7ビットテレプリンターコードとして最初に商業的に使用されましたTWXは元々、競合するTelexテレプリンターシステムでも使用されていた以前の5ビットITA2を使用していましたBob Bemerは、エスケープシーケンスなどの機能を導入しました[4]彼の英国人の同僚であるヒュー・マックレガー・ロスは、この作品の普及に貢献しました。ベマーによれば、「ASCIIになる予定のコードは、ヨーロッパでは最初にベマー・ロス・コードと呼ばれるほどでした」。[48] ASCIIに関する彼の広範な研究のために、Bemerは「ASCIIの父」と呼ばれてきました。[49]

1968年3月11日、米国大統領リンドンB.ジョンソン、米国連邦政府が購入したすべてのコンピューターがASCIIをサポートすることを義務付け、次のように述べています。[50] [51] [52]

また、コンピュータ操作で使用する場合に磁気テープと紙テープに情報交換の標準コードを記録するための標準に関する商務長官[ Luther H.Hodges ]の推奨事項を承認しました。1969年7月1日以降に連邦政府の在庫に持ち込まれたすべてのコンピューターおよび関連機器の構成は、情報交換の標準コードと、これらのメディアを使用するときに磁気テープおよび紙テープの標準で規定された形式を使用する機能を備えている必要があります。

ASCIIは、UTF-8エンコーディングがそれを上回った2007年12月までワールドワイドウェブ上で最も一般的な文字エンコーディングでした。UTF-8はASCIIと下位互換性があります。[53] [54] [55]

バリアントと派生

コンピュータ技術が世界中に普及するにつれて、さまざまな標準化団体や企業が、ローマベースのアルファベットを使用した英語以外の言語の表現を容易にするために、ASCIIの多くのバリエーションを開発しました。これらのバリエーションの一部を「ASCII拡張機能として分類することもできますが、その用語を誤用して、ASCIIの文字マップを7ビット範囲で保持しないものを含むすべてのバリエーションを表す場合もあります。さらに、ASCII拡張機能もASCIIとして誤ってラベル付けされています。

7ビットコード

[56] ASCIIは、開発の初期から、国際的な文字コード標準のいくつかの国内バリアントの1つにすぎないことを目的としていました。

他の国際標準機関は、ASCIIと同一またはほぼ同一のISO 646(1967)などの文字エンコードを承認しており、英語のアルファベット以外の文字や、英国のポンドスターリングの記号など、米国外で使用される記号の拡張子が付いています。(£)。 ASCIIは米国と他のいくつかの国のニーズにのみ適合していたため、ほぼすべての国でASCIIの適合バージョンが必要でした。たとえば、カナダにはフランス語の文字をサポートする独自のバージョンがありました。

他の多くの国では、英語以外の文字(例:éñߣ)、通貨記号(例:£¥)などを含むASCIIのバリアントが開発されました。YUSCII(ユーゴスラビア)も参照してください

ほとんどの文字を共有しますが、他のローカルで役立つ文字を「国内使用」用に予約されているいくつかのコードポイントに割り当てます。しかし、ASCII-1963の発行から1967年のISOによる国際勧告の最初の承認までに経過した4年[57]により、国内使用文字に対するASCIIの選択は、世界の事実上の標準であるように見え、混乱と非互換性を引き起こしました。かつて他の国々がこれらのコードポイントに独自の割り当てを行い始めました。

ISO / IEC 646は、ASCIIと同様に、7ビットの文字セットです。追加のコードは使用できないため、同じコードポイントで国ごとに異なる文字がエンコードされます。エスケープコードは、テキストに適用される国別バリアントを示すために定義されましたが、ほとんど使用されなかったため、どのバリアントを使用するか、したがって、コードが表す文字、一般的にはテキストを知ることができないことがよくありました。とにかく、処理システムは1つのバリアントしか処理できませんでした。

ASCIIの括弧と中括弧文字は、ISO / IEC 646の他の国内バリアント、ISOの国内バリアントを使用するドイツ語、フランス語、スウェーデン語などのプログラマーでアクセント付き文字に使用される「国内使用」コードポイントに割り当てられたためです。 / IEC 646は、ASCIIではなく、次のようなものを書き込む必要があり、したがって読み取る必要がありました。

ä aÄiÜ = 'Ön'; ü

それ以外の

{ a[i] = '\n'; }

Cトライグラフは、ANSI Cのこの問題を解決するために作成されましたが、導入が遅れ、コンパイラでの実装に一貫性がないため、使用が制限されていました。多くのプログラマーはコンピューターをUS-ASCIIで維持していたため、スウェーデン語、ドイツ語などのプレーンテキスト(たとえば、電子メールやUsenet)では、単語の途中に「{、}」などのバリエーションが含まれていました。慣れている。たとえば、別のプログラマーに昼食に行くべきかどうかを尋ねるメールを送るスウェーデンのプログラマーは、答えとして「N {jag har sm | rg} sar」を取得できます。これは、「いいえ、私は持っていません」を意味する「Näjagharsmörgåsar」です。サンドイッチ」。

日本と韓国では、まだ2020年代の時点で、バックスラッシュ(5C hex)が¥(日本で円記号)または₩(韓国でウォン記号としてレンダリングされるASCIIのバリエーションが使用されていますこれは、たとえば、ファイルパスC:\ Users \ SmithがC:\ Users \ Smith(日本)またはC:₩Users₩Smith(韓国)として表示されることを意味します。

8ビットコード

結局、8として、16ビットおよび32ビット(以降64ビット)のコンピュータは交換し始め、12を18〜36ビットコンピュータの規範として、それはそれぞれの格納に8ビットのバイトを使用するのが一般的になりましたメモリ内の文字。ASCIIの拡張された8ビットの親戚に機会を提供します。ほとんどの場合、これらはASCIIの真の拡張として開発され、元の文字マッピングはそのまま残されますが、最初の128(つまり、7ビット)文字の後に追加の文字定義が追加されます。

エンコーディングには、ISCII(インド)、VISCII(ベトナム)が含まれます。これらのエンコーディングはASCIIと呼ばれることもありますが、真のASCIIはANSI規格によってのみ厳密に定義されています。

ほとんどの初期の家庭用コンピュータシステムは、線画とゲームグリフを含む独自の8ビット文字セットを開発し、多くの場合、0から31までの制御文字の一部またはすべてをより多くのグラフィックで埋めていました。Kaypro CP / Mコンピューターは、ギリシャ語のアルファベットに「上位」の128文字を使用していました。

PETSCIIのコードコモドールが彼らのために使用され、8ビットのシステムではなく、より一般的なASCII-1967、上で見られるようなの、ASCII-1963に基づいている中、ポスト1970コードのうち、おそらくユニークであるZXスペクトラムコンピュータ。アタリ8ビットコンピュータとGalaksijaのコンピュータも、ASCIIの変種を使用していました。

IBM PCはコードページ437を定義しました。これは、制御文字をスマイリーフェイスなどのグラフィック記号に置き換え、追加のグラフィック文字を上位128の位置にマップしました。DOSなどのオペレーティングシステムはこれらのコードページをサポートし、IBMPCのメーカーはハードウェアでそれらをサポートしていました。Digital Equipment Corporationは、ブロックグラフィックスよりも国際言語向けに設計された最初の拡張機能の1つとして、人気のあるVT220端末で使用するMultinational Character Set(DEC-MCS)を開発しました。 Macintoshで定義されたMacOS Roman また、Postscriptもセットを定義しました。これらは両方とも、現代の文字セットのように、グラフィックではなく国際文字と活版印刷の句読点の両方を含んでいました。

ISO / IEC 8859(DEC-MCS由来)標準は、最終的には(少なくとも正確として、彼らはASCIIをコピーしたが、多くの置換のように)ほとんどのシステムがコピーされたことを標準装備。Microsoftによって設計された人気のある拡張機能であるWindows-1252ISO-8859-1と誤ってラベル付けされることが多い)は、従来のテキスト印刷に必要な活版印刷の句読点を追加しました。ISO-8859-1、Windows-1252、および元の7ビットASCIIは、UTF-8がより一般的になる2008年まで最も一般的な文字エンコードでした[54]

ISO / IEC 4873は、7ビットASCIIエンコーディングを8ビットシステムに拡張する一環として、80〜9Fの16進範囲で定義された32の追加制御コードを導入しました。[58]

Unicode

UnicodeとISO / IEC 10646ユニバーサル文字セット(UCS)には、はるかに幅広い文字配列があり、それらのさまざまなエンコード形式は、多くの環境でISO / IEC8859とASCIIに急速に取って代わり始めています。 ASCIIは128文字に制限されていますが、UnicodeとUCSは、一意の識別(コードポイントと呼ばれる自然な数値を使用)とエンコード(UTF-8と呼ばれる8、16、または32ビットのバイナリ形式)の概念を分離することにより、より多くの文字をサポートします。UTF-16およびUTF-32)。

ASCIIは最初の128記号としてUnicode(1991)文字セットに組み込まれたため、7ビットASCII文字は両方のセットで同じ数値コードを持ちます。これが可能にUTF-8であることが、後方互換性のASCII文字のみを含むUTF-8ファイルは、文字の同一の配列を含むASCIIファイルと同一であるように、7ビットのASCII有します。さらに重要なことに、上位互換性7ビットASCII文字のみを特殊として認識し、最高ビットセットのバイトを変更しないソフトウェアとして保証されます(ISO-8859-1などの8ビットASCII拡張をサポートするためによく行われるように) UTF-8データを変更せずに保持します。[59]

も参照してください

ノート

  1. ^ a b c d e 7ビットASCII文字セットの128文字は、スティック0〜7と呼ばれる8つの16文字グループに分割され最上位3ビットに関連付けられます[14]文字コードの水平表現または垂直表現に応じてスティックはテーブルの行または列のいずれかに対応します。
  2. ^ 制御画像」領域U + 2400からU + 2421までUnicode文字は、意図した機能を実行させるのではなく、印刷または表示する必要がある場合に制御文字を表すために予約されています。一部のブラウザでは、これらが正しく表示されない場合があります。
  3. ^ キャレット記法は、端末の制御文字を表すためによく使用されます。ほとんどのテキスト端末では、Ctrlキーを押しながら2番目の文字を入力すると、制御文字が入力されます。Shiftキーが不要な場合^@もあります。たとえば、Ctrlキーと2キーだけで入力できる場合があります。
  4. ^ Cプログラミング言語およびJavaPerlなど Cプログラミング言語の影響を受ける他の多くの言語の文字エスケープシーケンス(ただし、すべての実装が必ずしもすべてのエスケープシーケンスをサポートしているわけではありません)。
  5. ^ バックスペース文字を押しても入力することができますいくつかのシステム上のキーを。← Backspace
  6. ^ a b Backspaceのあいまいさは、キーボードの主な用途がコンピューターに接続されていないときに手動で紙テープをパンチすることであると想定して設計された初期の端末によるものです。前の文字を削除するには、紙テープのパンチをバックアップする必要がありました。これは、機械的および単純な理由から、キーボードではなくパンチ自体のボタンでした。次に、こすり文字を入力します。したがって、彼らは、バックスペース用のタイプライターで使用される場所に、キーを生成するruboutを配置しました。システムがこれらの端末を使用してコマンドライン編集を提供する場合、バックスペースを実行するために「rubout」コードを使用する必要があり、多くの場合、バックスペース文字を解釈しませんでした(「^ H」をエコーする可能性があります)「バックスペース用」。紙テープ用に設計されていない他の端末は、この場所のキーでバックスペースを生成し、これらの端末用に設計されたシステムは、その文字を使用してバックアップしました。削除コードはバックスペース効果を生成することが多いため、端末メーカーはこれも作成する必要がありました。どのDeleteキーでも、Delete文字以外のものが生成されます。
  7. ^ タブ文字を押しても入力することができますほとんどのシステム上のキーを。Tab ↹
  8. ^ キャリッジリターン文字を押しても入力することができますまたはほとんどのシステム上のキーを。↵ EnterReturn
  9. ^ \ Eのエスケープシーケンスは、の一部ではないISO Cおよび他の多くの言語仕様。ただし、 GCCを含むいくつかのコンパイラによって理解されます。
  10. ^ エスケープ文字を押しても入力することができますいくつかのシステム上のキーを。Esc
  11. ^ ^^はCtrl+を意味します^(「Ctrl」キーキャレットキーを押します)。
  12. ^ [削除文字は時々押して入力することができますいくつかのシステム上のキーを。← Backspace
  13. ^ 印刷された文字は次のとおりです。
     ! "#$%& '()* +、-。/ 0123456789 :; <=>?@ ABCDEFGHIJKLMNOPQRSTUVWXYZ [\] ^ _` abcdefghijklmnopqrstuvwxyz {|}〜

参考文献

  1. ^ ANSI(1975-12-01)。ISO-IR-006:ASCIIグラフィック文字セット(PDF)ITSC​​J / IPSJ
  2. ^ a b "文字セット"Internet Assigned Numbers Authority(IANA)2007-05-14 2019825日取得
  3. ^ a b c d e f g h i j k l m n o p q r s Mackenzie、Charles E.(1980)。コード化された文字セット、歴史と開発(PDF)システムプログラミングシリーズ(1版)。Addison-Wesley Publishing Company、Inc。pp。6、66、211、215、217、220、223、228、236–238、243–245、247–253、423、425–428、435–439。ISBN  978-0-201-14460-4LCCN  77から901652016年5月26日のオリジナルからアーカイブ (PDF)2019年8月25日取得
  4. ^ a b Brandel、Mary(1999-07-06)。「1963年:ASCIIのデビュー」CNN2013年6月17日にオリジナルからアーカイブされました2008年4月14日取得
  5. ^ a b c d 「情報交換のためのアメリカ標準コード、ASAX3.4-1963」アメリカ規格協会(ASA)。1963-06-17 202066日取得
  6. ^ a b c 「情報交換のための米国標準コード、USASX3.4-1967」。アメリカ合衆国標準研究所(USASI)。1967-07-07。 引用ジャーナルには|journal=ヘルプが必要です
  7. ^ Jennings、Thomas Daniel(2016-04-20)[1999]。「いくつかの文字コードまたはASCIIの注釈付き履歴:情報浸透のためのアメリカ標準コード」センシティブリサーチ(SR-IX)2020年3月8日取得
  8. ^ a b c 「情報システムの米国規格—コード化された文字セット—情報交換のための7ビットの米国規格コード(7ビットASCII)、ANSIX3.4-1986」。米国規格協会(ANSI)。1986-03-26。 引用ジャーナルには|journal=ヘルプが必要です
  9. ^ ヴィントンサーフ(1969-10-16)。ネットワーク交換用のASCII形式IETF土井10.17487 / RFC0020RFC 20
  10. ^ バリー・レイバ(2015-01-12)。「RFC20(ASCII形式)のインターネット標準への正しい分類」IETF
  11. ^ シャーリー、R.(2007年8月)、インターネットセキュリティ用語集、バージョン2RFC 4949アーカイブ2016年6月13日に元から、取得した2016年6月13日を 
  12. ^ Maini、Anil Kumar(2007)。デジタルエレクトロニクス:原理、デバイス、およびアプリケーションジョンワイリーアンドサンズNS。28. ISBN 978-0-470-03214-5さらに、テキストの処理方法に影響を与える33の非印刷、ほとんどが廃止された制御文字のコードを定義します。
  13. ^ Bukstein、Ed(1964年7月)。「バイナリコンピュータコードとASCII」エレクトロニクスワールド72(1):28–29。2016年3月3日にオリジナルからアーカイブされまし取得した2016年5月22日を
  14. ^ a b c d e f Bemer、Robert William(1980)。「第1章:ASCIIの内部」(PDF)汎用ソフトウェアベストオブインターフェースエイジ。2米国オレゴン州ポートランド:dilithium Press pp。1–50。ISBN  978-0-918398-37-6LCCN  79から674622016年8月27日にオリジナルからアーカイブされまし2016年827取得 から:
  15. ^ 簡単なレポート:1963年5月13〜15日、新しい電信アルファベットに関するCCITT作業部会の会議。
  16. ^ ISO / TC / 97 / SC 2のレポート– 1963年10月29〜31日の会議。
  17. ^ タスクグループX3.2.4、1963年6月11日、ペンタゴンビル、ワシントンDCに関するレポート。
  18. ^ 会議第8号、タスクグループX3.2.4、1963年12月17日および18日の報告
  19. ^ a b c Winter、Dik T.(2010)[2003]。「米国および国際規格:ASCII」2010年1月16日にオリジナルからアーカイブされまし
  20. ^ a b c d e f g Salste、Tuomas(2016年1月)。「7ビット文字セット:ASCIIのリビジョン」AivostoOy。urn:nbn:fi-fe2012010110042016年6月13日にオリジナルからアーカイブされました取得した2016年6月13日を
  21. ^ 「情報」。サイエンティフィックアメリカン(特別版)。215(3)。9月1966年JSTORのe24931041 
  22. ^ Korpela、Jukka K.(2014-03-14)[2006-06-07]。Unicodeの説明–ドキュメント、プログラム、およびWebサイトの国際化(第1版の第2リリース)。O'Reilly Media、Inc.p118. ISBN 978-0-596-10121-3
  23. ^ ANSI INCITS 4-1986(R2007):情報システムの米国規格–コード化された文字セット–情報交換のための7ビットの米国規格コード(7ビットASCII)(PDF)、2007 [1986]、アーカイブ(PDF) 2014-02-07のオリジナルから、2016-06-12を取得
  24. ^ 「INCITS4-1986 [R2012]:情報システム-コード化された文字セット-情報交換のための7ビット米国規格コード(7ビットASCII)」2012-06-15。2020-02-28にオリジナルからアーカイブされました2020-02-28を取得
  25. ^ 「INCITS4-1986 [R2017]:情報システム-コード化された文字セット-情報交換のための7ビット米国規格コード(7ビットASCII)」2017-11-02 [2017-06-09]。2020-02-28にオリジナルからアーカイブされました2020-02-28を取得
  26. ^ シリアルバイビットデータ伝送における情報交換のための米国規格コードのビットシーケンス米国規格協会(ANSI)、1966、X3.15-1966
  27. ^ 「BruXy:ラジオテレタイプ通信」2005-10-10。2016年4月12日にオリジナルからアーカイブされました取得した2016年5月9日を送信されるコードは、1924年にCCITTによって導入されたInternational Telegraph Alphabet No. 2(ITA-2)を使用します。
  28. ^ a b Smith、Gil(2001)。「テレタイプ通信コード」(PDF)Baudot.net。2008年8月20日にオリジナルからアーカイブ(PDF)2008年7月11取得
  29. ^ Sawyer、Stanley A。; クランツ、スティーブンジョージ(1995)。科学者のためのTeX入門書CRC Press、LLCNS。13. Bibcode1995tps..book ..... SISBN 978-0-8493-7159-22016年12月22日にオリジナルからアーカイブされました2016年10月29日取得
  30. ^ Savard、JohnJG 「コンピューターキーボード」2014-09-24にオリジナルからアーカイブされました2014年8月24日取得
  31. ^ 「ASCIIbetical定義」PCマガジン2013-03-09にオリジナルからアーカイブされました2008年4月14日取得
  32. ^ レズニック、P.(2001年4月)、インターネットメッセージ形式RFC 2822アーカイブ2016年6月13日に元からは、取得した2016年6月13日を  (注:NO-WS-CTL。)
  33. ^ マコーネル、ロバート; ヘインズ、ジェームズ; ウォーレン、リチャード。「ASCIIコードを理解する」2014-02-27にオリジナルからアーカイブされました2014年511取得
  34. ^ バリーマーゴリン(2014-05-29)。「Re:エディターとワードプロセッサーの履歴(以前は:Re:emacsのRTF)」help-gnu-emacs(メーリングリスト)。2014-07-14にオリジナルからアーカイブされました取得した2014年7月11日を
  35. ^ a b 「PDP-6マルチプログラミングシステムマニュアル」(PDF)Digital Equipment Corporation(DEC)。1965年。p。43. 2014-07-14のオリジナルからアーカイブ(PDF)取得した2014年7月10日を
  36. ^ a b 「PDP-10リファレンスハンドブック、ブック3、モニターとの通信」(PDF)Digital Equipment Corporation(DEC)。1969年。p。5-5。2011年11月15日のオリジナルからアーカイブ(PDF)取得した2014年7月10日を
  37. ^ 「ヘルプ-GNUEmacsマニュアル」2018年7月11日にオリジナルからアーカイブされました2018711日取得
  38. ^ ティム・パターソン(2007-08-08)。「DOSはCP / Mのぼったくりですか?」DosManDrivel2018年4月20日にオリジナルからアーカイブされました2018419日取得
  39. ^ Ossanna、JF ; ソルツァー、JH(1970年11月17〜19日)。「端末をタイムシェアリングシステムに接続する際の技術的および人的工学的問題」(PDF)1970年11月17〜19日の秋の合同コンピュータ会議(FJCC)の議事録NS。357:AFIPSPresspp。355–362。2012年8月19日のオリジナルからアーカイブ(PDF)2013年1月29日取得 「改行」機能(キャリッジリターンとラインフィードの組み合わせ)の使用は、新しい行を開始するために両方の機能を必要とするよりも、人と機械の両方にとって簡単です。米国規格X3.4-1968では、改行コードに改行の意味を含めることが許可されています。CS1 maint:場所(リンク
  40. ^ O'Sullivan、T。(1971-05-19)、TELNET ProtocolInternet Engineering Task Force(IETF)、pp。4–5、RFC 1582016年6月13日にオリジナルからアーカイブ、2013年1月に取得-28 
  41. ^ Neigus、ナンシーJ.(1973年8月12日)、ファイル転送プロトコルインターネット技術タスクフォース(IETF)、RFC 542アーカイブ2016年6月13日に元から、取得した2013年1月28日を 
  42. ^ ポステル、ジョン(1980年6月)、ファイル転送プロトコルインターネット技術タスクフォース(IETF)、RFC 765アーカイブ2016年6月13日に元から、取得した2013年1月28日を 
  43. ^ 「MercurialのEOL翻訳計画」Mercurial。2016年6月16日にオリジナルからアーカイブされました2017624日取得
  44. ^ Bernstein、DanielJ 「SMTPのベアLF」2011-10-29にオリジナルからアーカイブされました2013年1月28日取得
  45. ^ CP / M 1.4インターフェースガイド(PDF)デジタルリサーチ1978年。p。10. 2019-05-29のオリジナルからアーカイブ(PDF)2017107日取得
  46. ^ サーフ、ヴィントングレー(1969年10月16日)、ネットワーク交換用ASCII形式、ネットワークワーキンググループ、RFC 20アーカイブ2016年6月13日に元から、取得した2016年6月13日を (注:イントロを除いて、USAS X3.4-1968とほぼ同じ表現です。)
  47. ^ ヘインズ、ジム(2015-01-13)。「直接:チャドは私たちの最も重要な製品です:テレタイプコーポレーションのエンジニアの記憶」。 Engineering and Technology History Wiki(ETHW)。2016-10-31にオリジナルからアーカイブされました。 2016年10月31日取得1961年のASCIIから1968年のASCIIへの変更がありました。一部のコンピューター言語では、上矢印や左矢印など、1961年のASCII文字を使用していました。これらの文字は1968年のASCIIから姿を消しました。私たちは、現在Teletypeで営業を行っているFred Mockingと協力して、1961年のASCIIの意味が完全に失われないように、文字の変化を損なうタイプのシリンダーを開発しました。アンダースコア文字は、左矢印としても機能するように、かなりくさび形になっています。
  48. ^ Bemer、RobertWilliam「BemermeetsEurope(Computer Standards)– ComputerHistoryVignettes」Trailing-edge.com。2013-10-17にオリジナルからアーカイブされまし2008年4月14日取得(注:Bemerは当時IBM採用されていました。)
  49. ^ 「ロバートウィリアムBemer:伝記」2013-03-09。2016年6月16日にオリジナルからアーカイブされました。
  50. ^ ジョンソン、リンドン・ベインズ(1968-03-11)。「情報交換のための標準コードの連邦政府による採用を承認する覚書」アメリカ大統領プロジェクト。2007年9月14日にオリジナルからアーカイブされました2008年4月14日取得
  51. ^ リチャードS.シュフォード(1996-12-20)。「Re:ASCIIの初期の歴史?」ニュースグループ:  alt.folklore.computersUsenet:[email protected] 
  52. ^ Folts、Harold C。; カープ、ハリー、編 (1982-02-01)。データ通信規格の編集(第2改訂版)。McGraw-Hill Inc. ISBN  978-0-07-021457-6
  53. ^ Dubost、Karl(2008-05-06)。「WebでのUTF-8の成長」W3CブログWorld WideWebコンソーシアム2016年6月16日にオリジナルからアーカイブされました2010年8月15日取得
  54. ^ a b Davis、Mark(2008-05-05)。「Unicode5.1への移行」公式Googleブログ2016年6月16日にオリジナルからアーカイブされました2010年8月15日取得
  55. ^ デイビス、マーク(2010-01-28)。「ウェブの50%に近いUnicode」公式Googleブログ2016年6月16日にオリジナルからアーカイブされました2010年8月15日取得
  56. ^ 「特定の基準」、RW Reachからのメモへの添付、「X3-2会議– 9月14日および15日」、1961年9月18日
  57. ^ Maréchal、R。(1967-12-22)、ISO / TC 97 –コンピューターと情報処理:ドラフトISO勧告No.1052の承認
  58. ^ ユニコードコンソーシアム(2006-10-27)。「第13章:特殊領域とフォーマット文字」(PDF)アレンでは、ジュリーD.(編)。Unicode標準、バージョン5.0米国ニュージャージー州アッパーサドルリバー:Addison-WesleyProfessionalNS。314. ISBN  978-0-321-48091-0取得した2015年3月13日を
  59. ^ 「utf-8(7)–Linuxのマニュアルページ」Man7.org。2014-02-26。2014年4月22日にオリジナルからアーカイブされました2014年4月21日取得

参考文献

外部リンク