空白文字

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

コンピュータプログラミングでは空白タイポグラフィで水平方向または垂直方向のスペースを表す任意の文字または一連文字ですレンダリングされると、空白文字は表示されているマークに対応しませんが、通常はページ上の領域を占めます。たとえば、一般的な空白記号U + 0020 SPACEASCII 32も)は、テキスト内の空白の句読文字を表し、西洋のスクリプトで単語の区切り文字として使用されます。  

概要

Unicodeのさまざまなスペースの相対幅

多くのキーボードレイアウトでは、。を押して空白文字を入力できますspacebarスペースの長さは異なる場合がありますが、多くのキーボードでは、キーを使用して水平方向の空白を入力することもできます。垂直方向の空白は、と入力して入力できます。これにより、ほとんどのプログラムで「改行」コードシーケンスが作成されます。古いキーボードでは、代わりにこのキーにラベルが付けられている場合があります。タイプライターキーボードのキャリッジリターンキーからのホールドオーバーにより、左ストップへの電気機械的リターン(Unicode文字U + 000D)と次の行への移動(U + 000A)が生成されます。初期のコンピュータゲームの多くは、空白文字を使用して画面を描画していました(例:Kingdom of KrozTab ↹↵ EnterReturn)、およびワードプロセッシングソフトウェアは、それらを使用して、太字、下線、取り消し線などの印刷効果を生成しまし[要出典]

「空白」という用語は、普通紙の文字の外観に基づいています。ただし、アプリケーション内では、空白文字は他の文字コードと同じ方法で処理でき、さまざまなプログラムが文字の独自のセマンティクスを定義する場合があります。

Unicode

次の表に、Unicode文字データベースで空白( "WSpace = Y"、 "WS")文字として定義されている25文字を示します。[1] 17は、双方向書き込みのアルゴリズム(「双方向文字タイプ= WS」)と一致する空白の定義を使用し、「Bidi-WS」文字として知られています。残りの文字も使用できますが、この「Bidi」タイプではありません。

注:次の表を表示するために使用されるブラウザーとフォントによっては、すべてのスペースが正しく表示されない場合があります。

名前 コードポイント 幅ボックス 壊れるかもしれませんか?
IDNでは
脚本 ブロック 一般
カテゴリ
ノート
文字の集計 U + 0009 9 はい 番号 一般 基本ラテン その他、
コントロール
HT、水平タブHTML / XML名前付きエンティティ	LaTeX: '\ tab'、Cエスケープ: '\ t'
改行 U + 000A 10 改行です 一般 基本ラテン その他、
コントロール
LF、改行HTML / XML名前付きエンティティ:
、Cエスケープ: '\ n'
ライン集計 U + 000B 11 改行です 一般 基本ラテン その他、
コントロール
VT、垂直タブCエスケープ: '\ v'
フォームフィード U + 000C 12 改行です 一般 基本ラテン その他、
コントロール
FF、フォームフィードCエスケープ: '\ f'
キャリッジリターン U + 000D 13 改行です 一般 基本ラテン その他、
コントロール
CR、キャリッジリターンCエスケープ: '\ r'
スペース U + 0020 32 はい 番号 一般 基本ラテン セパレーター、
スペース
最も一般的な(通常のASCIIスペース)
次の行 U + 0085 133 改行です 一般 ラテン1
サプリメント
その他、
コントロール
NEL、次の行
ノーブレークスペース U + 00A0 160   番号 番号 一般 ラテン1
サプリメント
セパレーター、
スペース
改行なしスペース:U + 0020と同じですが、線が改行される可能性のあるポイントではありません。HTML / XML名前付きエンティティ: 、LaTeX:'\'
オガム文字スペースマーク U + 1680 5760 はい 番号 オガム文字 オガム文字 セパレーター、
スペース
オガム文字の単語間の区切り使用されます。通常、垂直テキストの垂直線または水平テキストの水平線ですが、「ステムレス」フォントの空白スペースの場合もあります。Oghamフォントが必要です。
エンクワッド U + 2000 8192   はい 番号 一般 一般
句読点
セパレーター、
スペース
1つのenの幅U + 2002は、この文字と標準的に同等です。U +2002が推奨されます。
emクワッド U + 2001 8193 はい 番号 一般 一般
句読点
セパレーター、
スペース
「マトンクワッド」とも呼ばれます。1emの幅U + 2003は、この文字と標準的に同等です。U +2003が推奨されます。
エンスペース U + 2002 8194 はい 番号 一般 一般
句読点
セパレーター、
スペース
「ナッツ」とも呼ばれます。1つのenの幅U + 2000 En Quadは、この文字と標準的に同等です。U +2002が推奨されます。HTML / XML名前付きエンティティ: 、LaTeX: '\ enspace'
emスペース U + 2003 8195 はい 番号 一般 一般
句読点
セパレーター、
スペース
「マトン」とも呼ばれます。1emの幅U + 2001 Em Quadは、この文字と標準的に同等です。U +2003が推奨されます。HTML / XML名前付きエンティティ: 、LaTeX: '\ quad'
emごとに3つのスペース U + 2004 8196 はい 番号 一般 一般
句読点
セパレーター、
スペース
「シックスペース」とも呼ばれます。em幅の3分の1。HTML / XML名前付きエンティティ: 
emごとに4つのスペース U + 2005 8197 はい 番号 一般 一般
句読点
セパレーター、
スペース
「ミッドスペース」とも呼ばれます。em幅の4分の1。HTML / XML名前付きエンティティ: 
emごとに6つのスペース U + 2006 8198 はい 番号 一般 一般
句読点
セパレーター、
スペース
em幅の6分の1。コンピューターのタイポグラフィでは、U +2009と同等の場合があります。
図形スペース U + 2007 8199 番号 番号 一般 一般
句読点
セパレーター、
スペース
図スペース等幅の数字を含むフォントでは、1桁の幅に等しくなります。HTML / XML名前付きエンティティ: 
句読点 U + 2008 8200 はい 番号 一般 一般
句読点
セパレーター、
スペース
フォントの狭い句読点と同じ幅、つまりピリオドまたはコンマの前の幅。[2] HTML / XMLという名前のエンティティ: 
薄いスペース U + 2009 8201 はい 番号 一般 一般
句読点
セパレーター、
スペース
薄いスペース; em幅の5分の1(場合によっては6分の1)。SI単位で行われる測定の千単位分離器としての使用をお勧めしますU +2002からU + 2008とは異なり、その幅は植字で調整される場合があります。[3] HTML / XMLという名前のエンティティ:; LaTeX: '\、'  
ヘアスペース U + 200A 8202 はい 番号 一般 一般
句読点
セパレーター、
スペース
薄いスペースよりも薄い。HTML / XML名前付きエンティティ:( すべてのブラウザで機能する わけではありません)
行区切り文字 U + 2028 8232 改行です 一般 一般
句読点
セパレータ、
ライン
段落区切り文字 U + 2029 8233 改行です 一般 一般
句読点
セパレータ、
段落
狭い休憩スペース U + 202F 8239 番号 番号 一般 一般
句読点
セパレーター、
スペース
狭いノーブレークスペース機能的にはU + 00A0ノーブレークスペースと同様です。モンゴル語で使用する場合、その幅は通常、通常のスペースの3分の1です。他の文脈では、その幅は時々シンスペース(U + 2009)の幅に似ています。
中程度の数学的空間 U + 205F 8287 はい 番号 一般 一般
句読点
セパレーター、
スペース
MMSP。数式で使用されます。emの4/8。[4]数学的なタイポグラフィでは、スペースの幅は通常、emの18分の1の整数倍で与えられ、4/18 emはいくつかの状況で使用される場合があります。たとえば、a+の間、および+a + bのb[5] HTML / XMLという名前のエンティティ: 
表意文字スペース U + 3000 12288   はい 番号 一般 CJKの記号

句読点
セパレーター、
スペース
CJK文字セルと同じ幅(全幅)。たとえば、taitouで使用されます。
 名前  コードポイント 幅ボックス 壊れるかもしれませんか?
IDNでは
脚本 ブロック 一般
カテゴリ
ノート
モンゴル母音区切り文字 U + 180E 6158 はい 番号 モンゴル モンゴル その他、
フォーマット
MVS。モンゴル語で単語の最後の2文字を異なる形にするために使用される狭いスペース文字。[6] Unicode 6.3.0では、以前のバージョンの標準ではあったとしても、スペース文字(つまり、Zsカテゴリ)として分類されなくなりました。
ゼロ幅スペース U + 200B 8203 はい 番号 一般
句読点
その他、
フォーマット
ZWSP、ゼロ幅スペース明示的な間隔を使用しないスクリプトを使用するときに、テキスト処理システムに単語の境界を示すために使用されます。これはソフトハイフンに似ていますが、後者は音節の境界を示すために使用され、行が途切れたときに表示されるハイフンを表示する必要がある点が異なります。HTML / XML名前付きエンティティ​[7] [c]
ゼロ幅非接合子 U + 200C 8204 はい コンテキスト依存[12] 一般
句読点
その他、
フォーマット
ZWNJ、ゼロ幅非接合子。ZWNJを使用すると、接続されている2つの文字の間に配置すると、それぞれ最終形式と初期形式で印刷されます。HTML / XML名前付きエンティティ:‌
ゼロ幅接合子 U + 200D 8205 はい コンテキスト依存[13] 一般
句読点
その他、
フォーマット
ZWJ、ゼロ幅接合子。ZWJを使用すると、他の方法では接続されない2つの文字の間に配置され、接続された形式で印刷されます。結合フォームを個別に表示するためにも使用できます。合字または結合がデフォルトで期待されるかどうかに応じて、(ZWNJとは異なり)個々の結合フォームの使用を許可しながら、単一のグリフでの置換を誘導(絵文字およびシンハラ語のように)または抑制(デーバナーガリーのように)することができます。HTML / XML名前付きエンティティ:‍
単語結合子 U + 2060 8288 番号 番号 一般
句読点
その他、
フォーマット
WJ、単語結合子U + 200Bに似ていますが、線が途切れる可能性のあるポイントではありません。HTML / XML名前付きエンティティ:⁠
ゼロ幅のノーブレークスペース U + FEFF 65279  番号 番号 アラビア文字の
プレゼンテーション
フォーム-B
その他、
フォーマット
ゼロ幅のノーブレークスペース主にバイト順マークとして使用されます。Unicode 3.2では、ノーブレークの指標としての使用は非推奨です。代わりにU + 2060を参照してください。
  1. ^ White_SpaceはバイナリUnicodeプロパティです。[14]
  2. ^ 「Unicode14.0UCD:PropList.txt」2021-08-12 2021年9月15日取得
  3. ^ ​U + 200Bの1つのHTML5名前付きエンティティですが、追加の名前、、、およびNegativeMediumSpaceこれは、 Wolfram言語でネガティブアドバンススペースに使用される名前であり、私用領域にマップされます) [8] [9] [10 ] [11]は、 HTML5によってU + 200Bのエイリアスとしても定義され)。[7]NegativeThickSpaceNegativeThinSpaceNegativeVeryThinSpace​

画像を置き換える

Unicodeは、表示記号を表示する必要があるコンテキストで、さまざまな空白文字を表すために使用できるいくつかの表示文字も提供します。

Unicodeスペース-文字を示す(表示)
コード 10進数 名前 ブロック 画面 説明
U + 00B7 183 真ん中のドット ラテン1サプリメント ・・ 中黒の
名前付きエンティティ:·
U + 21A1 8609 下向きの2つの矢印 矢印 フォームフィードのECMA-17 / ISO 2047記号(ページ分割)[15]
U + 2261 8810 と同じ 数学
演算子
他の用途の中には、改行用のECMA-17 / ISO2047シンボルがあります[15]
U + 237D 9085 ショルダーオープンボックス その他の技術 NBSPを示すために使用されます
U + 23CE 9166 戻り記号 その他の技術 改行を入力する リターンキーの記号
U + 2409 9225 水平集計の記号 コントロールの写真 タブ文字の代わり
U + 240A 9226 改行の記号 コントロールの写真 改行の代わり
U + 240B 9227 垂直集計の記号 コントロールの写真 垂直タブ(ラインタブ)の代替
U + 240C 9228 フォームフィードの記号 コントロールの写真 フォームフィードの代替(ページ分割)
U + 240D 9229 キャリッジリターンの記号 コントロールの写真 キャリッジリターンの代替品
U + 2420 9248 スペースのシンボル コントロールの写真 ASCIIスペースの代替
U + 2422 9250 空白の記号 コントロールの写真 別名「置換ブランク」、[16] BCDICで使用[16] EBCDIC[16] ASCII-1963 [16] [17]などで単語区切り文字の記号として使用
U + 2423 9251 箱を開ける コントロールの写真 少なくとも1980年代以降、スペース文字の数を明示的に示す必要がある場合(たとえば、ペンと紙でプログラミングする場合) 、ブロック文字の手書きで使用されます。Modula-2教科書(1982、1984、1985、1988年にSpringer-Verlagが発行)[18]で使用されており、スペースコードで明示的な指示が必要なプログラミング言語です。TexasInstrumentsのTI- 8xシリーズグラフ電卓キーパッド[n1]でも使用されます。名前付きエンティティ:
␣
U + 2424 9252 改行の記号 コントロールの写真 改行の代わり
U + 25B3 9651 白い上向きの三角形 幾何学模様 他の用途の中には、ASCIIスペースのECMA-17 / ISO2047シンボルがあります[15]
U + 2A5B 10843 論理的またはミドルステム付き 補足
数学
演算子
他の用途の中には、垂直タブ(ラインタブ)のECMA-17 / ISO2047シンボルがあります[15]
U + 2AAA 10922 より小さい 補足
数学
演算子
他の用途の中には、キャリッジリターンのECMA-17 / ISO2047シンボルがあります[15]。
U + 2AAB 10923 より大きい 補足
数学
演算子
他の用途の中には、タブ文字のECMA-17 / ISO2047記号があります[15]
U + 3037 12343 表意文字電信ラインフィード
区切り記号
CJKの記号
と句読点
線送りを表す、 中国の電碼コードのコード9999に使用されるグラフィック
  1. ^ ゼロの「0」または負の「(‒)」キーの上。
正確なスペース
  • Cambridge Z88、オペレーティングシステムのディスプレイドライバーによって「…」として表示される、特別な「正確なスペース」(コードポイント160、別名0xA0)(キーショートカット+ [19]で呼び出し可能)を提供しました。[20] [21]したがって、BBCBASICと組み合わせて「ドットスペース」としても知られていまし[20] [21]SPACE
  • コードポイント224(0xE0)の下で、コンピューターは特別な3文字のセル幅のスペース記号「SPC」(Unicodeの単一セル幅のU + 2420に類似)も提供しました。[20] [21]

スペース以外の空白

  • 点字パターンUnicodeブロックには、ドットが浮き上がっていない点字パターンであるU + 2800⠀ BRAILLEPATTERNBLANK(HTML  )が含まれています。一部のフォントは文字を固定幅の空白として表示しますが、Unicode標準ではスペースとして機能しないと明示的に規定されています。[22] ⠀
  • Unicodeによる韓国語のアルファベットの範囲には、文字が書かれていないことを表すいくつかのコードポイントが含まれているため、グリフは表示されません。
    • Unicodeでは、ハングル互換性Jamoブロックにハングルフィラー文字が含まれています( U +3164 ハングルフィラー(HTML  ))。これは文字として分類されますが、ジャモを含まないハングルブロックのように、空のスペースとして表示されます。これは、KS X 1001ハングル結合シーケンスで使用され、それらを導入したり、位置に文字がないことを示したりしますが、Unicodeの結合ジャモシステムでは使用されません。[23] ㅤ
    • Unicodeの結合jamoシステムは、同様のハングルチョソンフィラー文字とハングルジョンソンフィラー文字を使用して、ハングルジャモブロックU + 115Fハングルチョソンフィラー(HTML  ))に含まれる音節ブロック内の最初または中間位置に文字がないことを示します。 U +1160 ᅠHANGULJUNGSEONG FILLER(HTML  ))。[24] ᅟ ᅠ
    • さらに、半値全角形U + FFA0HALFWIDTH HANGUL FILLER(HTML  ))には、半幅ハングルフィラーが含まれています。これは、 Johab(またはWansung)とNバイトハングル(またはWansung)の両方の文字を含むエンコーディングからマッピングするときに使用されます。または、そのEBCDIC対応物)(JohabとEBCDICの両方のフィラーを含むIBM-933など)。[25] [26] ᅠ

空白とデジタルタイポグラフィ

オンスクリーンディスプレイ

テキストエディタワードプロセッサ、およびデスクトップパブリッシングソフトウェアは、画面上の空白の表現方法と、画面または列の幅よりも長い行の終わりのスペースの表現方法が異なります。場合によっては、スペースは単に空白スペースとして表示されます。その他の場合、それらは中黒または他の記号で表される場合があります。スペースを生成するために多くの異なる文字(以下で説明)を使用でき、文字以外の関数(マージンやタブ設定など)も空白に影響を与える可能性があります。

可変幅汎用スペース

コンピュータの文字エンコードには、通常の汎用スペース(Unicode文字U + 0020)があり、その幅は書体のデザインによって異なります。一般的な値の範囲は1 / 5emから1 / 3emです(デジタルタイポグラフィでは、emはフォントの公称サイズに等しいため、10ポイントのフォントの場合、スペースはおそらく2〜3.3ポイントになります)。洗練されたフォントでは、太字、斜体、スモールキャップスの面に対して異なるサイズのスペースが使用される場合があり、多くの場合、コンポジターはテキストのサイズと目立ちに応じてスペースの幅を手動で調整します。

この汎用スペースに加えて、特定の幅のスペースをエンコードすることができます。完全なリストについては、以下の表を参照してください。

ダッシュの周りのヘアスペース

括弧で囲まれた区切り文字として使用される全角ダッシュ、および単語結合子として使用される場合の全角ダッシュは、通常、テキストと連続して設定されます[27]ただし、このようなダッシュは、オプションで、ヘアスペースU + 200A、またはシンスペースU +2009で囲むことができますヘアスペースは、数値文字参照  または 、または名前付きエンティティを使用してHTMLで記述できますが 、2016年の時点では、まだブラウザで広くサポートされていません。[どちらですか?]シンスペースは、エンティティおよび数値参照または。という名前です。これらのスペースは、通常のスペースよりもはるかに薄いです(   等幅(非プロポーショナル)フォント)、ヘアスペースは2つのうち細い方です。

通常のスペースと髪の毛および薄いスペース(ブラウザでレンダリング)
emダッシュ付きの通常のスペース 左右
emダッシュ付きの薄いスペース
emダッシュ付きヘアスペース 左右
emダッシュのあるスペースはありません 左右

コンピューティングアプリケーション

プログラミング言語

プログラミング言語の構文では、トークンを明示的に区切るためにスペースが頻繁に使用されます。ほとんどの言語では、複数の空白文字は単一の空白文字と同じように扱われます(引用符で囲まれた文字列を除く)。このような言語は自由形式と呼ばれます。HaskelloccamABCPythonなどのいくつかの言語では、構文上の目的で空白とインデントが使用されます。ホワイトスペースと呼ばれる風刺的な言語では、プログラミングに有効な文字はホワイトスペース文字だけですが、他の文字は無視されます。

空白、特に行末の末尾の空白の過度の使用は、迷惑と見なされます。ただし、空白を正しく使用すると、コードが読みやすくなり、グループ関連のロジックに役立ちます。

ほとんどの言語はASCII文字のみを空白として認識し、場合によってはUnicode改行も認識しますが、上記の文字のほとんどは認識しません。C言語では、空白文字を「スペース、水平タブ、改行、垂直タブ、およびフォームフィード」と定義しています。[28] HTTPネットワークプロトコルでは、プロトコルのさまざまな部分でさまざまな種類の空白を使用する必要があります。たとえば、ステータス行のスペース文字のみ行末のCRLF、ヘッダー値の「線形空白」などです。 。[29]

コマンドラインユーザーインターフェイス

コマンドプロセッサによって処理されるコマンド(スクリプトや入力など)では、スペース文字には2つの機能があるため、問題が発生する可能性があります。コマンドまたはパラメータの一部として、またはパラメータまたは名前の区切り文字としてです。あいまいさは、埋め込みスペースを禁止するか、名前を引用符の間に埋め込みスペースで囲むことによって防ぐことができます。

マークアップ言語

SGMLなどの一部のマークアップ言語は、記述されたとおりに空白を保持します。

XMLHTMLなどのWebマークアップ言語は、プログラマーの便宜のために、スペース文字を含む空白文字を特別に扱います。これらのマークアップ言語の適合表示時プロセッサによって読み取られる1つ以上のスペース文字は、セマンティックコンテキストに応じて、0または1スペースに折りたたまれます。=たとえば、テキスト内の2つ(またはそれ以上)のスペースは1つのスペースに折りたたまれ、属性名とその値を区切る「」の両側に表示されるスペースは、ドキュメントの解釈に影響を与えません。要素の終了タグには末尾のスペースを含めることができ、XMLの空の要素タグには「」の前にスペースを含めることができます。/>"。これらの言語では、不要な空白はファイルサイズを大きくするため、ネットワーク転送が遅くなる可能性があります。一方、不要な空白は、コードのコメントと同様に、コードを目立たなくマークする可能性があります。これは、証明するのに望ましい場合があります。コピーアンドペーストによって行われたライセンスまたは著作権侵害

XML属性値では、ドキュメントがパーサーによって読み取られるときに、空白文字のシーケンスは単一のスペースとして扱われます。[30] XML要素コンテンツの空白は、パーサーによってこのように変更されませんが、パーサーから情報を受信するアプリケーションは、要素コンテンツに同様のルールを適用することを選択できます。XMLドキュメントの作成者はxml:space="preserve"、要素の属性を使用して、ダウンストリームアプリケーションがその要素のコンテンツの空白を変更しないようにパーサーに指示できます。

ほとんどのHTML要素では、空白文字のシーケンスは単一の単語間区切り文字として扱われます。これは、通常は単語間にそのようなスペースを挿入する言語でテキストをレンダリングするときに、単一のスペース文字として現れる場合があります。[31]pre準拠するHTMLレンダラーは、タグや、CSSが適用に使用された要素など、いくつかの規定された要素内で、より文字通りの空白の処理を適用する必要がありますpreこのような要素では、スペース文字は単語間の区切り文字に「折りたたまれ」ません。

XMLとHTMLの両方で、改行しないスペース文字は、他の「標準」ではないスペースとともに、折りたたみ可能な「空白」として扱われないため、上記の規則の対象にはなりません。

ファイル名

このような使用法は、埋め込みスペースコードによって混乱するオペレーティングシステムやアプリケーション用に記述されたマルチワードファイル名に似ています。このようなファイル名は、代わりにアンダースコア(_)を単語の区切り文字as_in_this_phraseとして使用します。

別のそのような記号は、U + 2422␢空白記号でした。これは、コンピュータプログラミングの初期の頃、コーディングフォームに書き込むときに使用されていました。キーパンチオペレータは、シンボルを「明示的なスペース」としてすぐに認識しました。[16] BCDIC[16] EBCDIC[16]およびASCII-1963で使用されました[16]

も参照してください

参考文献

  1. ^ 「Unicode標準」ユニコードコンソーシアム。
  2. ^ 「文字設計基準–スペース文字」キャラクターデザイン基準Microsoft1998〜 1999年。2000年8月23日にオリジナルからアーカイブされました2009年5月18日取得
  3. ^ Unicode Standard 5.0、印刷版、p.205
  4. ^ 「一般句読点」(PDF)Unicode標準5.1UnicodeInc1991–2008 2009年5月13日取得
  5. ^ サージェント、マレーIII(2006-08-29)。「数学のUnicodeほぼプレーンテキストエンコーディング(バージョン2)」Unicodeテクニカルノート#28UnicodeIncpp。19–20 2009年5月19日取得
  6. ^ Gillam、Richard(2002)。Unicodeの謎を解き明かす:エンコーディング標準の実用的なプログラマーガイドアディソン-ウェスリー。ISBN 0-201-70052-2
  7. ^ a b ヒックソン、イアン「12.5名前付き文字参照」HTML標準WHATWG
  8. ^ Wolfram"\ [NegativeThickSpace]"Wolfram言語ドキュメント
  9. ^ Wolfram"\ [NegativeMediumSpace]"Wolfram言語ドキュメント
  10. ^ Wolfram"\ [NegativeThinSpace]"Wolfram言語ドキュメント
  11. ^ Wolfram"\ [NegativeVeryThinSpace]"Wolfram言語ドキュメント
  12. ^ Faltstrom、P.、ed。(2010年8月)。「ゼロ幅非接合子」Unicodeコードポイントとアプリケーションの国際化ドメイン名(IDNA)IETFA.1。土井10.17487 / RFC5892RFC5892 _ 2019年9月4日取得
  13. ^ Faltstrom、P.、ed。(2010年8月)。「ゼロ幅接合子」Unicodeコードポイントとアプリケーションの国際化ドメイン名(IDNA)IETFA.2。土井10.17487 / RFC5892RFC5892 _ 2019年9月4日取得
  14. ^ 「Unicode標準付属書#44、Unicode文字データベース」
  15. ^ a b c d e f European Computer Manufacturers Association(1968-11-28)。情報交換用のECMA7ビットコード化文字セットの制御文字のグラフィック表現(PDF)ECMA-17。
  16. ^ a b c d e f g h Mackenzie、Charles E.(1980)。コード化された文字セット、歴史と開発システムプログラミングシリーズ(1版)。Addison-Wesley Publishing Company Inc。pp。41、47、52、102–103、117、119、130、132、141、148、150–151、212、424。ISBN 978-0-201-14460-4LCCN77-90165  _ 2016年5月22日取得 [1]
  17. ^ 「情報交換のためのアメリカの標準コード、ASAX3.4-1963」アメリカ規格協会(ASA)。1963-06-17。
  18. ^ Niklaus Wirth、Modula-2でのプログラミング
  19. ^ 「ケンブリッジZ88ユーザーガイド」4.7(第4版)。Cambridge ComputerLimited2016年[1987]。基本的な概念-キーボード。2016年12月12日にオリジナルからアーカイブされまし2016年12月12日取得
  20. ^ a bc 「 CambridgeZ88 ユーザーガイド」4.0(第4版)。Cambridge ComputerLimited1987年。付録D。 2016年12月12日のオリジナルからアーカイブ2016年12月12日取得
  21. ^ a bc 「 CambridgeZ88 ユーザーガイド」4.7(第4版)。Cambridge ComputerLimited2015年[1987]。付録D. 2016年12月12日のオリジナルからアーカイブ2016年12月12日取得
  22. ^ UnicodeチャートU + 2800、点字パターン
  23. ^ チョン、ジェミン(2017-03-30)。U + 3164 HANGUL FILLER(PDF)に有益なメモを追加する提案。ユニコードコンソーシアムUTC L2 / 17-081。
  24. ^ ハングルジャモ(PDF)ユニコードコンソーシアム2020-10-25。
  25. ^ "ibm-933_P110-1995"ICUデモンストレーション-コンバータエクスプローラUnicodeの国際コンポーネント
  26. ^ "ibm-933_P110-1995(リードバイト0E84)"ICUデモンストレーション-コンバータエクスプローラUnicodeの国際コンポーネント
  27. ^ さまざまなダッシュタイプの使用法は、たとえば、シカゴマニュアルオブスタイル、§§6.80、6.83〜6.86に示されています。
  28. ^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdfセクション6.4、パラグラフ3
  29. ^ フィールディング、R。; etal。(1999年6月)、「2.2基本ルール」、ハイパーテキスト転送プロトコル-HTTP / 1.1RFC 2616 
  30. ^ 「3.3.3属性値の正規化」Extensible Markup Language(XML)1.0(第5版)World WideWebコンソーシアム。
  31. ^ 「9.1空白」W3CHTML4.01仕様World WideWebコンソーシアム。

外部リンク