KS X 1001

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ
KS X 1001
MIME / IANAks_c_5601-1987
エイリアスKS C 5601
言語韓国語英語ロシア語
部分サポート:
ギリシャ語日本語
標準KS X 1001
分類ISO-2022互換のDBCSCJKエンコーディング
エンコーディング形式EUC-KRISO 2022UHCJohab
前任者Nバイトハングルコード(KS C 5601-1974)
その他の関連するエンコーディングKS X 1002KPS 9566JIS X 0208GB 2312GB 12052

KS X 1001、「情報交換のためのコード(ハングルとハンジャ)」、[a] [1]以前はKSC 5601と呼ばれていたものは、コンピューターでハングルハンジャの文字を表すための韓国のコード化文字セット標準です。

KS X 1001は、 EUC-KRやMicrosoftのコードページ9HC( Unified Hangul Code )など、韓国語で最も一般的なレガシー(Unicode以前)の文字エンコードでエンコードされています。韓国語のハングル音節文字、CJK統合漢字(ハンジャ)、ギリシャ文字、キリル文字、日本語(ひらがなカタカナ)などの文字が含まれています。

KS X 1001は、 ISO 2022およびEUCの2バイトコードワードの構造に従って、94×94のテーブルとして配置されていますしたがって、そのコードポイント整数1〜94のペアです。ただし、一部のエンコーディング(UHCおよびJohab)は、すべてのコードポイントにコードを提供することに加えて、コードポイントシーケンスとしてのみ表現できる文字に追加のコードを提供します。

歴史

この規格は、以前はKS C5601と呼ばれていました。この規格にはいくつかの改訂があります。たとえば、1987年、1992年、1998年、2002年に改訂がありました。

現在の2バイトのWansung(완성Wanseong、 'precomposed')[1]文字セットは、1986年に発行されたKS C5601の第3版[2]によって標準化されました。 [3]これはISO2022です。互換性のあるエンコーディング。通常はEUC形式で使用され、互換性のないJohab( 조합Johap、 'combining')[1]とは対照的に、非Hangul、Hangul jamo、および最も一般的なHangulシラブルに2バイトコードを割り当てます。ISO 2022を使用しますが、最新のjamoを使用してすべてのHangulシラブルに2バイトコードを割り当てます。[2]Wansungは技術的には可変長のエンコーディングであり、他の音節を8バイトのシーケンスで表すことができます(jamoおよびHangul Filler文字を使用)が、この機能は常に実装されているわけではありません。[4]

1974年に公開されたKSC 5601の初期版では、[2]可変長[2] 7ビット文字セットが定義されており、 JIS C6220にいくぶん類似した51 [3]基本ハングルジャモにシングルバイトコードポイントが割り当てられています。 、「Nバイトハングル」と呼ばれるエンコーディングで。[5] 1982年に発行された第2版は、1974年版の主な文字セットを保持しましたが、Johabのバージョンを含む2つの補足セットを定義しました。どちらのエディションも、意図したほど広く採用されていませんでした。[2]

Wansungは、1987年版と1992年版で変更されていません。1992年版では、追加の付録資料が追加されました。これには、付録3のJohabエンコーディング[6]定義、および付録4の古いNバイトハングルエンコーディングの定義が含まれます[1] [5]ハングルワードプロセッサによって当時使用されていた、Wansungとの競合するエンコーディングとしてのJohabの業界での使用への対応MicrosoftがWindows95にUnifiedHangul Codeを導入し、2000年にHangulワードプロセッサがJohabを放棄してUnicodeを採用した後、Johabは一般的に使用されなくなりました。[2]

エンコーディング

(Big5、GB2312、GBK、GB18030、HZ、ISO-2022-CN、Big5-HKSCS、EUC-TW、EUC-JP、ISO-2022-JP、Shift_JIS、EUC-KRを示す古いバージョンのFirefoxのスクリーンショットUHC、Johab、およびISO-2022-KRは、CJKサブメニューで使用可能なエンコーディングとして使用できます。)
2004年の時点でMozillaFirefoxによってサポートされているKSX 1001に基づく4つを含むさまざまなCJKエンコーディング。(このサポートは、特定のクロスサイトスクリプティング攻撃を回避するために、以降のバージョンで削減されました。)

KS X 1001のエンコード方式には、EUC-KRASCIIおよびISO 646 -KRベースのバリアントの両方で、後者にはバックスラッシュではなくバイト0x 5Cの勝ち通貨記号(₩ )が含まれます)およびISO-2022-KRが含まれます。[7]およびISO-2022-JP-2 ( JIS X0208およびJISX0212もエンコード))。これらはすべて、独自のKS X 1001コードポイントを持つ2350の事前構成されたハングル音節にのみコードを割り当てるという欠点があり(合計11172のうち、廃止されたjamoを使用するものは数えません)、他の人が8バイトの構成シーケンスを使用する必要があります。これは、標準の一部の実装ではサポートされていません。[4]

Johabエンコーディング(1992年版の規格の付録3で規定)とUnified Hangul Code(UHC、Windows-949とも呼ばれる)として知られるEUC-KRスーパーセットは、すべての11172ハングル音節に単一のコードを提供します。[7] [6] ISO-2022-KRとJohabはめったに使用されません。一部のオペレーティングシステムは、この標準を他の不均一な方法で拡張します。たとえば、クラシックMac OSのEUC-KR拡張MacKoreanや、 IBMIBM -949などです。

ハングルフィラー

ハングルフィラー文字は、8バイトのハングル構成シーケンス[8] [9]を導入し、そのようなシーケンスに存在しない要素(通常は空のファイナル)を表すために使用されます。[9]

Unicodeは、ラウンドトリップ互換性のためにハングル互換性JamoブロックにWansungコードのハングルフィラーを含めますが、ハングルを構成するために独自のシステム(独自の異なる使用法のフィラー文字を使用)を使用します。KS X 1001ハングル構成システムはUnicodeでは使用されず、フィラーは単に空のスペースとしてレンダリングされます。最新のjamoを使用したKSX 1001合成シーケンスは、Unicodeで合成済み文字にマッピングできます。[9]これは通常、統一ハングルコードでは実行されません。

ラウンドトリップ互換性のために、Unicodeには、「HalfwidthHangulFiller」という名前の NバイトHangulコードHangulFillerがHalfwidthフォームブロックとFullwidthフォームブロックに別々に含まれています。

Nバイトのハングルコード

これは、 KS C5601-1974およびKSC5601-1992の付録4で指定されているNバイトのハングルコード[5]です。IBMのコードページ1040 [10]の後半は、これのスーパーセットであり、コードページ1041と同じ場所に文字を割り当てます¢¬\~(ただし、一部でC0制御コード置換グラフィックスを除く)。 IBM-1040と共有される使用状況は、コードページ891です。[11]文字0x40 / 0xC0は、シーケンスの組み合わせに使用される ハングルフィラー(上記を参照)です。£

日本の対応するJISC 6220(JIS X 0201)と同様に、Nバイトのハングルコードを7ビットエンコーディングとして使用し、0x40から0x7Cの範囲で文字を割り当てることができます[5]下のグラフは、たとえばコードページ891または1040で使用されている、上位ビットが設定された8ビット環境(つまり、0xC0から0xFC)のコードを示しています。

KS C 5601-1974 / Nバイトハングル[12]
0 1 2 3 4 5 6 7 8 9 A B C D E F
8倍
9倍
Bx
Cx HWHF
Dx
Fx

Wansungコードチャート

以下は、WansungレイアウトのKS X1001のコードチャートです。16進数のペアが指定されている場合、韓国語のセットがにシフトされたときのISO-2022-KRのように、GL(0x21-0x7E)でエンコードされる場合は小さい方が使用され、より一般的な場合は大きい方が使用されます。 EUC-KRやUHCのように、GR(0xA1-0xFE)でエンコードされます。Johabは、すべての11172ハングルクラスターを個別に順番にエンコードするように配置を変更します。

実装におけるベンダーの違いを説明するために、いくつかの文字に対して複数のUnicodeマッピングが示されています。Wansungプレーンに対するAppleのHangulTalk拡張機能(つまり、両方のバイトが0xA1-0xFEの範囲にある場合)は表示されますが、他のHangulTalk拡張機能の範囲は表示されません。統合ハングルコードの構成音節の追加コード、およびIBM-949のIBMの拡張機能も、どちらもWansung平面の外にあるため、表示されていません。

リードバイト

KS X 1001(ワンソンコード)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax SP[b] 1-_ 2-_ 3-_ 4-_ 5-_ 6-_ 7-_ 8-_ 9-_ 10-_ 11-_ 12-_ 13-_ 14-_ 15-_
3x / Bx 16-_ 17-_ 18-_ 19-_ 20-_ 21-_ 22-_ 23-_ 24-_ 25-_ 26-_ 27-_ 28-_ 29-_ 30-_ 31-_
4x / Cx 32-_ 33-_ 34-_ 35-_ 36-_ 37-_ 38-_ 39-_ 40-_ 41-_ 42-_ 43-_ 44-_ 45-_ 46-_ 47-_
5x / Dx 48-_ 49-_ 50-_ 51-_ 52-_ 53-_ 54-_ 55-_ 56-_ 57-_ 58-_ 59-_ 60-_ 61-_ 62-_ 63-_
6x / Ex 64-_ 65-_ 66-_ 67-_ 68-_ 69-_ 70-_ 71-_ 72-_ 73-_ 74-_ 75-_ 76-_ 77-_ 78-_ 79-_
7x / Fx 80-_ 81-_ 82-_ 83-_ 84-_ 85-_ 86-_ 87-_ 88-_ 89-_ 90-_ 91-_ 92-_ 93-_ 94-_ DEL[b]

漢字以外の合成済みセット

文字セット0x21 / 0xA1(行番号1、特殊文字)

このセットには、句読点とその他の記号が含まれています。ただし、KS X 1003(3行目に含まれています)に存在する句読点は除きます。KS X 1001とシングルバイトASCIIを組み合わせたエンコーディングでは、バックスラッシュに半幅および全角フォームブロックへの代替Unicodeマッピングを使用できます。ウェーブダッシュ(チルダダッシュ)のUnicodeマッピングもベンダーによって異なり、U + 301C(IBMとAppleが好む)[13] [14] [15]またはU + 223C(Microsoftが好む)の場合があります。[16] [17] JISウェーブダッシュの類似しているが同一ではない処理と、次の行のチルダの処理を比較します。

バックスラッシュを除いて、2つのマッピングが以下に示されている場合、最初のマッピングはAppleによって使用され、2番目のマッピングはMicrosoftによって使用されます。[15] [17]

KS X 1001(接頭辞0x21 / 0xA1)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax IDSP ・・ ¨ シャイ / / \ / _ / ' '
3x / Bx 「「 〈〈 【【 ± ××
4x / Cx ÷ °° Å ¢ / £ / ¥ / ¥
5x / Dx § ※※ ★★ ○○ ●● ◆◆
6x / Ex ■■
7x / Fx ¬ /

文字セット0x22 / 0xA2(行番号2、特殊文字)

このセットには、追加の句読点と記号が含まれています。前の行のチルダ文字と同様に、AppleとMicrosoftは、この行のチルダ文字に異なるマッピングを使用しています(AppleのU + 02DC、MicrosoftのFF5E)[15] [17]は、次のように表示されることを目的としています。前の行のチルダはダッシュの高さでインラインで表示されることを目的としていますが、隆起したチルダ。[18]丸で囲んだ点のマッピングも異なります。[15] [17]

1998年にユーロと登録商標記号が標準に追加され、2002年に韓国の郵便マーク(㉾)が追加されました。[1]これらの3つのコードポイントは、未使用のコードポイントと同様に、その他の、ベンダーによる非標準の目的。たとえば、Appleによるボックス化されたリストマーカー。[19] Microsoftは、統一ハングルコードの実装を更新して、ユーロ記号を含む1998年の追加を追加しましたが、標準に追加されたときに韓国の郵便マークを追加しませんでした。[20]

KS X 1001(プレフィックスは0x22 / 0xA2)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax ´ / ˇ ˘ ˝ ˚ ˙ ¸ ˛ ¡ ¿
3x / Bx ː ¤ ▶▶
4x / Cx /
5x / Dx
6x / Ex /1⃞ _[c] ® /2⃞ _[c] /3⃞ _[c] 4⃞ _[c] 5⃞ _[c] 6⃞ _[c] 7⃞ _[c] 8⃞ _[c] 9⃞ _[c] [ 10 ][d]
7x / Fx [ 11 ][d] [ 12 ][d] [ 13 ][d] [ 14 ][d] [ 15 ][d] [ 16 ][d] [ 17 ][d] [ 18 ][d] [ 19 ][d] [ 20 ][d] [e] [f] [g]
  Appleによる追加
  Appleの追加と衝突する後の標準的な追加

文字セット0x23 / 0xA3(行番号3、基本ラテン/ ISO 646-KR)

このセットは、KS X 1003(韓国語のISO 646バリアント、ASCIIと同様のセット)に対応しますが、0x23(またはGR委任(EUC)形式の0xA3)が前に付いた2バイトコードです。これには、英語のアルファベット/基本ラテンアルファベット西アラビア数字、句読点が含まれます。

ウォン記号ではなく円記号を含めることで異なるJISX0201のローマ字セットを比較してくださいKPS9566とJISX 0208の3行目を比較してください。これらは、ISO 646レイアウトに従いますが、文字と数字のみが含まれています。

KS X 1001(プレフィックスは0x23 / 0xA3); 非全幅マッピング
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax 「」 $ ' (( )。 * + - /
3x / Bx 0 1 2 3 4 5 6 7 8 9 ; << = >>
4x / Cx @ A B C D E F G H J K L M N O
5x / Dx P Q R S T U V W バツ Y Z [ ] ^ _
6x / Ex ` a b c d e f g h j k l m n o
7x / Fx p q r s t u v w バツ y z {{ | }

EUC-KRやUHCなどのエンコーディングは、KS X1001をシングルバイトASCIIまたはKSX 1003と組み合わせているため、これらの文字の2バイト表現には 、 HalfwidthおよびFullwidthFormsブロックへの代替Unicodeマッピングを使用します。

KS X 1001(プレフィックスは0x23 / 0xA3); 全幅マッピング
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax ## (( )。
3x / Bx 0 0
4x / Cx AA H 私は
5x / Dx P P シールド X X ] !! _
6x / Ex â bb cc e ff hh ii l nn o
7x / Fx pp いく r s tt uu v × y {0 !!

文字セット0x24 / 0xA4(行番号4、ハングルジャモ)

このセットには、現代のハングル子音、母音が含まれ、どちらも韓国の照合慣習によって順序付けられ、その後に廃止された子音が続きます。個別に使用する場合、これらの文字はUnicodeハングル互換性Jamoブロックにマップされ、ハングルJamoブロック内の位置固有の文字との1対1のマッピングはありません北朝鮮のKPS9566の4行目と比較してください文字04-52は、シーケンスの組み合わせに使用される ハングルフィラー(上記を参照)です。

KS X 1001(0x24 / 0xA4のプレフィックス)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax
3x / Bx
4x / Cx
5x / Dx HF
6x / Ex
7x / Fx

文字セット0x25 / 0xA5(行番号5、ローマ数字、ギリシャ語)

このセットには、ローマ数字とギリシャ文字の基本的なサポートが含まれており、発音区別符号や最後のシグマは含まれていません。Appleは、この行にいくつかの追加の句読点と、6行目から続くいくつかの黒丸のリストマーカーを含めています。[19]

KPS 9566の行6を対比します。これには、同じ文字が含まれていますが、レイアウトが異なります。

KS X 1001(0x25 / 0xA5のプレフィックス)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax
3x / Bx
4x / Cx Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο
5x / Dx Π Ρ Σ Τ Υ Φ Χ Ψ Ω !︀ [h] 。︀ [i] [j] [j]
6x / Ex α β γ δ ε ζ η θ ι κ λ μ ν ξ ο
7x / Fx π ρ σ τ υ φφ χ ψ ω ((27)。[k] ((28)。[l] ((29)。[m] ((30)。[n]
  Appleによる追加

文字セット0x26 / 0xA6(行番号6、ボックス描画)

この行には、セミグラフィックコンテキストでボックスを描画するための文字が含まれていますAppleには、いくつかの黒い丸で囲まれたリストマーカーも含まれています。[19]

KS X 1001(0x26 / 0xA6のプレフィックス)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax
3x / Bx
4x / Cx
5x / Dx
6x / Ex
7x / Fx ((21)。[o] ((22)。[p] ((23)。[q] ((24)。[r] ((25)。[s] ((26)。[t]
  Appleによる追加

文字セット0x27 / 0xA7(行番号7、単位記号)

この行には、複数の文字で構成される単位記号を含む、単一文字としての単位記号が含まれています。Appleには、8行目から続くいくつかの丸で囲んだリストマーカーも含まれています。[19]

KPS9566の8行目に含まれる単位記号のレパートリーと比較対照します。

KS X 1001(0x27 / 0xA7のプレフィックス)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax
3x / Bx
4x / Cx
5x / Dx Ω
6x / Ex
7x / Fx
  Appleによる追加

文字セット0x28 / 0xA8(行番号8、拡張ラテン、丸で囲まれた、分数)

KS X 1001(プレフィックスは0x28 / 0xA8)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax Æ Ð ª Ħ IJ Ŀ Ł Ø Œ º Þ Ŧ Ŋ
3x / Bx
4x / Cx
5x / Dx
6x / Ex
7x / Fx ½ ¼ ¾

文字セット0x29 / 0xA9(行番号9、拡張ラテン、丸で囲まれた、上付き文字および下付き文字)

KS X 1001(接頭辞0x29 / 0xA9)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax æ đ ð ħ ij ĸ ŀ ł ø œ ß þ ŧ ŋ
3x / Bx ʼn
4x / Cx
5x / Dx
6x / Ex
7x / Fx ¹ ² ³

文字セット0x2A / 0xAA(行番号10、ひらがな)

このセットには、日本語を書くためのひらがなが含まれています。Appleには、9行目から続く括弧で囲まれたリストマーカーも含まれています。[19]

同じレイアウトを使用するKPS9566の行10を比較します。JIS X 0208の4行目を比較対照します。これも同じレイアウトを使用していますが、行が異なります。

KS X 1001(接頭辞0x2A / 0xAA)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax
3x / Bx ここ ソース すす この
4x / Cx
5x / Dx
6x / Ex めまい モー なる
7x / Fx (21)[u] (22)[u] (23)[u] (24)[u] (25)[u] (26)[u]
  Appleによる追加

文字セット0x2B / 0xAB(行番号11、カタカナ)

このセットには、日本語を書くためのカタカナが含まれています。ただし、カタカナのテキストで使用され、JIS X0208の1行目に含まれている日本語の長母音マークは含まれていません。[23] Appleには、9行目と10行目から続く括弧で囲まれたリストマーカーも含まれています。[19]

同じレイアウトを使用しているKPS9566の行11を比較してください。JIS X 0208の5行目を比較対照します。これも同じレイアウトを使用していますが、行が異なります。

KS X 1001(接頭辞0x2B / 0xAB)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax ああ ii うう おお きき
3x / Bx けけ ここ たた
4x / Cx はは
5x / Dx ふふ ぺぺ
6x / Ex やや あなた この るつ
7x / Fx { 矯正 (27)[u] (28)[u] (29)[u] (30)[u]
  Appleによる追加

文字セット0x2C / 0xAC(行番号12、キリル文字)

このセットには現代ロシア語のアルファベットが含まれており、他の形式のキリル文字を表すのに必ずしも十分ではありませんAppleには、いくつかのブラックボックスリストマーカーも含まれています。[19]

同じレイアウトを使用している(ただし、行が異なる) KPS9566の行5とJISX0208行7を比較します。

KS X 1001(0x2C / 0xACのプレフィックス)
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax А Б ÂÂ Г Д Е Ё Ж З И Й К Л М Н
3x / Bx О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э
4x / Cx Ю Я 1⃞ _[v] 2⃞ _[v] 3⃞ _[v] 4⃞ _[v] 5⃞ _[v] 6⃞ _[v] 7⃞ _[v] 8⃞ _[v] 9⃞ _[v] [ 10 ][w] [ 11 ][w] [ 12 ][w] [ 13 ][w] [ 14 ][w]
5x / Dx [ 15 ][w] а б вв г д е ё ж з и й к л м н
6x / Ex о п р с т あなたは ф х ц ч ш щ ъ ы ь э
7x / Fx ю я [ 16 ][w] [ 17 ][w] [ 18 ][w] [ 19 ][w] [ 20 ][w]
  Appleによる追加

拡張文字セット0x2D / 0xAD(行番号13、Appleの追加句読点)

KS X 1001へのAppleの追加(接頭辞0x2D / 0xAD)[19]
0 1 2 3 4 5 6 7 8 9 A B C D E F
2x / Ax [x] [x] [x] [x] [y] [y] [y] [y] [z] [z] 🠩 [aa]
3x / Bx [ab]

事前に作成されたハングルセット(行番号16から40)

事前に作成されたハングルのコードポイントは、コードポイント16-01と40-94の間の連続した並べ替えられたブロックに含まれます。すべての可能な音節クラスターがこの範囲に含まれるわけではありません。KPS9566のさまざまな注文と在庫状況を比較してください。

初期+母音+最終音節뢨、썅、쏀、쓩、および쭁は含まれますが、初期+母音の対応する뢔、쌰、쎼、쓔、および쬬は含まれないことに注意してください。これは、入力メソッドが最初の+母音+最後の音節を入力するために最初に最初の+母音の音節を通過する必要があるため、入力時に問題を引き起こしていました(例:ㅎ→하→한)。

ここにリストされていないものは、8バイトの構成シーケンスを使用して表すことができます。他のすべてのモダンジャモクラスターには、UHCによって他の場所にコードが割り当てられます。考えられるすべてのモダンジャモクラスターには、Johabによってコードが割り当てられています。

  • 行16:가각간갇갈갉갊감갑값갓갔강갖갗같갚갛개객갠갤갬갭갯갰갱갸갹갼걀걋걍걔걘걜거걱건걷걸걺검겁것겄겅 겆겉겊겋게겐겔겜겝겟겠겡겨격겪견겯결겸겹겻겼경곁계곈곌곕곗고곡곤곧골곪곬곯곰곱곳공곶과곽관괄괆
  • 行17:괌괍괏광괘괜괠괩괬괭괴괵괸괼굄굅굇굉교굔굘굡굣구국군굳굴굵굶굻굼굽굿궁궂궈궉권궐궜궝궤궷귀귁귄 귈귐귑귓규균귤그극근귿글긁금급긋긍긔기긱긴긷길긺김깁깃깅깆깊까깍깎깐깔깖깜깝깟깠깡깥깨깩깬깰깸
  • 行18:깹깻깼깽꺄꺅꺌꺼꺽꺾껀껄껌껍껏껐껑께껙껜껨껫껭껴껸껼꼇꼈꼍꼐꼬꼭꼰꼲꼴꼼꼽꼿꽁꽂꽃꽈꽉꽐꽜꽝꽤 꽥꽹꾀꾄꾈꾐꾑꾕꾜꾸꾹꾼꿀꿇꿈꿉꿋꿍꿎꿔꿜꿨꿩꿰꿱꿴꿸뀀뀁뀄뀌뀐뀔뀜뀝뀨끄끅끈끊끌끎끓끔끕끗끙
  • 行19:끝끼끽낀낄낌낍낏낑나낙낚난낟날낡낢남납낫났낭낮낯낱낳내낵낸낼냄냅냇냈냉냐냑냔냘냠냥너넉넋넌널넒 넓넘넙넛넜넝넣네넥넨넬넴넵넷넸넹녀녁년녈념녑녔녕녘녜녠노녹논놀놂놈놉놋농높놓놔놘놜놨뇌뇐뇔뇜뇝
  • 行20:뇟뇨뇩뇬뇰뇹뇻뇽누눅눈눋눌눔눕눗눙눠눴눼뉘뉜뉠뉨뉩뉴뉵뉼늄늅늉느늑는늘늙늚늠늡늣능늦늪늬늰늴니 닉닌닐닒님닙닛닝닢다닥닦단닫달닭닮닯닳담답닷닸당닺닻닿대댁댄댈댐댑댓댔댕댜더덕덖던덛덜덞덟덤덥
  • 行21:덧덩덫덮데덱덴델뎀뎁뎃뎄뎅뎌뎐뎔뎠뎡뎨뎬도독돈돋돌돎돐돔돕돗동돛돝돠돤돨돼됐되된될됨됩됫됴두둑 둔둘둠둡둣둥둬뒀뒈뒝뒤뒨뒬뒵뒷뒹듀듄듈듐듕드득든듣들듦듬듭듯등듸디딕딘딛딜딤딥딧딨딩딪따딱딴딸
  • 行22:땀땁땃땄땅땋때땍땐땔땜땝땟땠땡떠떡떤떨떪떫떰떱떳떴떵떻떼떽뗀뗄뗌뗍뗏뗐뗑뗘뗬또똑똔똘똥똬똴뙈뙤 뙨뚜뚝뚠뚤뚫뚬뚱뛔뛰뛴뛸뜀뜁뜅뜨뜩뜬뜯뜰뜸뜹뜻띄띈띌띔띕띠띤띨띰띱띳띵라락란랄람랍랏랐랑랒랖랗
  • 行23:래랙랜랠램랩랫랬랭랴략랸럇량러럭런럴럼럽럿렀렁렇레렉렌렐렘렙렛렝려력련렬렴렵렷렸령례롄롑롓로록 론롤롬롭롯롱롸롼뢍뢨뢰뢴뢸룀룁룃룅료룐룔룝룟룡루룩룬룰룸룹룻룽뤄뤘뤠뤼뤽륀륄륌륏륑류륙륜률륨륩
  • 行24:륫륭르륵른를름릅릇릉릊릍릎리릭린릴림립릿링마막만많맏말맑맒맘맙맛망맞맡맣매맥맨맬맴맵맷맸맹맺먀 먁먈먕머먹먼멀멂멈멉멋멍멎멓메멕멘멜멤멥멧멨멩며멱면멸몃몄명몇몌모목몫몬몰몲몸몹못몽뫄뫈뫘뫙뫼
  • 行25:묀묄묍묏묑묘묜묠묩묫무묵묶문묻물묽묾뭄뭅뭇뭉뭍뭏뭐뭔뭘뭡뭣뭬뮈뮌뮐뮤뮨뮬뮴뮷므믄믈믐믓미믹민믿 밀밂밈밉밋밌밍및밑바박밖밗반받발밝밞밟밤밥밧방밭배백밴밸뱀뱁뱃뱄뱅뱉뱌뱍뱐뱝버벅번벋벌벎범법벗
  • 行26:벙벚베벡벤벧벨벰벱벳벴벵벼벽변별볍볏볐병볕볘볜보복볶본볼봄봅봇봉봐봔봤봬뵀뵈뵉뵌뵐뵘뵙뵤뵨부북 분붇불붉붊붐붑붓붕붙붚붜붤붰붸뷔뷕뷘뷜뷩뷰뷴뷸븀븃븅브븍븐블븜븝븟비빅빈빌빎빔빕빗빙빚빛빠빡빤
  • 行27:빨빪빰빱빳빴빵빻빼빽뺀뺄뺌뺍뺏뺐뺑뺘뺙뺨뻐뻑뻔뻗뻘뻠뻣뻤뻥뻬뼁뼈뼉뼘뼙뼛뼜뼝뽀뽁뽄뽈뽐뽑뽕뾔뾰 뿅뿌뿍뿐뿔뿜뿟뿡쀼쁑쁘쁜쁠쁨쁩삐삑삔삘삠삡삣삥사삭삯산삳살삵삶삼삽삿샀상샅새색샌샐샘샙샛샜생샤
  • 行28:샥샨샬샴샵샷샹섀섄섈섐섕서석섞섟선섣설섦섧섬섭섯섰성섶세섹센셀셈셉셋셌셍셔셕션셜셤셥셧셨셩셰셴 셸솅소속솎손솔솖솜솝솟송솥솨솩솬솰솽쇄쇈쇌쇔쇗쇘쇠쇤쇨쇰쇱쇳쇼쇽숀숄숌숍숏숑수숙순숟술숨숩숫숭
  • 行29:숯숱숲숴쉈쉐쉑쉔쉘쉠쉥쉬쉭쉰쉴쉼쉽쉿슁슈슉슐슘슛슝스슥슨슬슭슴습슷승시식신싣실싫심십싯싱싶싸싹 싻싼쌀쌈쌉쌌쌍쌓쌔쌕쌘쌜쌤쌥쌨쌩썅써썩썬썰썲썸썹썼썽쎄쎈쎌쏀쏘쏙쏜쏟쏠쏢쏨쏩쏭쏴쏵쏸쐈쐐쐤쐬쐰
  • 行30:쐴쐼쐽쑈쑤쑥쑨쑬쑴쑵쑹쒀쒔쒜쒸쒼쓩쓰쓱쓴쓸쓺쓿씀씁씌씐씔씜씨씩씬씰씸씹씻씽아악안앉않알앍앎앓암 압앗았앙앝앞애액앤앨앰앱앳앴앵야약얀얄얇얌얍얏양얕얗얘얜얠얩어억언얹얻얼얽얾엄업없엇었엉엊엌엎
  • 行31:에엑엔엘엠엡엣엥여역엮연열엶엷염엽엾엿였영옅옆옇예옌옐옘옙옛옜오옥온올옭옮옰옳옴옵옷옹옻와왁완 왈왐왑왓왔왕왜왝왠왬왯왱외왹왼욀욈욉욋욍요욕욘욜욤욥욧용우욱운울욹욺움웁웃웅워웍원월웜웝웠웡웨
  • 行32:웩웬웰웸웹웽위윅윈윌윔윕윗윙유육윤율윰윱윳융윷으윽은을읊음읍읏응읒읓읔읕읖읗의읜읠읨읫이익인일 읽읾잃임입잇있잉잊잎자작잔잖잗잘잚잠잡잣잤장잦재잭잰잴잼잽잿쟀쟁쟈쟉쟌쟎쟐쟘쟝쟤쟨쟬저적전절젊
  • 行33:점접젓정젖제젝젠젤젬젭젯젱져젼졀졈졉졌졍졔조족존졸졺좀좁좃종좆좇좋좌좍좔좝좟좡좨좼좽죄죈죌죔죕 죗죙죠죡죤죵주죽준줄줅줆줌줍줏중줘줬줴쥐쥑쥔쥘쥠쥡쥣쥬쥰쥴쥼즈즉즌즐즘즙즛증지직진짇질짊짐집짓
  • 行34:징짖짙짚짜짝짠짢짤짧짬짭짯짰짱째짹짼쨀쨈쨉쨋쨌쨍쨔쨘쨩쩌쩍쩐쩔쩜쩝쩟쩠쩡쩨쩽쪄쪘쪼쪽쫀쫄쫌쫍쫏 쫑쫓쫘쫙쫠쫬쫴쬈쬐쬔쬘쬠쬡쭁쭈쭉쭌쭐쭘쭙쭝쭤쭸쭹쮜쮸쯔쯤쯧쯩찌찍찐찔찜찝찡찢찧차착찬찮찰참찹찻
  • 行35:찼창찾채책챈챌챔챕챗챘챙챠챤챦챨챰챵처척천철첨첩첫첬청체첵첸첼쳄쳅쳇쳉쳐쳔쳤쳬쳰촁초촉촌촐촘촙 촛총촤촨촬촹최쵠쵤쵬쵭쵯쵱쵸춈추축춘출춤춥춧충춰췄췌췐취췬췰췸췹췻췽츄츈츌츔츙츠측츤츨츰츱츳층
  • 行36:치칙친칟칠칡침칩칫칭카칵칸칼캄캅캇캉캐캑캔캘캠캡캣캤캥캬캭컁커컥컨컫컬컴컵컷컸컹케켁켄켈켐켑켓 켕켜켠켤켬켭켯켰켱켸코콕콘콜콤콥콧콩콰콱콴콸쾀쾅쾌쾡쾨쾰쿄쿠쿡쿤쿨쿰쿱쿳쿵쿼퀀퀄퀑퀘퀭퀴퀵퀸퀼
  • 行37:큄큅큇큉큐큔큘큠크큭큰클큼큽킁키킥킨킬킴킵킷킹타탁탄탈탉탐탑탓탔탕태택탠탤탬탭탯탰탱탸턍터턱턴 털턺텀텁텃텄텅테텍텐텔템텝텟텡텨텬텼톄톈토톡톤톨톰톱톳통톺톼퇀퇘퇴퇸툇툉툐투툭툰툴툼툽툿퉁퉈퉜
  • 行38:퉤튀튁튄튈튐튑튕튜튠튤튬튱트특튼튿틀틂틈틉틋틔틘틜틤틥티틱틴틸팀팁팃팅파팍팎판팔팖팜팝팟팠팡팥 패팩팬팰팸팹팻팼팽퍄퍅퍼퍽펀펄펌펍펏펐펑페펙펜펠펨펩펫펭펴편펼폄폅폈평폐폘폡폣포폭폰폴폼폽폿퐁
  • 行39:퐈퐝푀푄표푠푤푭푯푸푹푼푿풀풂품풉풋풍풔풩퓌퓐퓔퓜퓟퓨퓬퓰퓸퓻퓽프픈플픔픕픗피픽핀필핌핍핏핑하 학한할핥함합핫항해핵핸핼햄햅햇했행햐향허헉헌헐헒험헙헛헝헤헥헨헬헴헵헷헹혀혁현혈혐협혓혔형혜혠
  • 行40:혤혭호혹혼홀홅홈홉홋홍홑화확환활홧황홰홱홴횃횅회획횐횔횝횟횡효횬횰횹횻후훅훈훌훑훔훗훙훠훤훨훰 훵훼훽휀휄휑휘휙휜휠휨휩휫휭휴휵휸휼흄흇흉흐흑흔흖흗흘흙흠흡흣흥흩희흰흴흼흽힁히힉힌힐힘힙힛힝

漢字セット

Johabエンコーディング

KS X1001で規定されているJohabエンコーディングの図

KS X 1001は、1992年以来、Johabとして知られる代替エンコーディングも定義しています。これは、ハングル音節を3つの5ビット値のシーケンスとして表し、2つの8ビットバイトに分割され、最上位ビットが最初になります。先行バイトの最上位ビットは常に設定されます(シングルバイトASCIIまたはKS X 1003との組み合わせが可能です)。このエンコーディングは、他のコンポーネントのフィラー値を使用することにより、KS X1001の行4の最新のjamoにも使用されます。ハングルのJohabエンコーディングを次の表に示します。[25]

Johabは、最初のジャモに対応しないリードバイト(ハングル音節文字と最新のジャモを除く、ハンジャの場合は0xE0–0xF9、非ハンジャの場合は0xD9–0xDE [26])を使用、KS X1001の残りの部分をエンコードします。範囲は0x31–0x7Eおよび0x91–0xFEです。[25]これらのコードは、文字のKS X 1001コードポイントからアルゴリズムでマッピングされ、[26]リードバイトごとに2つのKS X 1001行を使用します(Shift JISを比較対照します)。

2バイト状態の場合のEBCDICベースのJohabバリアントのレイアウト

ASCIIベースのJohabエンコーディングは、Microsoftによってコードページ1361に番号が付けられています。[27]他のベンダー定義のJohabバリアントも存在します。たとえば、IBMは、 EBCDICでシフトアウトセットとして使用するために1つを定義していますこのバリアントは、シフトインシフトアウトを使用してシングルバイトEBCDICページとJohabを切り替え、非ハングル文字に異なるエンコーディングを使用し(異なるレイアウトでリードバイト0x40–6Cを使用)、リードバイト0xD4–DDを使用しますユーザー定義領域として使用されますが、シフトアウト状態の場合、ハングル文字の1992標準と同じJohabレイアウトを使用します。[28] IBMは、EBCDICベースのステートフルJohabエンコーディングに番号を付けますコードページ1364[28] 、およびコードページ933と同じレイアウトで、より少ないハングル文字を含む、そのエンコーディングのサブセットも定義します[29]

SamsungGoldStar(現在はLG )などの他のベンダーは、他の「Johab」エンコーディングを使用しており、5ビットコードのjamoへのマッピングが以下と異なるため、1992年の標準Johabと互換性がありません。[ac]以下の表は、1992年の標準およびIBMの使用法に対応しています。

KS C 5601(/ X 1001):1992 [25]のハングルのJohabコード
5ビットシーケンス 初期として 母音として 最終的に
00000 使用されていない 未使用[広告] 使用されていない
00001 フィラー 未使用[ae] フィラー(空のファイナル)
00010 フィラー
00011
00100
00101
00110
00111
01000 未使用[広告]
01001 未使用[ae]
01010
01011
01100
01101
01110
01111
10000 未使用[広告]
10001 未使用[ae]
10010 使用されていない
10011
10100
10101 使用されていない
10110 非ハングルリードバイト
10111 非ハングルリードバイト
11000 非ハングルリードバイト 未使用[広告]
11001 非ハングルリードバイト 未使用[ae]
11010 非ハングルリードバイト
11011 非ハングルリードバイト
11100 非ハングルリードバイト
11101 非ハングルリードバイト
11110 非ハングルリードバイト 使用されていない 使用されていない
11111 使用されていない 使用されていない 使用されていない

脚注

  1. ^ 韓国語 정보교환용부호계(한글및한자)ローマ字:  Jeongbo Gyohwan'yong Buhogye(Hangeul mich Hanja)
  2. ^ a b ISO2022互換の94n文字セットとして、プレーンスペース削除文字は常に0x20と0x7F(0xA0と0xFFではない)でシングルバイトコードとして使用できます
  3. ^ a b c d e f g h i Appleによって、ASCII数字のシーケンス、結合された正方形U + 20DE、および私用文字U + F87Cにマップされます。[19]ここに示されている外観はシミュレートされています。
  4. ^ a b c d e f g h i j k Appleによって、角かっこで囲まれた数字と、接頭辞U + F863付いたASCIIシーケンスにマッピングされます。[19]ここに示されている外観はシミュレートされています。
  5. ^ 0xA2D2より狭い。Appleは、往復の目的で私用文字U + F87Fを追加します。
  6. ^ 右側の線は太字になっています。Appleは、往復の目的で私用文字U + F87Bを追加します。
  7. ^ 左側の線は太字になっています。Appleは、往復の目的で私用文字U + F87Cを追加します。
  8. ^ 水平方向に使用するために、文字セルの左下に配置されたバリアント。AppleはこれをU + FF01 + F874にマッピングします。ここで、U + F874は、ラウンドトリップの目的でキャラクターにタグを付けるためにAppleが使用する私用キャラクターです。[19]最近、 [21]異体字セレクター1(U + FE00)を追加して、このフォームに標準化された異体字シーケンスが追加されまし[22]
  9. ^ 水平方向に使用するために、文字セルの左下に配置されたバリアント。AppleはこれをU + 3002 + F87Dにマッピングします。ここで、U + F87Dは、ラウンドトリップの目的でキャラクターにタグを付けるためにAppleが使用する私用キャラクターです。[19]最近、 [21]異体字セレクター1(U + FE00)を追加して、このフォームに標準化された異体字シーケンスが追加されまし[22]
  10. ^ a b 複製、Appleによってマッピングされ、ラウンドトリップ用に私用文字U + F87Fが追加されています[19]
  11. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3257 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3257は塗りつぶされていない丸で囲まれた文字です。[19]
  12. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3258 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3258は塗りつぶされていない丸で囲まれた文字です。[19]
  13. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3259 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3259は塗りつぶされていない丸で囲まれた文字です。[19]
  14. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 325A + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U + 325Aは塗りつぶされていない丸で囲まれた文字です。[19]
  15. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3251 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3251は塗りつぶされていない丸で囲まれた文字です。[19]
  16. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3252 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3252は塗りつぶされていない丸で囲まれた文字です。[19]
  17. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3253 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3253は塗りつぶされていない丸で囲まれた文字です。[19]
  18. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3254 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3254は塗りつぶされていない丸で囲まれた文字です。[19]
  19. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3255 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3255は塗りつぶされていない丸で囲まれた文字です。[19]
  20. ^ シミュレーションで示されているように、Unicodeには完全一致が存在することに注意してください。AppleはU + 3256 + F87Aにマップします。ここで、U + F87Aは私用の文字であり、U +3256は塗りつぶされていない丸で囲まれた文字です。[19]
  21. ^ a b c d e f g h i j AppleによってASCIIシーケンスにマッピングされ、接頭辞として私用文字U + F862が付けられます。[19]
  22. ^ a b c d e f g h i Appleによって、ASCII数字のシーケンス、結合された正方形U + 20DE、および私用文字U + F875にマップされます。[19]ここに示されている外観はシミュレートされています。
  23. ^ a b c d e f g h i j k Appleによって、角かっこで囲まれた数字と、接頭辞U + F866付いたASCIIシーケンスにマッピングされます。[19]ここに示されている外観はシミュレートされています。
  24. ^ a b cd これら の主に行1の文字が重複しています。Appleはそれらを「長い」バージョンとして説明し、ラウンドトリップの目的で私用文字U + F879を追加します。[19]
  25. ^ a b c d MacKoreanエンコーディングには、KS X 1001平面範囲外の異なるスタイルの矢印(白い矢印を含む)のいくつかのセットが含まれ、リードバイトは0xA8と0xAC、トレイルバイトは0x41と0xA0の間です。Appleは、ラウンドトリップの目的で、この特定の白い矢印のセットに私用文字U + F878を追加します。[19]
  26. ^ a b 行1のマークとは異なり、これら2つのマークは低い位置に表示することを目的としています(U + 301Fと同様)。Appleは、それらを区別するために私用文字U + F873を追加します。[19]
  27. ^ AppleはこれをU + 21E7 + F87Fにマップします。ここで、U + 21E7は白い上向き矢印[19]であり、U + F87Fは私用の文字ですが、この文字は黒い矢印です。[24]示されている文字は、Appleのマッピングテーブルよりも後のUnicode文字であり、このMacKorean文字のグリフ[24]に似ています。
  28. ^ Appleは、これをASCII感嘆符のシーケンスとそれに続く私用文字U + F87Fにマップします。[19]
  29. ^ これらのエンコーディングのいくつかのマッピングはここから入手できます。
  30. ^ a b c d これを使用すると、 C0制御コード範囲のトレイルバイトになります。
  31. ^ a b c d これを使用すると、ASCIIの0x2_および0x3_行に証跡バイトが生成されます。Johabは、最も一般的なレガシーCJKエンコーディング( Shift JISGBKBig5と比較)と同様に、トレイルバイトに0x2_行を使用しませんEBCDICベースのバージョンのJohabは、EBCDIC制御コード範囲内にあるため、どちらの行からのトレイルバイトも使用しません。

参考文献

  1. ^ a b c d e Lunde、Ken(2009)。「第3章:文字セット標準」CJKV情報処理p。143-148。ISBN 978-0596514471
  2. ^ a b c d e f Hwang、Jinsang(2005)。ICT標準の社会的形成:韓国での国家コード化文字セット標準論争の事例(PDF)エディンバラ大学。
  3. ^ a b c Lunde、Ken(1995-12-18)。「2.4.6:廃止された標準」。CJK.INFバージョン1.9
  4. ^ a b シン、ジョンシク。「KSX1001(KS C 5601)およびその他のハングルコードとは何ですか?」韓国のハングルとインターネットに関するよくある質問
  5. ^ a b c d Lunde、Ken(1995-12-18)。「3.3.6:Nバイトハングル」。CJK.INFバージョン1.9
  6. ^ a b "情報:ハングル(韓国語)文字セット"Microsoftサポート、Microsoft
  7. ^ a b Zsigri、Gyula(2002-06-18)。「KSCとUHC」
  8. ^ Chang、Hye-Shik(2021年11月28日)。"cpython / Modules / cjkcodecs / _codecs_kr.c(リビジョンd3faf43)"cPythonソースツリーPythonソフトウェアファウンデーション。
  9. ^ a b c チョン、ジェミン(2017-03-30)。U + 3164 HANGUL FILLER(PDF)に有益なメモを追加する提案。ユニコードコンソーシアムUTC L2 / 17-081。
  10. ^ 「コードページ01040」(PDF)IBM。2015年7月8日にオリジナル(PDF)からアーカイブされました
  11. ^ 「コードページ00891」(PDF)IBM。2015年7月8日にオリジナル(PDF)からアーカイブされました
  12. ^ 「KSRI-87-37-IR:항을・한자코드표준화에관한예연구:ハングルと漢字コードの標準化に関する研究」(PDF)(韓国語)。科学技術省1987.p。68. 2019-03-01のオリジナル(PDF)からアーカイブ。
  13. ^ "ibm-1363_P110-1997(リードバイトA1)"ICUデモンストレーション-コンバータエクスプローラUnicode / Unicodeコンソーシアムの国際コンポーネント
  14. ^ "euc-kr(リードバイトA1)"ICUデモンストレーション-コンバータエクスプローラUnicodeの国際コンポーネント。
  15. ^ a b c d "Mac OS韓国語エンコーディングからUnicode3.2以降へのマップ(外部バージョン)"りんご。
  16. ^ "windows-949-2000(リードバイトA1)"ICUデモンストレーション-コンバータエクスプローラUnicode / Unicodeコンソーシアムの国際コンポーネント
  17. ^ a b c d "リードバイトA1-A2(コードページ949)"MSDNマイクロソフト。
  18. ^ 韓国標準局(1988-10-01)。情報交換のための韓国語のグラフィック文字セット(PDF)ITSC​​J / IPSJISO-IR- 149。
  19. ^ a b c d e f g h i j k l m n o p q r s t u v w x y z aa ab ac ad ae Apple(2005-04-05)。「MacOS韓国語エンコーディングからUnicode3.2以降へのマップ(外部バージョン)」ユニコードコンソーシアム
  20. ^ "windows-949-2000(リードバイトA2)"ICUデモンストレーション-コンバータエクスプローラUnicode / Unicodeコンソーシアムの国際コンポーネント
  21. ^ a b ケン・ランディ(2018-01-21)。「東アジアの全幅句読点の標準化されたバリエーションシーケンスを追加する提案」(PDF)UTC L2 / 17-436。
  22. ^ a b "StandardizedVariants.txt:標準化されたバリエーションシーケンス"Unicode文字データベースユニコードコンソーシアム
  23. ^ Lunde、Ken(2009)。「文字が欠落しているようです」。CJKV情報処理:中国語、日本語、韓国語、ベトナム語のコンピューティング(第2版)。セバストポル、カリフォルニア州オライリーp。180. ISBN  978-0-596-51447-1
  24. ^ a b Lunde、Ken(2009)。「付録E:ベンダーの文字セット標準」(PDF)CJKV情報処理:中国語、日本語、韓国語、ベトナム語のコンピューティング(第2版)。セバストポル、カリフォルニア州オライリーISBN  978-0-596-51447-1
  25. ^ a b c Lunde、Ken(2008)。「第4章:エンコーディング方法(§Johabエンコーディング—KS X 1001:2004)」。CJKV情報処理(第2版)。カリフォルニア州セバストポルO'ReillyMediapp。268–273。ISBN 978-0-596-51447-1
  26. ^ a b シン、ジョンシク(2011-10-14)[1999-08-16]。JohabからUnicodeテーブルへユニコードコンソーシアム
  27. ^ 「コードページ識別子」Windows DevCenterマイクロソフト。
  28. ^ a b "ibm-1364_P110-2007"Unicodeの国際コンポーネントユニコードコンソーシアム
  29. ^ "ibm-933_P110-1995"Unicodeの国際コンポーネントユニコードコンソーシアム

外部リンク