ワードディバイダー

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ
ワードディバイダー
  ・・
ラテン語の中黒 ゲエズ語のダブルポイント

句読点ではワードディバイダー書かれた単語を区切るグリフです。ラテン語キリル文字アラビア語のアルファベット、およびヨーロッパや西アジアの他のスクリプトを使用する言語では、単語の区切り文字は空白または空白です。この慣習は、ヨーロッパの句読点の他の側面とともに、アジアとアフリカに広がっています。アジアとアフリカでは、通常、単語は単語の区切りなしで書かれています。[1] [より良い情報源が必要]

コンピューティングでは、単語の区切り文字は、2つの単語を区切る文字を指すために使用されます。

文字エンコードでは単語のセグメンテーションは、どの文字が単語の区切り文字として定義されているかによって異なります。

歴史

古代エジプトでは、限定符は、単語の意味を明確にするのと同じくらい、単語の境界を区切るために使用されていた可能性があります[2]アッシリアの楔形文字ではめったにありませんが、後の楔形文字のウガリット文字では、単語を区切るために縦のストローク𒑰が使用されていました。古代ペルシア楔形文字では、斜めに傾斜したくさび𐏐が使用されていました。[3]

アルファベットが古代世界に広まるにつれ、単語は分割されずに一緒に実行されることが多く、この慣習は南アジアと東南アジアの多くで最近まで残っているか、残っています。ただし、碑文では垂直線が頻繁に使用されることはなく、原稿では、単語を分割するために1つ(・)、2つ(:)、または3つ(⫶)の中黒ドット)が使用されました。この慣習は、フェニキア語アラム語ヘブライ語ギリシャ語ラテン語で見られ、今日もエチオピア語で続けられていますが、空白が増えています。

Scriptio continua

フェニキア文字などの初期のアルファベット表記システムには、子音の記号しかありませんでした(ただし、子音の記号の中には、母音、いわゆる準母音を表すものもあります)。何らかの形の目に見える単語の区切りがなければ、テキストを個別の単語に解析することはパズルでした。ギリシャ語のアルファベットで母音を表す文字が導入されたことで、単語間の分離の必要性が減りました。初期のギリシャ語の碑文は、それ以前の書記体系で一般的であったように、中黒を使用していましたが、すぐに、すべての単語が分離せずに一緒に実行される連続的な書記の慣習が一般的になりました

タイプ

なし

古代エジプトでは、scriptio continuaとして知られる、単語間の分離のないアルファベットの書き方が使用されていました。それは、中黒を数世紀使用した後、古典ラテン語で登場しました。

伝統的に、scriptio continua、南アジアと東南アジアのインド語のアルファベットと韓国のハングルに使用されていましたが、現在では、間隔がハングルで使用され、インド語のアルファベットでますます使用されています。

今日、中国語日本語は、単語を区切るための句読点なしで一貫して書かれた主要なスクリプトです。漢文では、単語と文字はほとんど同じであるため、単語の区切りは不要でした。現代のマンダリンには多数の多音節の単語があり、各音節は異なる文字で書かれていますが、文字と単語または少なくとも形態素の間の概念的なリンクは強いままであり、文字がすでに提供しているものを除いて単語の分離の必要性は感じられません。このリンクはベトナム語でも見られます; ただし、ベトナム語のアルファベットでは、事実上すべての音節は、単語の境界を形成するかどうかに関係なく、スペースで区切られます。

人権宣言の最初の記事のジャワ文字 scriptiocontinuaの例。

スペース

スペースは、特にラテン文字で最も一般的なワードディバイダーです。

1911年のシカゴマニュアルオブスタイル[4]の伝統的な間隔の例

縦線

アナトリア象形文字などの古代の内接および楔形文字は、線文字Bと同様に、単語を区切るために短い垂直線を頻繁に使用していました原稿では、ラテン語のコンマとピリオドに相当する、より大きな区切りに垂直線がより一般的に使用されていました。これは聖書ヘブライ語( paseq)の場合であり、今日も多くのインド語のスクリプト(danda )を続けています

中黒、複数の点、および下顎骨

arma・virvmqve・cano・troiae・qvi・primvs・ab・oris
italiam・fato・profvgvs・laviniaqve・venitlitora
・mvltvm・ille・et・terris・iactatvs・et・
altovi・svpervm・saevae・memorem・ivnonis・ob・iram

ラテン語の中黒
エチオピアの二重中黒

上記のように、一重および二重の中間点は、古代世界全体の写本(紙)で使用されていました。たとえば、エチオピアの碑文は縦線を使用していましたが、写本はコロンに似た二重の点(፡)を使用していました。後者の慣行は今日も続いていますが、スペースは浸透しています。古典ラテン語は、紙の写本と石の碑文の両方で中黒を使用していました。[5] 古代ギリシャ語の正書法では、2〜5ドットを単語の区切り文字として使用し、また、下顎骨を使用していました。

別の文字形式

現代ヘブライ語アラビア語のアルファベットでは、一部の文字は単語の終わりや始まりに異なる形をしています。この境界は、間隔に加えて使用されます。

縦置き

ウルドゥー語に使用されるナスタアリーク体(右から左に書かれています)

ナスタアリーク体のイスラム書道は、垂直方向の配置を使用して単語を区切ります。各単語の先頭は前の単語の末尾よりも高く書かれているため、テキストの行はのこぎり波のように見えます。ナスタアリーク体はペルシア語から広がり、今日ではペルシア語ウイグル語パシュトゥー語ウルドゥー語に使用されています。

一時停止

文字とモールス信号では、単語は一時停止で区切られます。

も参照してください

参考文献

  1. ^ (Saenger 2000)
  2. ^ 「限定符は読みやすさを高める最も重要な手段であり、簡単に識別できる単語の区切り文字です。」(Ritner 1996:77)
  3. ^ キング、レオナルドウィリアム(1901年)。アッシリア楔形文字ニューヨーク:AMSプレス。p。42。
  4. ^ シカゴ大学出版局(1911年)。スタイルのマニュアル:シカゴ大学の出版物を管理する活字規則の編集、University Pressで使用されるタイプの標本(第3版)。シカゴ:シカゴ大学。p。 101この線は間隔が空けられています。
  5. ^ (Wingo 1972:16)

さらに読む