構文解析ツリー

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ
ツリーをSAABに解析します

解析ツリーまたは解析ツリー[1]または派生ツリーまたは具体的な構文ツリーは、文脈自由文法に従って文字列の構文構造を表す、順序付けられたルートツリーです。構文解析ツリー自体は、主に計算言語学で使用されます。理論的な構文では、構文木という用語がより一般的です。

具体的な構文木は入力言語の構文を反映しているため、コンピュータープログラミングで使用される抽象構文木とは異なります。文法を教えるために使用されるReed-Kellogg文図とは異なり、構文解析ツリーは、さまざまなタイプの構成要素に対して個別の記号形状を使用しません

構文解析ツリーは通常、構成文法の構成関係(句構造文法)または依存文法の依存関係のいずれかに基づいて構築されます解析ツリーは自然言語の自然言語処理を参照)、およびプログラミング言語などのコンピューター言語の処理中に生成される場合があります。

関連する概念は、変形生成文法で使用されるフレーズマーカーまたはPマーカーの概念です。フレーズマーカーは、そのフレーズ構造に関してマークされた言語表現です。これは、ツリーの形式で、または括弧で囲まれた式として表示される場合があります。句マーカーは、句構造規則を適用することによって生成され、それ自体がさらに変換規則の対象となります。[2]構文的にあいまいな文に対して可能な解析ツリーのセットは、「解析フォレスト」と呼ばれます。[3]

命名法

単純な解析ツリー

解析ツリーは、ノードとブランチで構成されています。[4]図では、解析ツリーは、Sから始まり、各リーフノード(John、ball、the、hit)で終わる構造全体です。解析ツリーでは、各ノードはルートノード、ブランチノード、またはリーフノードのいずれかです。上記の例では、Sはルートノード、NPとVPはブランチノードであり、John、ball、the、およびhitはすべてリーフノードです。

ノードは、親ノードおよび子ノードと呼ばれることもあります。ノードとは、その下にブランチによってリンクされた他のノードが少なくとも1つあるノードです。この例では、SはNPとVPの両方の親です。ノードとは、ツリーのブランチによってリンクされているノードの真上に少なくとも1つのノードがあるノードです。再びこの例から、ヒットはVの子ノードです。

非ターミナル関数は、そのツリーのルートまたはブランチのいずれかである関数(ノード)ですが、ターミナル関数は、リーフである解析ツリーの関数(ノード)です。

構成要素ベースの解析ツリー

構成要素文法(句構造文法)の構成要素ベースの解析ツリーは、終端記号ノードと非終端記号ノードを区別します。内部ノード文法の非終端カテゴリでラベル付けされ、ノード終端カテゴリでラベル付けされます以下の画像は、構成要素ベースの解析ツリーを表しています。ジョンがボールを打った英語の文の構文構造を示しています

ツリーPSGを解析します

解析ツリーは、Sから始まり、各リーフノード(Johnhittheball)で終わる構造全体です。ツリーでは、次の略語が使用されています。

  • のS 、この例の最上位構造

ツリーの各ノードは、ルートノード、ブランチノード、またはリーフノードのいずれかです。[5]ルートノードは、その上にブランチがないノードです。文の中には、ルートノードが1つだけあります。ブランチノードは、2つ以上の子ノードに接続する親ノードです。ただし、リーフノードは、ツリー内の他のノードを支配しないターミナルノードです。Sはルートノード、NPとVPはブランチノード、ジョン(N)、ヒット(V)、 D)、ボール(N)はすべてリーフノードです。葉は文の字句トークンです。[6] [必要なページ]親ノードとは、その下のブランチによってリンクされた他のノードが少なくとも1つあるノードです。この例では、SはNとVPの両方の親です。子ノードとは、その真上に少なくとも1つのノードがあり、ツリーのブランチによってリンクされているノードです。例から、ヒットはVの子ノードです。という用語もこの関係に使用されることがあります。

依存関係に基づく解析ツリー

依存文法の依存関係ベースの解析ツリー[7]は、すべてのノードを終端記号と見なします。つまり、終端記号と非終端記号の区別を認識しません。含まれるノードが少ないため、構成要素ベースの解析ツリーよりも平均して単純です。上記の例文の依存関係ベースの解析ツリーは次のとおりです。

解析ツリーDG

この構文解析ツリーには、上記の構成要素ベースの対応物に見られる句動詞カテゴリ(S、VP、およびNP)がありません。構成要素ベースのツリーと同様に、構成要素の構造が認識されます。ツリーの完全なサブツリーはすべて構成要素です。したがって、この依存関係ベースの構文解析ツリーは、主語名詞Johnを認識し、目的語名詞は、構成要素ベースの構文解析ツリーと同じように 、ボールを構成要素として表現します。

構成要素と依存関係の区別は広範囲に及びます。構成要素ベースの解析ツリーに関連する追加の構文構造が必要か有益かは、議論の余地があります。

フレーズマーカー

フレーズマーカー、またはPマーカーは、Noam Chomskyによって開発されたように、初期の変形生成文法に導入されました。文の深層構造を表す句マーカーは、句構造規則を適用することによって生成されますその後、このアプリケーションはさらに変換される可能性があります。

フレーズマーカーはツリーの形式で表示される場合がありますが(構成要素ベースの解析ツリーに関する上記のセクションのように)、代わりに「括弧で囲まれた式」の形式で表示されることが多く、メモリ内の占有スペースが少なくなります。たとえば、上記の構成要素ベースのツリーに対応する括弧で囲まれた式は、次のようになります。

ツリーと同様に、そのような式の正確な構成と示される詳細の量は、適用される理論と、クエリの作成者が説明したいポイントに依存する可能性があります。

も参照してください

メモ

  1. ^ Chiswell and Hodges 2007:34を参照してください。
  2. ^ ノーム・チョムスキー(2014年12月26日)。構文理論の側面MITプレス。ISBN 978-0-262-52740-8
  3. ^ ビロット、シルビー、ベルンハルト・ラング。あいまいな構文解析における共有フォレストの構造。」
  4. ^ 「LaTeXでツリーを描画するための解析ツリーパッケージ」www1.essex.ac.uk
  5. ^ 構文ツリーの基本概念(ルートノード、ターミナルノード、非ターミナルノードなど)の概要については、Carnie(2013:118ff。)を参照してください。
  6. ^ Aho etal。を参照してください。1986年。
  7. ^ たとえば、Ágeletalを参照してください。2003/2006。

参考文献

外部リンク