พาร์สทรี

จากวิกิพีเดีย สารานุกรมเสรี
ข้ามไปที่การนำทาง ข้ามไปที่การค้นหา
แยกต้นไม้ไปที่ SAAB

Parse treeหรือparsing tree [1]หรือderivation treeหรือconcrete tree syntax treeเป็นต้นไม้ที่มีลำดับและมีการรูตซึ่งแสดงถึง โครงสร้าง ทางวากยสัมพันธ์ของสตริงตาม ไวยากรณ์ ที่ไม่มีบริบท คำว่าparse treeนั้นใช้เป็นหลักในภาษาศาสตร์เชิงคำนวณ ในทางทฤษฎี คำว่าsyntax treeเป็นเรื่องปกติ

ต้นไม้ไวยากรณ์คอนกรีตสะท้อนถึงไวยากรณ์ของภาษาที่ป้อน ทำให้แตกต่างจากต้นไม้ไวยากรณ์นามธรรมที่ใช้ในการเขียนโปรแกรมคอมพิวเตอร์ แตกต่างจาก ไดอะแกรมประโยคของ Reed-Kellogg ที่ใช้สำหรับสอนไวยากรณ์ ต้นไม้แยกวิเคราะห์ไม่ใช้รูปร่างสัญลักษณ์ที่แตกต่างกันสำหรับองค์ประกอบ ประเภท ต่างๆ

ต้นไม้แยกวิเคราะห์มักจะสร้างขึ้นตามความสัมพันธ์แบบแบ่งเขตของไวยากรณ์การเลือกตั้ง (ไวยากรณ์โครงสร้างวลี ) หรือความสัมพันธ์การพึ่งพาของไวยากรณ์การขึ้นต่อกัน ต้นไม้แยกวิเคราะห์อาจถูกสร้างขึ้นสำหรับประโยคในภาษาธรรมชาติ (ดูการประมวลผลภาษาธรรมชาติ ) เช่นเดียวกับระหว่างการประมวลผล ภาษา คอมพิวเตอร์ เช่นภาษาโปรแกรม

แนวคิดที่เกี่ยวข้องกันคือเครื่องหมายวลีหรือP-markerซึ่งใช้ในไวยากรณ์กำเนิดการเปลี่ยนแปลง เครื่องหมายวลีคือนิพจน์ภาษาศาสตร์ที่ทำเครื่องหมายเป็นโครงสร้างวลี อาจนำเสนอในรูปแบบของต้นไม้หรือเป็นนิพจน์ในวงเล็บ ตัวทำเครื่องหมายวลีสร้างขึ้นโดยใช้กฎโครงสร้างวลีและกฎเหล่านั้นจะอยู่ภายใต้กฎการเปลี่ยนแปลงเพิ่มเติม [2]ชุดของต้นไม้แยกวิเคราะห์ที่เป็นไปได้สำหรับ ประโยคที่ คลุมเครือทางวากยสัมพันธ์เรียกว่า "ป่าพาร์ส" [3]

ศัพท์เฉพาะ

ต้นไม้พาร์สธรรมดา

ต้นไม้แยกวิเคราะห์ประกอบด้วยโหนดและกิ่งก้าน [4]ในภาพ ต้นไม้แยกเป็นโครงสร้างทั้งหมด เริ่มต้นจาก S และสิ้นสุดที่แต่ละโหนดของใบไม้ (John, ball, the, hit) ในแผนผังแยกวิเคราะห์ แต่ละโหนดอาจเป็น โหนด รูท โหนดสาขาหรือโหนดลีฟ ในตัวอย่างข้างต้น S คือโหนดรูท NP และ VP เป็นโหนดสาขา ในขณะที่ John, ball, the และ hit เป็นโหนดปลายสุดทั้งหมด

โหนดยังสามารถเรียกว่าโหนดหลักและโหนดย่อย โหนด หลัก คือโหนดที่ มีโหนดอื่นอย่างน้อยหนึ่งโหนดที่เชื่อมโยงโดยสาขาที่อยู่ภายใต้ ในตัวอย่าง S เป็นพาเรนต์ของทั้ง NP และ VP โหนด ย่อย คือโหนดที่มีอย่างน้อย หนึ่งโหนดที่อยู่เหนือโหนดโดยตรงซึ่งเชื่อมโยงกับกิ่งก้านของต้นไม้ จากตัวอย่างของเรา อีกครั้ง hit เป็นโหนดย่อยของ V

ฟังก์ชัน ที่ ไม่ใช่ เทอร์มินอลคือ ฟังก์ชัน (โหนด) ซึ่งเป็นทั้งรูทหรือกิ่งในทรีนั้น ในขณะที่ฟังก์ชันเทอร์มินัลคือฟังก์ชัน (โหนด) ในพาร์สทรีซึ่งเป็นใบไม้

ต้นไม้แยกตามเขตเลือกตั้ง

ต้นไม้แยกวิเคราะห์ตามการเลือกตั้งของไวยากรณ์การเลือกตั้ง (ไวยากรณ์โครงสร้างวลี ) แยกความแตกต่างระหว่างโหนดปลายทางและโหนดที่ไม่ใช่ปลายทาง โหนดภายในจะติดป้ายกำกับโดย หมวดหมู่ ที่ไม่ใช่เทอร์มินัลของไวยากรณ์ ในขณะที่โหนดปลาย สุด จะถูกติดป้ายกำกับตามหมวดหมู่ ของ เทอร์มินัล รูปภาพด้านล่างแสดงแผนผังการแยกวิเคราะห์ตามการเลือกตั้ง มันแสดงให้เห็นโครงสร้างวากยสัมพันธ์ของประโยคภาษาอังกฤษJohn hit the ball :

แยกวิเคราะห์ PSG

ต้นไม้แยกวิเคราะห์เป็นโครงสร้างทั้งหมด เริ่มต้นจาก S และสิ้นสุดในแต่ละโหนดของใบไม้ ( John , hit , the , ball ) ตัวย่อต่อไปนี้ใช้ในต้นไม้:

  • S สำหรับประโยคโครงสร้างระดับบนสุดในตัวอย่างนี้
  • NP สำหรับ คำ นามวลี NP แรก (ซ้ายสุด) คำนามเดียว "John" ทำหน้าที่เป็นประธานของประโยค อันที่สองเป็นกรรมของประโยค

แต่ละโหนดในแผนผังอาจเป็น โหนด รูท โหนดสาขาหรือโหนดลีฟ [5]โหนดรูทคือโหนดที่ไม่มีกิ่งก้านอยู่ด้านบน ภายในประโยคจะมีรูทโหนดเดียวเท่านั้น โหนดสาขาคือโหนดหลักที่เชื่อมต่อกับโหนดย่อยตั้งแต่สองโหนดขึ้นไป โหนดปลายสุดเป็นโหนดปลายทางที่ไม่ได้ครอบงำโหนดอื่นในทรี S คือโหนดรูท NP และ VP คือโหนดสาขา และJohn (N), hit (V), ( D) และball (N) เป็นโหนดปลายสุดทั้งหมด ใบไม้เป็นสัญลักษณ์คำศัพท์ของประโยค [6] [ ต้องการหน้า ]โหนดหลักคือโหนดที่มีโหนดอื่นอย่างน้อยหนึ่งโหนดที่เชื่อมโยงโดยสาขาที่อยู่ภายใต้ ในตัวอย่าง S เป็นพาเรนต์ของทั้ง N และ VP โหนดย่อยคือโหนดที่มีอย่างน้อยหนึ่งโหนดที่อยู่เหนือโหนดโดยตรงซึ่งเชื่อมโยงกับกิ่งก้านของต้นไม้ จากตัวอย่างhitเป็นโหนดย่อยของ V คำว่าแม่และลูกสาวยังใช้ในความสัมพันธ์นี้ในบางครั้ง

ต้นไม้แยกตามการพึ่งพา

แผนผังการแยกวิเคราะห์แบบอิงตามการพึ่งพาของไวยากรณ์การพึ่งพา[7]ดูโหนดทั้งหมดเป็นเทอร์มินัล ซึ่งหมายความว่าไม่ยอมรับความแตกต่างระหว่างหมวดหมู่เทอร์มินัลและประเภทที่ไม่ใช่เทอร์มินัล โดยเฉลี่ยแล้วจะง่ายกว่าแผนผังแยกวิเคราะห์ตามการเลือกตั้ง เนื่องจากมีโหนดน้อยกว่า โครงสร้างการแยกวิเคราะห์ตามการพึ่งพาสำหรับประโยคตัวอย่างด้านบนมีดังนี้:

แยกวิเคราะห์ต้นไม้DG

ต้นไม้แยกวิเคราะห์นี้ไม่มีหมวดหมู่วลี (S, VP และ NP) ที่เห็นในคู่ตามเขตเลือกตั้งด้านบน เช่นเดียวกับต้นไม้ตามการเลือกตั้งโครงสร้างองค์ประกอบเป็นที่ยอมรับ ต้นไม้ย่อยที่สมบูรณ์ใดๆ ของต้นไม้เป็นส่วนประกอบ ดังนั้นต้นไม้แยกวิเคราะห์ที่ใช้การพึ่งพานี้ยอมรับคำนาม ประธาน จอห์นและวลีนามวัตถุที่ลูกบอลเป็นองค์ประกอบเช่นเดียวกับต้นไม้แยกวิเคราะห์ตามการเลือกตั้ง

ความแตกต่างระหว่างการเลือกตั้งกับการพึ่งพาอาศัยกันนั้นกว้างไกล โครงสร้างวากยสัมพันธ์เพิ่มเติมที่เกี่ยวข้องกับต้นไม้แยกวิเคราะห์ตามการเลือกตั้งจำเป็นหรือเป็นประโยชน์หรือไม่นั้นเป็นเรื่องของการอภิปราย

เครื่องหมายวลี

เครื่องหมายวลี หรือ P-markers ถูกนำมาใช้ในไวยากรณ์กำเนิดการเปลี่ยนแปลง ในช่วงต้น ซึ่งพัฒนาโดยNoam Chomskyและคนอื่นๆ เครื่องหมายวลีที่แสดงถึงโครงสร้างเชิงลึกของประโยคถูกสร้างขึ้นโดยใช้กฎโครงสร้างวลี จากนั้น แอปพลิเคชันนี้อาจได้รับการเปลี่ยนแปลงเพิ่มเติม

เครื่องหมายวลีอาจแสดงในรูปของต้นไม้ (ดังในหัวข้อด้านบนบนต้นไม้แยกวิเคราะห์ตามการเลือกตั้ง ) แต่มักจะใช้แทนในรูปของ "นิพจน์แบบวงเล็บ" ซึ่งใช้พื้นที่ในหน่วยความจำน้อยกว่า ตัวอย่างเช่น นิพจน์ในวงเล็บที่สอดคล้องกับแผนผังตามการเลือกตั้งที่ระบุด้านบนอาจเป็นดังนี้:

เช่นเดียวกับต้นไม้ การสร้างนิพจน์ดังกล่าวอย่างแม่นยำและจำนวนรายละเอียดที่แสดงขึ้นอยู่กับทฤษฎีที่กำลังนำไปใช้และประเด็นที่ผู้เขียนข้อความค้นหาต้องการแสดง

ดูเพิ่มเติม

หมายเหตุ

  1. ดู ชิสเวลล์ แอนด์ ฮอดเจส 2007: 34.
  2. ^ โนม ชอมสกี้ (26 ธันวาคม 2557). ลักษณะของทฤษฎีวากยสัมพันธ์ สำนักพิมพ์เอ็มไอที ISBN 978-0-262-52740-8.
  3. บิลลอต, ซิลวี และเบอร์นาร์ด แลงก์ "โครงสร้างของป่าที่ใช้ร่วมกันในการแยกวิเคราะห์ที่คลุมเครือ "
  4. ^ "แพ็คเกจพาร์เซทรีสำหรับวาดต้นไม้ใน LaTeX " www1.essex.ac.uk .
  5. ^ ดู Carnie (2013:118ff.) สำหรับข้อมูลเบื้องต้นเกี่ยวกับแนวคิดพื้นฐานของแผนผังโครงสร้าง (เช่น โหนดรูท โหนดเทอร์มินัล โหนดที่ไม่ใช่เทอร์มินัล ฯลฯ)
  6. ^ ดู Aho et al. พ.ศ. 2529
  7. ^ ดูตัวอย่าง Ágel et al. 2546/2549.

อ้างอิง

ลิงค์ภายนอก