المصنف التربيعي

في الإحصاء ، المصنف التربيعي هو مصنف إحصائي يستخدم سطح القرار التربيعي لفصل قياسات فئتين أو أكثر من الكائنات أو الأحداث. إنها نسخة أكثر عمومية من المصنف الخطي .

مشكلة التصنيف

يأخذ التصنيف الإحصائي في الاعتبار مجموعة من متجهات الملاحظات x لكائن أو حدث، ولكل منها نوع معروف y . ويشار إلى هذه المجموعة باسم مجموعة التدريب . تكمن المشكلة بعد ذلك في تحديد أفضل فئة يجب أن تكون بالنسبة لمتجه مراقبة جديد. بالنسبة للمصنف التربيعي، من المفترض أن يكون الحل الصحيح هو الحل التربيعي في القياسات، لذلك سيتم تحديد y بناءً على

في الحالة الخاصة التي تتكون فيها كل ملاحظة من قياسين، فهذا يعني أن الأسطح التي تفصل بين الفئات ستكون عبارة عن مقاطع مخروطية (أي إما خط أو دائرة أو قطع ناقص أو قطع مكافئ أو قطع زائد ). وبهذا المعنى، يمكننا القول أن النموذج التربيعي هو تعميم للنموذج الخطي، ويتم تبرير استخدامه من خلال الرغبة في توسيع قدرة المصنف على تمثيل الأسطح الفاصلة الأكثر تعقيدًا.

التحليل التمييزي التربيعي

يرتبط التحليل التمييزي التربيعي (QDA) ارتباطًا وثيقًا بالتحليل التمييزي الخطي (LDA)، حيث يفترض أن القياسات من كل فئة يتم توزيعها بشكل طبيعي . [1] على عكس LDA، في QDA لا يوجد افتراض بأن التباين المشترك لكل فئة متطابق. [2] عندما يكون الافتراض الطبيعي صحيحًا، فإن أفضل اختبار ممكن للفرضية القائلة بأن قياسًا معينًا ينتمي إلى فئة معينة هو اختبار نسبة الاحتمالية . لنفترض أن هناك مجموعتين فقط، مع المتوسطات ومصفوفات التباين المقابلة لـ و على التوالي. ثم يتم إعطاء نسبة الاحتمال بواسطة

لبعض عتبة . وبعد إجراء بعض عمليات إعادة الترتيب، يمكن إثبات أن السطح الفاصل الناتج بين الفئات هو سطح تربيعي. سوف تحل تقديرات العينة للمتجه المتوسط ​​ومصفوفات التباين والتباين محل الكميات السكانية في هذه الصيغة.

آخر

في حين أن QDA هي الطريقة الأكثر استخدامًا للحصول على المصنف، إلا أن هناك طرقًا أخرى ممكنة أيضًا. إحدى هذه الطرق هي إنشاء متجه قياس أطول من الناقل القديم عن طريق إضافة كافة المنتجات الزوجية للقياسات الفردية. على سبيل المثال، ناقلات

قد يصبح

إن العثور على مصنف تربيعي للقياسات الأصلية سيصبح بعد ذلك مثل العثور على مصنف خطي يعتمد على متجه القياس الموسع. تم استخدام هذه الملاحظة في توسيع نماذج الشبكات العصبية؛ [3] أثبتت الحالة "الدائرية"، التي تتوافق مع تقديم مجموع الحدود التربيعية الخالصة فقط بدون منتجات مختلطة ( )، أنها الحل الوسط الأمثل بين توسيع قوة تمثيل المصنف والتحكم في خطر التجاوز ( Vapnik- البعد تشيرفونينكيس ). [4]

بالنسبة للمصنفات الخطية التي تعتمد فقط على منتجات النقاط ، لا يلزم حساب هذه القياسات الموسعة فعليًا، نظرًا لأن منتج النقاط في الفضاء ذي الأبعاد الأعلى يرتبط ببساطة بذلك الموجود في الفضاء الأصلي. هذا مثال على ما يسمى بخدعة النواة ، والتي يمكن تطبيقها على تحليل التمييز الخطي بالإضافة إلى آلة ناقل الدعم .

مراجع

اقتباسات

  1. ^ ثروت، علاء (2016). “مصنف التحليل التمييزي الخطي مقابل التربيعي: برنامج تعليمي”. المجلة الدولية للتعرف على الأنماط التطبيقية . 3 (2): 145. دوى :10.1504/IJAPR.2016.079050. ISSN  2049-887X.
  2. ^ “التحليل التمييزي الخطي والتربيعي · دليل برمجة UC Business Analytics R”. uc-r.github.io . تم الاسترجاع 2020-03-29 .
  3. ^ الغلاف TM (1965). “الخصائص الهندسية والإحصائية لأنظمة المتباينات الخطية مع تطبيقات في التعرف على الأنماط”. معاملات IEEE على أجهزة الكمبيوتر الإلكترونية . EC-14 (3): 326-334. دوى :10.1109/pgec.1965.264137.
  4. ^ ريديلا إس، روفيتا إس، زونينو آر (1997). “شبكات الانتشار العكسي الدائرية للتصنيف”. معاملات IEEE على الشبكات العصبية . 8 (1): 84-97. دوى :10.1109/72.554194. PMID  18255613. href IEEE: [1].

مراجع عامة

تم الاسترجاع من "https://en.wikipedia.org/w/index.php?title=Quadratic_classifier&oldid=1216354396"