الاستدلال الإحصائي

من ويكيبيديا، الموسوعة الحرة
اذهب إلى الملاحة اذهب للبحث

الاستدلال الإحصائي هو عملية استخدام تحليل البيانات لاستنتاج خصائص التوزيع الأساسي للاحتمال . [1] يستنتج التحليل الإحصائي الاستنتاجي خصائص السكان ، على سبيل المثال عن طريق اختبار الفرضيات واشتقاق التقديرات. من المفترض أن مجموعة البيانات المرصودة مأخوذة من مجموعة أكبر من السكان.

يمكن مقارنة الإحصاءات الاستنتاجية بالإحصاءات الوصفية . يهتم الإحصاء الوصفي فقط بخصائص البيانات المرصودة ، ولا يعتمد على افتراض أن البيانات تأتي من عدد أكبر من السكان. في التعلم الآلي ، يستخدم مصطلح الاستدلال أحيانًا بدلاً من ذلك ليعني "عمل توقع ، من خلال تقييم نموذج مدرب بالفعل" ؛ [2] في هذا السياق يُشار إلى استنتاج خصائص النموذج بالتدريب أو التعلم (بدلاً من الاستدلال ) ، ويشار إلى استخدام نموذج للتنبؤ بالاستدلال (بدلاً من التنبؤ ) ؛ أنظر أيضاالاستدلال التنبئي .

مقدمة

يقدم الاستدلال الإحصائي مقترحات حول السكان ، باستخدام البيانات المستمدة من السكان مع بعض أشكال أخذ العينات . بالنظر إلى فرضية حول السكان ، والتي نرغب في استخلاص استنتاجات لها ، يتكون الاستدلال الإحصائي من (أولاً) اختيار نموذج إحصائي للعملية التي تولد البيانات و (ثانيًا) استنتاج المقترحات من النموذج. [3]

يقول كونيشي وكيتاجاوا: "يمكن اعتبار غالبية المشكلات في الاستدلال الإحصائي مشكلات متعلقة بالنمذجة الإحصائية". [4] وفي سياق متصل ، قال السير ديفيد كوكس : "غالبًا ما تكون الطريقة التي تتم بها الترجمة من مشكلة الموضوع إلى النموذج الإحصائي هي الجزء الأكثر أهمية في التحليل". [5]

استنتاج الاستدلال الإحصائي هو اقتراح إحصائي . [6] بعض الأشكال الشائعة للافتراض الإحصائي هي كما يلي:

  • تقدير نقطي ، أي قيمة معينة تقارب بشكل أفضل بعض معاملات الفائدة ؛
  • تقدير فاصل ، على سبيل المثال فاصل الثقة (أو تقدير المجموعة) ، أي فاصل زمني تم إنشاؤه باستخدام مجموعة بيانات مأخوذة من مجتمع بحيث ، في ظل أخذ عينات متكررة لمجموعات البيانات هذه ، قد تحتوي هذه الفواصل الزمنية على قيمة المعلمة الحقيقية مع الاحتمال عند الثقة المعلنة المستوى .
  • فترة موثوقة ، أي مجموعة من القيم تحتوي ، على سبيل المثال ، على 95٪ من الاعتقاد اللاحق ؛
  • رفض فرضية _ [ملاحظة 1]
  • تجميع أو تصنيف نقاط البيانات في مجموعات.

النماذج والافتراضات

يتطلب أي استدلال إحصائي بعض الافتراضات. النموذج الإحصائي هو مجموعة من الافتراضات المتعلقة بتوليد البيانات المرصودة والبيانات المماثلة. تؤكد أوصاف النماذج الإحصائية عادة على دور الكميات السكانية ذات الأهمية ، والتي نرغب في استخلاص الاستدلال عنها. [7] عادة ما يتم استخدام الإحصاء الوصفي كخطوة أولية قبل استخلاص المزيد من الاستدلالات الرسمية. [8]

درجة النماذج / الافتراضات

يميز الإحصائيون بين ثلاثة مستويات من افتراضات النمذجة ؛

  • معلمات كاملة: التوزيعات الاحتمالية التي تصف عملية توليد البيانات يُفترض أنها موصوفة بالكامل من قبل عائلة من التوزيعات الاحتمالية التي تتضمن فقط عددًا محدودًا من المعلمات غير المعروفة. [7] على سبيل المثال ، يمكن للمرء أن يفترض أن توزيع قيم السكان طبيعي حقًا ، بمتوسط ​​وتباين غير معروفين ، وأن مجموعات البيانات يتم إنشاؤها عن طريق أخذ عينات عشوائية "بسيطة" . عائلة النماذج الخطية المعممة هي فئة مرنة ومستخدمة على نطاق واسع من النماذج البارامترية.
  • غير بارامترية : الافتراضات التي تم إجراؤها حول عملية توليد البيانات أقل بكثير مما كانت عليه في الإحصائيات البارامترية وقد تكون في حدها الأدنى. [9] على سبيل المثال ، كل توزيع احتمالي مستمر له متوسط ​​، والذي يمكن تقديره باستخدام وسيط العينة أو مقدر Hodges – Lehmann-Sen ، والذي يتمتع بخصائص جيدة عندما تنشأ البيانات من أخذ عينات عشوائية بسيطة.
  • شبه بارامترية : يشير هذا المصطلح عادةً إلى افتراضات "بين" المقاربات الكاملة وغير المعلمية. على سبيل المثال ، قد يفترض المرء أن التوزيع السكاني له متوسط ​​محدود. علاوة على ذلك ، يمكن للمرء أن يفترض أن متوسط ​​مستوى الاستجابة في المجتمع يعتمد بطريقة خطية حقًا على بعض المتغيرات المشتركة (افتراض حدودي) ولكن لا يقوم بأي افتراض حدودي يصف التباين حول هذا المتوسط ​​(أي حول وجود أو شكل محتمل لأي تغاير مغاير) ). بشكل عام ، يمكن غالبًا فصل النماذج شبه المعلمة إلى مكونات "هيكلية" و "تباين عشوائي". يتم التعامل مع أحد المكونات بشكل حدودي بينما يتم التعامل مع الآخر بطريقة غير بارامترية. نموذج كوكس المشهورعبارة عن مجموعة من الافتراضات شبه المعيارية.

أهمية النماذج / الافتراضات الصحيحة

تُظهر الصورة أعلاه رسمًا بيانيًا يقيم افتراض الحالة الطبيعية ، والتي يمكن توضيحها من خلال الانتشار المتساوي أسفل منحنى الجرس.

أيا كان مستوى الافتراض الذي يتم إجراؤه ، فإن الاستدلال المعاير بشكل صحيح ، بشكل عام ، يتطلب أن تكون هذه الافتراضات صحيحة ؛ أي أن آليات توليد البيانات قد تم تحديدها بشكل صحيح.

يمكن أن تؤدي الافتراضات غير الصحيحة لأخذ العينات العشوائية "البسيطة" إلى إبطال الاستدلال الإحصائي. [10] كما أن الافتراضات الأكثر تعقيدًا والمعلمات بشكل كامل مدعاة للقلق. على سبيل المثال ، الافتراض غير الصحيح لنموذج كوكس يمكن أن يؤدي في بعض الحالات إلى استنتاجات خاطئة. [11] الافتراضات غير الصحيحة للطبيعية في المجتمع تبطل أيضًا بعض أشكال الاستدلال القائم على الانحدار. [12] استخدام أيينظر معظم الخبراء إلى النموذج البارامترى بتشكك من قبل معظم الخبراء في أخذ العينات من البشر: "معظم إحصائيي العينات ، عندما يتعاملون مع فترات الثقة على الإطلاق ، يقصرون أنفسهم على عبارات حول [المقدرين] استنادًا إلى عينات كبيرة جدًا ، حيث تضمن نظرية الحد المركزي أن هذه [ المقدّرون] سيكون لديهم توزيعات شبه طبيعية ". [13] على وجه الخصوص ، التوزيع الطبيعي "سيكون افتراضًا غير واقعي تمامًا وغير حكيم بشكل كارثي إذا كنا نتعامل مع أي نوع من السكان الاقتصاديين." [13] هنا ، تنص نظرية الحد المركزي على أن توزيع متوسط ​​العينة "للعينات الكبيرة جدًا" يتم توزيعه بشكل طبيعي تقريبًا ، إذا لم يكن التوزيع ذو الطرف الثقيل.

التوزيعات التقريبية

نظرًا لصعوبة تحديد التوزيعات الدقيقة لإحصاءات العينة ، فقد تم تطوير العديد من الطرق لتقريب هذه التوزيعات.

مع العينات المحدودة ، تقيس نتائج التقريب مدى قرب اقتراب التوزيع المحدد من توزيع العينة الإحصائية : على سبيل المثال ، مع 10000 عينة مستقلة ، يقارب التوزيع الطبيعي (إلى رقمين من الدقة) توزيع متوسط ​​العينة للعديد من توزيعات السكان ، بواسطة بيري نظرية –Esseen . [14] ومع ذلك ، بالنسبة للعديد من الأغراض العملية ، يوفر التقريب الطبيعي تقريبًا جيدًا لتوزيع متوسط ​​العينة عندما يكون هناك 10 (أو أكثر) عينات مستقلة ، وفقًا لدراسات المحاكاة وخبرة الإحصائيين. [14] بعد عمل كولموغوروف في الخمسينيات من القرن الماضي ، تم استخدام الإحصائيات المتقدمةنظرية التقريب والتحليل الوظيفي لتقدير خطأ التقريب. في هذا النهج ، تتم دراسة الهندسة المتريّة للتوزيعات الاحتمالية ؛ يحدد هذا النهج خطأ التقريب ، على سبيل المثال ، اختلاف Kullback – Leibler ، وتباعد Bregman ، ومسافة Hellinger . [15] [16] [17]

مع العينات الكبيرة إلى أجل غير مسمى ، فإن النتائج المحددة مثل نظرية الحد المركزي تصف التوزيع المحدود لإحصاء العينة إذا كان موجودًا. النتائج المحددة ليست بيانات حول العينات المحدودة ، وهي في الواقع غير ذات صلة بالعينات المحدودة. [18] [19] [20] ومع ذلك ، غالبًا ما يتم استدعاء نظرية التقارب للحد من التوزيعات للعمل مع عينات محدودة. على سبيل المثال ، غالبًا ما يتم استدعاء النتائج المحددة لتبرير الطريقة المعممة للحظات واستخدام معادلات التقدير المعممة ، والتي تحظى بشعبية في الاقتصاد القياسي والإحصاء الحيوي. يمكن تقييم حجم الاختلاف بين التوزيع المحدد والتوزيع الحقيقي (رسميًا ، "خطأ" التقريب) باستخدام المحاكاة. [21] يعد التطبيق التجريبي للحد من النتائج على العينات المحدودة ممارسة شائعة في العديد من التطبيقات ، خاصة مع النماذج منخفضة الأبعاد ذات احتمالية التقعر اللوغاريتمي (مثل العائلات الأسية ذات المعلمة الواحدة ).

النماذج القائمة على التوزيع العشوائي

بالنسبة لمجموعة بيانات معينة تم إنتاجها بواسطة تصميم عشوائي ، يتم تحديد التوزيع العشوائي للإحصاء (بموجب الفرضية الصفرية) من خلال تقييم إحصائية الاختبار لجميع الخطط التي كان من الممكن إنشاؤها بواسطة تصميم التوزيع العشوائي. في الاستدلال المتكرر ، تسمح العشوائية بأن تستند الاستدلالات إلى التوزيع العشوائي بدلاً من نموذج شخصي ، وهذا مهم بشكل خاص في أخذ عينات المسح وتصميم التجارب. [22] [23] الاستدلال الإحصائي من الدراسات العشوائية هو أيضًا أكثر وضوحًا من العديد من المواقف الأخرى. [24] [25] [26] في الاستدلال البايزي ، يكون التوزيع العشوائي مهمًا أيضًا: في أخذ عينات المسح ، استخداميضمن أخذ العينات بدون استبدال قابلية تبادل العينة مع السكان ؛ في التجارب العشوائية ، تستدعي العشوائية وجود افتراض عشوائي مفقود للمعلومات ذات المتغير المشترك . [27]

يسمح التوزيع العشوائي الموضوعي بالإجراءات الاستقرائية بشكل صحيح. [28] [29] [30] [31] [32] يفضل العديد من الإحصائيين التحليل المعتمد على التوزيع العشوائي للبيانات التي تم إنشاؤها بواسطة إجراءات عشوائية محددة جيدًا. [33] (ومع ذلك ، فمن الصحيح أنه في مجالات العلوم ذات المعرفة النظرية المتقدمة والتحكم التجريبي ، قد تزيد التجارب العشوائية من تكاليف التجربة دون تحسين جودة الاستدلالات. [34] [35] ) وبالمثل ، النتائج من التجارب العشوائية موصى بها من قبل السلطات الإحصائية الرائدة باعتبارها تسمح باستنتاجات ذات موثوقية أكبر من الدراسات القائمة على الملاحظة لنفس الظواهر. [36] ومع ذلك ، قد تكون الدراسة القائمة على الملاحظة أفضل من التجربة العشوائية السيئة.

قد يعتمد التحليل الإحصائي للتجربة العشوائية على مخطط العشوائية المنصوص عليه في البروتوكول التجريبي ولا يحتاج إلى نموذج شخصي. [37] [38]

ومع ذلك ، في أي وقت ، لا يمكن اختبار بعض الفرضيات باستخدام نماذج إحصائية موضوعية ، والتي تصف بدقة التجارب العشوائية أو العينات العشوائية. في بعض الحالات ، تكون هذه الدراسات العشوائية غير اقتصادية أو غير أخلاقية.

التحليل القائم على النموذج للتجارب العشوائية

من الممارسات القياسية الإشارة إلى نموذج إحصائي ، على سبيل المثال ، نماذج خطية أو لوجستية ، عند تحليل البيانات من التجارب العشوائية. [39] ومع ذلك ، فإن نظام التوزيع العشوائي يوجه اختيار النموذج الإحصائي. لا يمكن اختيار نموذج مناسب دون معرفة نظام التوزيع العشوائي. [23] يمكن الحصول على نتائج مضللة بشكل خطير من خلال تحليل البيانات من التجارب العشوائية مع تجاهل البروتوكول التجريبي. تشمل الأخطاء الشائعة نسيان الحجب المستخدم في التجربة والخلط بين القياسات المتكررة على نفس الوحدة التجريبية مع التكرارات المستقلة للعلاج المطبق على وحدات تجريبية مختلفة. [40]

الاستدلال العشوائي الخالي من النماذج

توفر التقنيات الخالية من النماذج مكملاً للطرق القائمة على النموذج ، والتي تستخدم استراتيجيات مختزلة لتبسيط الواقع. الأول يجمع ويطور ويجمع ويدرب الخوارزميات التي تتكيف ديناميكيًا مع الصلات السياقية للعملية وتعلم الخصائص الجوهرية للملاحظات. [39] [41]

على سبيل المثال ، يعتمد الانحدار الخطي البسيط الخالي من النماذج إما على

  • تصميم عشوائي ، حيث يكون هناك أزواج من الملاحظاتمستقلة وموزعة بشكل مماثل (iid) ، أو
  • تصميم حتمي حيث المتغيراتحتمية ، لكن متغيرات الاستجابة المقابلةعشوائية ومستقلة مع توزيع شرطي مشترك ، أي ،، وهو مستقل عن الفهرس.

في كلتا الحالتين ، الاستدلال العشوائي الخالي من النموذج لميزات التوزيع الشرطي المشتركيعتمد على بعض شروط الانتظام ، مثل النعومة الوظيفية. على سبيل المثال ، الاستدلال العشوائي الخالي من النماذج للمتوسط ​​الشرطي لميزة السكان ،، يمكن تقديرها باستمرار من خلال المتوسط ​​المحلي أو المناسب متعدد الحدود المحلي ، على افتراض أنعلى نحو سلس. أيضًا ، بالاعتماد على الحالة الطبيعية المقاربة أو إعادة التشكيل ، يمكننا إنشاء فترات ثقة لميزة السكان ، في هذه الحالة ، المتوسط ​​الشرطي ،. [42]

نماذج للاستدلال

تم إنشاء مدارس مختلفة للاستدلال الإحصائي. هذه المدارس - أو "النماذج" - ليست متعارضة ، والطرق التي تعمل بشكل جيد تحت نموذج واحد غالبًا ما يكون لها تفسيرات جذابة في ظل نماذج أخرى.

يصف Bandyopadhyay & Forster أربعة نماذج: النموذج الكلاسيكي (أو المتكرر ) ، والنموذج Bayesian ، ونموذج الاحتمالية ، والنموذج القائم على معيار المعلومات Akaikean . [43]

الاستدلال المتكرر

يعاير هذا النموذج معقولية المقترحات من خلال النظر في أخذ عينات متكررة (افتراضية) لتوزيع السكان لإنتاج مجموعات بيانات مماثلة لتلك الموجودة في متناول اليد. من خلال النظر في خصائص مجموعة البيانات في ظل أخذ العينات المتكرر ، يمكن تحديد الخصائص المتكررة لاقتراح إحصائي - على الرغم من أن هذا التحديد الكمي قد يكون صعبًا في الممارسة العملية.

أمثلة على الاستدلال المتكرر

الاستدلال المتكرر والموضوعية ونظرية القرار

أحد تفسيرات الاستدلال التكراري (أو الاستدلال الكلاسيكي) هو أنه لا ينطبق إلا من حيث احتمال التردد ؛ أي من حيث أخذ العينات المتكرر من السكان. ومع ذلك ، فإن نهج نيمان [44]يطور هذه الإجراءات من حيث احتمالات ما قبل التجربة. أي قبل إجراء التجربة ، يقرر المرء قاعدة للتوصل إلى استنتاج بحيث يتم التحكم في احتمالية أن تكون صحيحة بطريقة مناسبة: مثل هذا الاحتمال لا يحتاج إلى تفسير متكرر أو متكرر لأخذ العينات. في المقابل ، يعمل الاستدلال البايزي من حيث الاحتمالات الشرطية (أي الاحتمالات المشروطة بالبيانات المرصودة) ، مقارنة بالاحتمالات الهامشية (ولكنها مشروطة بمعلمات غير معروفة) المستخدمة في النهج التكراري.

يمكن بناء الإجراءات المتكررة لاختبار الأهمية وفترات الثقة دون النظر إلى وظائف المنفعة . ومع ذلك ، فإن بعض عناصر الإحصاء المتكرر ، مثل نظرية القرار الإحصائي ، تتضمن وظائف المنفعة . [ بحاجة لمصدر ] على وجه الخصوص ، التطورات المتكررة للاستدلال الأمثل (مثل المقدرات غير المتحيزة ذات الحد الأدنى من التباين ، أو الاختبارات الأكثر قوة بشكل موحد ) تستخدم وظائف الخسارة ، التي تلعب دور وظائف المنفعة (السلبية). لا يلزم ذكر وظائف الخسارة صراحةً للمنظرين الإحصائيين لإثبات أن الإجراء الإحصائي له خاصية مثالية.[٤٥] ومع ذلك ، غالبًا ما تكون دوال الخسارة مفيدة لتوضيح الخصائص المثلى: على سبيل المثال ، المقدرات المتوسطة غير المتحيزة هي الأمثل في ظل وظائف فقدان القيمة المطلقة ، من حيث أنها تقلل الخسارة المتوقعة ، ومقدرات المربعات الصغرى هي الأمثل في ظل وظائف فقدان الخطأ التربيعي ، في أنها تقلل من الخسارة المتوقعة.

في حين أن الإحصائيين الذين يستخدمون الاستدلال المتكرر يجب أن يختاروا لأنفسهم المعلمات محل الاهتمام ، وإحصاءات التقدير / الاختبار المراد استخدامها ، فقد ساعد غياب المرافق الصريحة والتوزيعات السابقة على تكرار الإجراءات لتصبح "موضوعية" على نطاق واسع. [46]

الاستدلال بايزي

يصف حساب بايزي درجات الاعتقاد باستخدام "لغة" الاحتمال. المعتقدات إيجابية ، وتتكامل في واحدة ، وتطيع البديهيات الاحتمالية. يستخدم الاستدلال البايزي المعتقدات اللاحقة المتاحة كأساس لعمل مقترحات إحصائية. [47] هناك عدة مبررات مختلفة لاستخدام نهج بايز.

أمثلة على الاستدلال البايزي

الاستدلال البايزي والذاتية ونظرية القرار

تستند العديد من الاستنتاجات البايزية غير الرسمية إلى ملخصات "معقولة بشكل حدسي" للخلف. على سبيل المثال ، يمكن تحفيز المتوسط ​​الخلفي والوسيط والوضع وأعلى فترات كثافة خلفية وعوامل بايز بهذه الطريقة. بينما لا يلزم ذكر وظيفة المنفعة للمستخدم لهذا النوع من الاستدلال ، فإن هذه الملخصات تعتمد جميعها (إلى حد ما) على المعتقدات السابقة المذكورة ، ويُنظر إليها عمومًا على أنها استنتاجات ذاتية. (تم اقتراح طرق إنشاء سابقة لا تتطلب مدخلات خارجية ولكن لم يتم تطويرها بالكامل بعد.)

بشكل رسمي ، يتم معايرة الاستدلال البايزي بالإشارة إلى الأداة المساعدة المنصوص عليها صراحة ، أو وظيفة الخسارة ؛ "قاعدة بايز" هي التي تزيد من المنفعة المتوقعة ، بمتوسط ​​عدم اليقين اللاحق. وبالتالي ، فإن الاستدلال البايزي الرسمي يوفر تلقائيًا القرارات المثلى بالمعنى النظري للقرار . بالنظر إلى الافتراضات والبيانات والمرافق ، يمكن إجراء الاستدلال البايزي لأي مشكلة بشكل أساسي ، على الرغم من أنه لا يحتاج كل استدلال إحصائي إلى تفسير بايزي. التحليلات غير الرسمية يمكن أن تكون غير متماسكة (منطقيًا) ؛ إحدى سمات الإجراءات البايزية التي تستخدم مقدمات مناسبة (أي تلك التي يمكن دمجها مع واحد) هي أنها مضمونة لتكون متماسكة . بعض دعاةيؤكد الاستدلال البايزي على أن الاستدلال يجب أن يحدث في هذا الإطار النظري للقرار ، وأن الاستدلال البايزي يجب ألا يختتم بتقييم وتلخيص المعتقدات اللاحقة.

الاستدلال على أساس الاحتمالية

تقترب الراجحية من الإحصائيات باستخدام دالة الاحتمال . يرفض بعض علماء الاحتمالية الاستدلال ، معتبرين أن الإحصائيات هي مجرد دعم حسابي من الأدلة. ومع ذلك ، يقترح آخرون استنتاجًا بناءً على وظيفة الاحتمال ، وأشهرها هو تقدير الاحتمالية القصوى .

الاستدلال المستند إلى AIC

معيار معلومات Akaike (AIC) هو مقدر للجودة النسبية للنماذج الإحصائية لمجموعة معينة من البيانات. بالنظر إلى مجموعة من النماذج للبيانات ، تقدر AIC جودة كل نموذج ، بالنسبة لكل نموذج من النماذج الأخرى. وبالتالي ، توفر AIC وسيلة لاختيار النموذج .

تأسست AIC على نظرية المعلومات : فهي تقدم تقديرًا للمعلومات النسبية المفقودة عند استخدام نموذج معين لتمثيل العملية التي أنتجت البيانات. (عند القيام بذلك ، فإنه يتعامل مع المقايضة بين جودة ملاءمة النموذج وبساطة النموذج.)

نماذج أخرى للاستدلال

الحد الأدنى لطول الوصف

تم تطوير مبدأ الحد الأدنى لطول الوصف (MDL) من أفكار في نظرية المعلومات [48] ونظرية تعقيد كولموغوروف . [49] مبدأ MDL يختار النماذج الإحصائية التي تضغط البيانات إلى أقصى حد. يستمر الاستدلال دون افتراض "آليات توليد البيانات" غير الواقعية أو غير القابلة للتزوير أو نماذج الاحتمالات للبيانات ، كما يمكن القيام به في النهج التكراري أو البايزي.

ومع ذلك ، إذا كانت "آلية توليد البيانات" موجودة في الواقع ، فوفقًا لنظرية ترميز المصدر الخاصة بشانون ، فإنها توفر وصف MDL للبيانات ، في المتوسط ​​وبشكل مقارب. [50] في تقليل طول الوصف (أو التعقيد الوصفي) ، فإن تقدير MDL مشابه لتقدير الاحتمالية القصوى والحد الأقصى للتقدير اللاحق (باستخدام أقصى إنتروبيا مقدمات بايزي ). ومع ذلك ، يتجنب MDL افتراض أن نموذج الاحتمال الأساسي معروف ؛ يمكن أيضًا تطبيق مبدأ MDL دون افتراضات ، على سبيل المثال ، أن البيانات نشأت من أخذ عينات مستقلة. [50] [51]

تم تطبيق مبدأ MDL في نظرية تشفير الاتصال في نظرية المعلومات ، في الانحدار الخطي ، [51] وفي التنقيب عن البيانات . [49]

غالبًا ما يستخدم تقييم الإجراءات الاستنتاجية المستندة إلى MDL تقنيات أو معايير من نظرية التعقيد الحسابي . [52]

الاستدلال الإيماني

كان الاستدلال الإيماني منهجًا للاستدلال الإحصائي قائمًا على الاحتمال الإيماني ، والمعروف أيضًا باسم "التوزيع الائتماني". في العمل اللاحق ، تم تسمية هذا النهج بأنه غير محدد ، ومحدود للغاية في قابلية التطبيق ، وحتى أنه خاطئ. [53] [54] ولكن هذه الحجة هي نفسها التي توضح [55] أن ما يسمى بتوزيع الثقة ليس توزيعًا احتماليًا صالحًا ، وبما أن هذا لم يبطل تطبيق فترات الثقة ، فإنه لا يبطل بالضرورة استنتاجات مستمدة من الحجج الإيمانية. جرت محاولة لإعادة تفسير العمل المبكر لحجة فيشر الإيمانيةكحالة خاصة لنظرية الاستدلال باستخدام الاحتمالات العليا والدنيا . [56]

الاستدلال الهيكلي

تطوير أفكار فيشر وبيتمان من عام 1938 إلى عام 1939 ، [57] طور جورج إيه بارنارد "الاستدلال الهيكلي" أو "الاستدلال المحوري" ، [58] وهو نهج يستخدم الاحتمالات الثابتة على عائلات المجموعة . أعاد بارنارد صياغة الحجج الكامنة وراء الاستدلال الإيماني على فئة مقيدة من النماذج تكون الإجراءات "الائتمانية" بناءً عليها محددة جيدًا ومفيدة. طور Donald AS Fraser نظرية عامة للاستدلال الهيكلي [59] بناءً على نظرية المجموعة وطبقها على النماذج الخطية. [60]النظرية التي صاغها فريزر لها روابط وثيقة بنظرية القرار وإحصاءات بايز ويمكن أن توفر قواعد القرار التكراري المثلى إذا كانت موجودة. [61]

موضوعات الاستدلال

عادة ما يتم تضمين الموضوعات أدناه في مجال الاستدلال الإحصائي .

  1. الافتراضات الإحصائية
  2. نظرية القرار الإحصائي
  3. نظرية التقدير
  4. اختبار الفرضيات الإحصائية
  5. مراجعة الآراء في الإحصاء
  6. تصميم التجارب وتحليل التباين والانحدار
  7. أخذ عينات المسح
  8. تلخيص البيانات الإحصائية

الاستدلال التنبئي

الاستدلال التنبئي هو نهج للاستدلال الإحصائي يؤكد على التنبؤ بالملاحظات المستقبلية بناءً على الملاحظات السابقة.

في البداية ، استند الاستدلال التنبئي على معلمات يمكن ملاحظتها وكان الغرض الرئيسي من دراسة الاحتمالية ، [ بحاجة لمصدر ] لكنه لم يعد محبوبًا في القرن العشرين بسبب نهج حدودي جديد ابتكره برونو دي فينيتي . قام النهج بنمذجة الظواهر كنظام فيزيائي يتم ملاحظته مع الخطأ (على سبيل المثال ، الميكانيكا السماوية ). فكرة دي فينيتي عن القابلية للتبادل - أن الملاحظات المستقبلية يجب أن تتصرف مثل الملاحظات السابقة - لفتت انتباه العالم الناطق باللغة الإنجليزية بترجمة عام 1974 من الفرنسية لورقته البحثية عام 1937 ، [62] ومنذ ذلك الحين تم طرحها من قبل الإحصائيين مثلسيمور جيسر . [63]

انظر أيضا

ملاحظات

  1. ^ وفقًا لبيرس ، يعني القبول أن الاستفسار عن هذا السؤال يتوقف في الوقت الحالي. في العلم ، كل النظريات العلمية قابلة للمراجعة.

المراجع

الاقتباسات

  1. ^ أبتون ، جي ، كوك ، آي (2008) قاموس أكسفورد للإحصاء ، مطبعة جامعة أكسفورد. ردمك  978-0-19-954145-4 .
  2. ^ "استنتاج TensorFlow Lite" . يشير مصطلح الاستدلال إلى عملية تنفيذ نموذج TensorFlow Lite على الجهاز لعمل تنبؤات بناءً على بيانات الإدخال.
  3. ^ جونسون ، ريتشارد (12 مارس 2016). "الاستدلال الإحصائي" . موسوعة الرياضيات . سبرينغر: الجمعية الرياضية الأوروبية . تم الاسترجاع 26 أكتوبر 2022 .
  4. ^ كونيشي وكيتاجاوا (2008) ، ص. 75.
  5. ^ كوكس (2006) ، ص. 197.
  6. ^ "الاستدلال الإحصائي - موسوعة الرياضيات" . www.encyclopediaofmath.org . تم الاسترجاع 2019/01/23 .
  7. ^ أ ب كوكس (2006) الصفحة 2
  8. ^ إيفانز ، مايكل ؛ وآخرون. (2004). الاحتمالية والإحصاء: علم عدم اليقين . فريمان وشركاه. ص. 267. ISBN 9780716747420.
  9. ^ van der Vaart ، AW (1998) إحصائيات مقاربة مطبعة جامعة كامبريدج. ISBN 0-521-78450-6 (الصفحة 341) 
  10. ^ كروسكال 1988
  11. ^ فريدمان ، دا (2008) "تحليل البقاء: خطر وبائي؟". الإحصائي الأمريكي (2008) 62: 110-119. (أعيد طبعه في الفصل 11 (الصفحات 169-192) من Freedman (2010)).
  12. ^ بيرك ، ر. (2003) تحليل الانحدار: نقد بناء (التقنيات الكمية المتقدمة في العلوم الاجتماعية) (v. 11) منشورات سيج. ردمك 0-7619-2904-5 
  13. ^ أ ب بروير ، كين (2002). الاستدلال المشترك لأخذ عينات المسح: وزن أفيال باسو . هودر أرنولد. ص. 6. ISBN 978-0340692295.
  14. ^ a b Jörgen Hoffman-Jörgensen's الاحتمالية مع عرض نحو الإحصائيات ، المجلد الأول. صفحة 399 [ full citation needed ]
  15. ^ Le Cam (1986) [ الصفحة مطلوبة ]
  16. ^ Erik Torgerson (1991) مقارنة التجارب الإحصائية ، المجلد 36 من موسوعة الرياضيات. صحافة جامعة كامبرج. [ بحاجة لمصدر كامل ]
  17. ^ Liese ، Friedrich & Miescke ، Klaus-J. (2008). نظرية القرار الإحصائي: التقدير والاختبار والاختيار . سبرينغر. رقم ISBN 978-0-387-73193-3.
  18. ^ Kolmogorov (1963 ، ص 369): "إن مفهوم التردد ، القائم على فكرة الحد من التردد مع زيادة عدد المحاكمات إلى ما لا نهاية ، لا يساهم بأي شيء لإثبات إمكانية تطبيق نتائج نظرية الاحتمالات على مشاكل عملية حقيقية حيث علينا دائمًا التعامل مع عدد محدود من المحاكمات ".
  19. ^ "في الواقع ، حد من النظريات" تميل إلى اللانهاية 'منطقيًا خالية من المحتوى حول ما يحدث في أي وقت . كل ما يمكنهم فعله هو اقتراح بعض الأساليب التي يجب بعد ذلك التحقق من أدائها في الحالة قيد البحث. "- Le Cam (1986) (الصفحة xiv)
  20. ^ Pfanzagl (1994): "العيب الجوهري لنظرية التقارب: ما نتوقعه من نظرية التقارب هي النتائج التي تثبت تقريبًا .... ما يجب أن تقدمه النظرية المقاربة هو نظريات الحد." (الصفحة 9) "ما يهم للتطبيقات هو تقريبية ، وليس حدود ". (صفحة 188)
  21. ^ Pfanzagl (1994): "بأخذ نظرية الحد على أنها صحيحة تقريبًا لأحجام العينات الكبيرة ، نرتكب خطأ حجمه غير معروف. [...] يمكن الحصول على معلومات واقعية حول الأخطاء المتبقية عن طريق المحاكاة." (الصفحة التاسعة)
  22. ^ نيمان ، ج. (1934) "حول الجانبين المختلفين للطريقة التمثيلية: طريقة أخذ العينات الطبقية وطريقة الاختيار الهادف" ، مجلة الجمعية الإحصائية الملكية ، 97 (4) ، 557-625 JSTOR  2342192
  23. ^ a b Hinkelmann and Kempthorne (2008) [ الصفحة مطلوبة ]
  24. ^ إرشادات ASA للدورة الأولى في الإحصاء لغير الإحصائيين. (متاح على موقع ASA الإلكتروني)
  25. ^ ديفيد أ.فريدمان وآخرون إحصاءات .
  26. ^ مور وآخرون. (2015).
  27. ^ جيلمان أ وآخرون. (2013). تحليل البيانات البايزية ( تشابمان وهال ).
  28. ^ بيرس (1877-1878)
  29. ^ بيرس (1883)
  30. ^ فريدمان وبيزاني وبيرفس عام 1978 .
  31. ^ ديفيد أ.فريدمان النماذج الإحصائية .
  32. ^ راو ، سي آر (1997) الإحصاء والحقيقة: وضع فرصة للعمل ، العالم العلمي. ردمك 981-02-3111-3  
  33. ^ بيرس. فريدمان. مور وآخرون. (2015). [ بحاجة لمصدر ]
  34. ^ Box و GEP and Friends (2006) تحسين أي شيء تقريبًا: الأفكار والمقالات ، الطبعة المنقحة ، وايلي. ردمك 978-0-471-72755-2 
  35. ^ كوكس (2006) ، ص. 196.
  36. ^ إرشادات ASA للدورة الأولى في الإحصاء لغير الإحصائيين. (متاح على موقع ASA الإلكتروني)
    • ديفيد أ. فريدمان واسم مستعار الإحصاء .
    • مور وآخرون. (2015).
  37. ^ نيمان ، جيرزي. 1923 [1990]. "حول تطبيق نظرية الاحتمالية على التجارب الزراعية. مقال عن المبادئ. القسم 9." العلوم الإحصائية 5 (4): 465-472. عبر. دوروتا إم دابروسكا وتيرينس ب. سبيد.
  38. ^ Hinkelmann & Kempthorne (2008) [ الصفحة مطلوبة ]
  39. ^ أ ب دينوف ، إيفو ؛ Palanimalai ، Selvam ؛ خير ، أشويني ؛ كريستو ، نيكولاس (2018). "الاستدلال الإحصائي القائم على التوزيع العشوائي: بنية تحتية لإعادة التشكيل والمحاكاة" . تدريس الإحصاء . 40 (2): 64-73. دوى : 10.1111 / اختبار .12156 . PMC 6155997 . بميد 30270947 .   
  40. ^ Hinkelmann and Kempthorne (2008) الفصل السادس.
  41. ^ تانغ مينغ. تشاو جاو ؛ ستيفن جوتمان. كالينين ، الكسندر ؛ موخيرجي ، بهرامار ؛ غوان ، يوانفانغ ؛ دينوف ، إيفو (2019). "التقنيات القائمة على النموذج والخالية من النماذج للتنبؤ التشخيصي للتصلب الجانبي الضموري وتكتل المريض" . المعلوماتية العصبية . 17 (3): 407-421. دوى : 10.1007 / s12021-018-9406-9 . PMC 6527505 . بميد 30460455 .   
  42. ^ بوليتيس ، دي إن (2019). "الاستدلال الخالي من النماذج في الإحصاء: كيف ولماذا" . نشرة IMS . 48 .
  43. ^ بانديوبادياي وفورستر (2011). انظر مقدمة الكتاب (ص 3) و "القسم الثالث: أربعة نماذج للإحصاء".
  44. ^ نيمان ، ج. (1937). "الخطوط العريضة لنظرية التقدير الإحصائي على أساس النظرية الكلاسيكية للاحتمالية" . المعاملات الفلسفية للجمعية الملكية في لندن أ . 236 (767): 333-380. بيب كود : 1937 RSPTA.236..333N . دوى : 10.1098 / rsta.1937.0005 . JSTOR 91337 . 
  45. ^ مقدمة لـ Pfanzagl.
  46. ^ ليتل ، رودريك ج. (2006). "معايرة بايز: بايز / خارطة طريق متكررة". الإحصائي الأمريكي . 60 (3): 213-223. دوى : 10.1198 / 000313006X117837 . ISSN 0003-1305 . JSTOR 27643780 . S2CID 53505632 .   
  47. ^ لي ، سي يون (2021). "أخذ عينات جيبس ​​وتنسيق الاستدلال المتغير الصعود: مراجعة نظرية المجموعة". الاتصالات في الإحصاء - النظرية والطرق . 51 (6): 1549-1568. arXiv : 2008.01006 . دوى : 10.1080 / 03610926.2021.1921214 . S2CID 220935477 . 
  48. ^ صوفي (2000)
  49. ^ أ ب هانسن ويو (2001)
  50. ^ أ ب هانسن ويو (2001) ، الصفحة 747.
  51. ^ أ ب ريسانن (1989) ، الصفحة 84
  52. ^ جوزيف ف.تروب ، ج.و. (1988) [ الصفحة مطلوبة ]
  53. ^ نيمان (1956)
  54. ^ زابل (1992)
  55. ^ كوكس (2006) صفحة 66
  56. ^ هامبل 2003 .
  57. ^ دافيسون ، صفحة 12. [ بحاجة لمصدر كامل ]
  58. ^ بارنارد ، جي إيه (1995) "النماذج المحورية والحجة الائتمانية" ، المراجعة الإحصائية الدولية ، 63 (3) ، 309-323. جستور  1403482
  59. ^ فريزر ، داس (1968). هيكل الاستدلال . نيويورك: وايلي. رقم ISBN 0-471-27548-4. OCLC  440926 .
  60. ^ فريزر ، داس (1979). الاستدلال والنماذج الخطية . لندن: ماكجرو هيل. رقم ISBN 0-07-021910-9. OCLC  3559629 .
  61. ^ تارالدسن ، جونار ؛ ليندكفيست ، بو هنري (1 فبراير 2013). "النظرية الإيمانية والاستدلال الأمثل" . حوليات الإحصاء . 41 (1). arXiv : 1301.1717 . دوى : 10.1214 / 13-AOS1083 . ISSN 0090-5364 . S2CID 88520957 .  
  62. ^ دي فينيتي ، برونو (1937). "La Prévision: ses lois logiques ، ses sources selfives". Annales de l'Institut Henri Poincaré . 7 (1): 1–68. ISSN 0365-320X . ترجم في De Finetti ، برونو (1992). "البصيرة: قوانينها المنطقية ، مصادرها الذاتية". اختراقات في الإحصاء . سلسلة Springer في الإحصاء. ص 134 - 174. دوى : 10.1007 / 978-1-4612-0919-5_10 . رقم ISBN 978-0-387-94037-3.
  63. ^ جيسر ، سيمور (1993) الاستدلال التنبئي: مقدمة ، CRC Press. ردمك 0-412-03471-9 

المصادر

قراءات إضافية

روابط خارجية