المتوسط ​​الحسابي المرجح

من ويكيبيديا، الموسوعة الحرة
اذهب إلى الملاحة اذهب الى البحث

يشبه المتوسط ​​الحسابي الموزون الوسط الحسابي العادي ( النوع الأكثر شيوعًا للمتوسط ) ، باستثناء أنه بدلاً من مساهمة كل نقطة من نقاط البيانات بشكل متساوٍ في المتوسط ​​النهائي ، تساهم بعض نقاط البيانات أكثر من غيرها. يلعب مفهوم المتوسط ​​الموزون دورًا في الإحصاء الوصفي ويحدث أيضًا بشكل أكثر عمومية في العديد من مجالات الرياضيات الأخرى.

إذا كانت جميع الأوزان متساوية ، فإن المتوسط ​​المرجح يكون هو نفسه الوسط الحسابي . بينما تتصرف الوسائل الموزونة عمومًا بطريقة مشابهة للوسائل الحسابية ، إلا أنها تتمتع ببعض الخصائص غير البديهية ، كما تم التقاطها على سبيل المثال في مفارقة سيمبسون .

أمثلة

مثال أساسي

من خلال فصلين دراسيين - أحدهما به 20 طالبًا والآخر به 30 طالبًا - واختبار الدرجات في كل فصل على النحو التالي:

الصف الصباحي = {62، 67، 71، 74، 76، 77، 78، 79، 79، 80، 80، 81، 81، 82، 83، 84، 86، 89، 93، 98}

فئة بعد الظهر = {81، 82، 83، 84، 85، 86، 87، 87، 88، 88، 89، 89، 89، 90، 90، 90، 90، 91، 91، 91، 92، 92، 93، 93 ، 94 ، 95 ، 96 ، 97 ، 98 ، 99}

المتوسط ​​في الفصل الصباحي هو 80 ومتوسط ​​الفصل بعد الظهر 90. المتوسط ​​غير المرجح للوسيلتين هو 85. ولكن هذا لا يفسر الاختلاف في عدد الطلاب في كل فصل (20 مقابل 30) ؛ ومن ثم فإن القيمة 85 لا تعكس متوسط ​​درجة الطالب (بغض النظر عن الفصل). يمكن الحصول على متوسط ​​تقدير الطالب عن طريق حساب متوسط ​​جميع الدرجات ، بغض النظر عن الفصول الدراسية (أضف جميع الدرجات لأعلى واقسم على إجمالي عدد الطلاب):

أو يمكن تحقيق ذلك من خلال ترجيح وسائل الفصل بعدد الطلاب في كل فصل. الفئة الأكبر لها "وزن" أكبر:

وبالتالي ، فإن المتوسط ​​المرجح يجعل من الممكن العثور على متوسط ​​درجة الطالب دون معرفة درجة كل طالب. هناك حاجة إلى وسائل الفصل فقط وعدد الطلاب في كل فصل.

مثال على تركيبة محدبة

نظرًا لأن الأوزان النسبية هي فقط ذات الصلة ، يمكن التعبير عن أي متوسط ​​مرجح باستخدام معاملات مجموعها واحد. تسمى هذه المجموعة الخطية بمجموعة محدبة .

باستخدام المثال السابق ، نحصل على الأوزان التالية:



ثم قم بتطبيق الأوزان مثل هذا:

التعريف الرياضي

بشكل رسمي ، المتوسط ​​المرجح لمجموعة بيانات متعددة محدودة غير فارغةمع الأوزان المقابلة غير السلبية يكون

والتي تتوسع إلى:

لذلك ، تساهم عناصر البيانات ذات الوزن المرتفع في المتوسط ​​المرجح أكثر من العناصر ذات الوزن المنخفض. لا يمكن أن تكون الأوزان سالبة. قد يكون بعضها صفراً ، لكن ليس جميعها (حيث لا يُسمح بالقسمة على الصفر).

يتم تبسيط الصيغ عندما يتم تسوية الأوزان بحيث يتم تلخيصها، بمعنى آخر:

.

بالنسبة لمثل هذه الأوزان المعيارية ، يكون المتوسط ​​المرجح هو:

.

لاحظ أنه يمكن دائمًا تسوية الأوزان عن طريق إجراء التحويل التالي على الأوزان الأصلية:

.

ينتج عن استخدام الوزن المعياري نفس النتائج عند استخدام الأوزان الأصلية:

المتوسط العادي هي حالة خاصة من المتوسط ​​المرجح حيث جميع البيانات لها أوزان متساوية.

إذا كانت عناصر البيانات مستقلة ومتشابهة المتغيرات العشوائية مع التباين، الخطأ المعياري للمتوسط ​​المرجح ،، يمكن إظهاره عبر انتشار عدم اليقين ليكون:

الخصائص الإحصائية

توقع

العينة الموزونة تعني ،، هو نفسه متغير عشوائي. ترتبط قيمته المتوقعة وانحرافه المعياري بالقيم المتوقعة والانحرافات المعيارية للملاحظات ، على النحو التالي. للتبسيط ، نفترض الأوزان الطبيعية (جمع الأوزان إلى واحد).

إذا كانت الملاحظات لها قيم متوقعة

ثم متوسط ​​العينة الموزونة لديه توقع
على وجه الخصوص ، إذا كانت الوسائل متساوية ،، فإن توقع متوسط ​​العينة المرجح سيكون تلك القيمة ،

الفرق

حالة بسيطة

عند التعامل مع الأوزان على أنها ثوابت ، والحصول على عينة من الملاحظات n من المتغيرات العشوائية غير المترابطة ، وكلها بنفس التباين والتوقع ( كما هو الحال بالنسبة لمتغيرات iid العشوائية) ، فيمكن تقدير تباين المتوسط ​​المرجح على أنه الضرب للتباين حسب تأثير تصميم كيش (انظر الدليل ):

معو، و

ومع ذلك ، فإن هذا التقدير محدود نوعًا ما بسبب الافتراض القوي حول ملاحظات y . وقد أدى ذلك إلى تطوير مقدرات بديلة أكثر عمومية.

منظور أخذ عينات المسح

من منظور قائم على النموذج ، نحن مهتمون بتقدير تباين المتوسط ​​المرجح عند الاختلافليست iid متغيرات عشوائية. المنظور البديل لهذه المشكلة هو بعض تصميم أخذ العينات التعسفي للبيانات التي يتم فيها اختيار الوحدات ذات الاحتمالات غير المتكافئة (مع الاستبدال). [1] : 306 

في منهجية المسح ، يتم حساب المتوسط ​​السكاني ، لبعض كمية الفائدة y ، بأخذ تقدير لإجمالي y على جميع العناصر في المجتمع ( Y أو أحيانًا T ) وقسمته على حجم السكان - سواء كان معروفًا () أو تقديري (). في هذا السياق ، تعتبر كل قيمة y ثابتة ، ويأتي التباين من إجراء الاختيار. هذا على عكس النهج "القائمة على النموذج" التي يتم فيها وصف العشوائية في كثير من الأحيان في قيم y. ينتج عن إجراء أخذ عينات المسح سلسلة من قيم مؤشر برنولي () التي تحصل على 1 إذا كانت هناك بعض الملاحظات i في العينة و 0 إذا لم يتم اختيارها. يمكن أن يحدث هذا مع حجم عينة ثابت ، أو أخذ عينات بحجم عينة متنوع (على سبيل المثال: أخذ عينات بواسون ). يُشار إلى احتمال اختيار بعض العناصر ، عند إعطاء عينة ، على النحو التالي، واحتمال الانتقاء بسحب واحد هو(إذا كانت N كبيرة جدًا وكل منهاهي صغيرة جدا). بالنسبة للاشتقاق التالي ، سنفترض أن احتمال اختيار كل عنصر يتم تمثيله بالكامل بهذه الاحتمالات. [2] : 42 ، 43 ، 51  أي: اختيار بعض العناصر لن يؤثر على احتمال رسم عنصر آخر (هذا لا ينطبق على أشياء مثل تصميم أخذ العينات العنقودية ).

منذ كل عنصر () تم إصلاحه ، وتأتي العشوائية من تضمينه في العينة أم لا () ، غالبًا ما نتحدث عن ضرب الاثنين ، وهو متغير عشوائي. لتجنب الالتباس في القسم التالي ، دعنا نسمي هذا المصطلح:. مع التوقعات التالية:؛ والتباين:.

عندما يتم تضخيم كل عنصر من عناصر العينة بعكس احتمالية الاختيار الخاصة به ، يطلق عليه- قيم y الموسعة ، على سبيل المثال:. الكمية ذات الصلة هي- قيم y الموسعة :. [2] : 42 ، 43 ، 51 ، 52  على النحو الوارد أعلاه ، يمكننا إضافة علامة التجزئة إذا تم الضرب في دالة المؤشر. بمعنى آخر:

في هذا المنظور القائم على التصميم ، يتم الحصول على الأوزان ، المستخدمة في بسط المتوسط ​​المرجح ، من أخذ معكوس احتمال الاختيار (أي: عامل التضخم). بمعنى آخر:.

تباين المجموع المرجح ( pwr - مقدر للمجموع)

إذا كان حجم السكان N معروفًا ، فيمكننا تقدير متوسط ​​السكان باستخدام.

إذا كان تصميم أخذ العينات ينتج عنه حجم عينة ثابت n (مثل أخذ عينات pps ) ، فإن تباين هذا المقدّر هو:

دليل

يمكن تطوير الصيغة العامة على النحو التالي:

مجموع السكان يشار إليه على أنهويمكن تقديرها بواسطة مقدر هورفيتس - طومسون (غير المتحيز) ، والذي يسمى أيضًاالمقدر. يمكن تقدير هذا المقدر نفسه باستخدام pwr -estimator (على سبيل المثال:- موسعة مع مقدر الاستبدال ، أو مقدر "الاحتمال مع الاستبدال"). مع الترميز أعلاه ، هو:. [2] : 51 

يتم الحصول على التباين المقدر لـ pwr -estimator بواسطة: [2] : 52 

أين.

تم أخذ الصيغة أعلاه من Sarndal et. آل. (1992) (تم تقديمه أيضًا في Cochran 1977) ، لكن تمت كتابته بشكل مختلف. [2] : 52  [1] : 307 (11.35)  الجانب الأيسر هو كيفية كتابة التباين والجانب الأيمن هو كيف طورنا النسخة الموزونة:

ووصلنا إلى الصيغة من الأعلى.

مصطلح بديل ، عندما يكون للعينة حجم عينة عشوائي (كما هو الحال في أخذ عينات بواسون ) ، يتم تقديمه في Sarndal et. آل. (1992) كـ: [2] : 182 

مع. ايضا،أينهو احتمال اختيار كل من i و j. [2] : 36  و، و i = j:. [2] : 43 

إذا كان احتمال الاختيار غير مرتبط (على سبيل المثال:) ، وعند افتراض أن احتمال كل عنصر صغير جدًا ، فعندئذٍ:

دليل

نحن نفترض أنوذلك

تباين المتوسط ​​الموزون ( π - مقدر لمتوسط ​​النسبة)

تناول القسم السابق تقدير متوسط ​​السكان كنسبة من إجمالي السكان المقدر () بحجم سكان معروف () ، وتم تقدير التباين في هذا السياق. حالة شائعة أخرى هي أن حجم السكان نفسه () غير معروف ويتم تقديره باستخدام العينة (أي:). تقديريمكن وصفها بأنها مجموع الأوزان. اذن متىنحن نحصل. عند استخدام تدوين من الأقسام السابقة ، فإن النسبة التي نهتم بها هي مجموعق و 1 ثانية. بمعنى آخر:. يمكننا تقديره باستخدام العينة الخاصة بنا مع:. نظرًا لأننا انتقلنا من استخدام N إلى استخدام n ، فإننا نعلم بالفعل أن جميع متغيرات المؤشر تحصل على 1 ، لذلك يمكننا ببساطة كتابة:. سيكون هذا تقديرًا لقيم محددة لـ y و w ، لكن الخصائص الإحصائية تأتي عند تضمين متغير المؤشر. [2] : 162 ، 163 ، 176 

هذا يسمى مقدر النسبة وهو غير متحيز تقريبًا لـ R. [2] : 182 

في هذه الحالة ، يعتمد متغير النسبة على متغيرات المتغيرات العشوائية في كل من البسط والمقام - بالإضافة إلى ارتباطها. نظرًا لعدم وجود نموذج تحليلي مغلق لحساب هذا التباين ، يتم استخدام طرق مختلفة لتقدير تقريبي. في المقام الأول سلسلة تايلور الخطية من الدرجة الأولى ، والتقارب ، و bootstrap / jackknife. [2] : 172  يمكن أن تؤدي طريقة تايلور الخطية إلى التقليل من تقدير التباين لأحجام العينات الصغيرة بشكل عام ، لكن هذا يعتمد على مدى تعقيد الإحصاء. بالنسبة للمتوسط ​​المرجح ، من المفترض أن يكون التباين التقريبي دقيقًا نسبيًا حتى بالنسبة لأحجام العينات المتوسطة. [2] : 176 عندما يكون لأخذ العينات حجم عينة عشوائي (كما في أخذ عينات بواسون ) ، يكون كالتالي: [2] : 182 

.

نلاحظ أنه إذا، ثم إما باستخدامأوسيعطي نفس المقدّر ، منذ الضربحسب بعض العوامل من شأنه أن يؤدي إلى نفس المقدّر. وهذا يعني أيضًا أنه إذا قمنا بقياس مجموع الأوزان ليكون مساويًا لحجم السكان المعروف من قبل N ، فإن حساب التباين سيبدو كما هو. عندما تتساوى جميع الأوزان مع بعضها البعض ، يتم تقليل هذه الصيغة إلى مقدر التباين غير المتحيز القياسي.

دليل

ينص تيلور الخطي على أنه بالنسبة لمقدر النسبة العامة من مجموعين () ، يمكن توسيعها حول القيمة الحقيقية R ، وتعطي: [2] : 178 

ويمكن تقريب التباين من خلال: [2] : 178 ، 179 

.

المصطلحهو التغاير المقدر بين المجموع المقدر لـ Y والمبلغ المقدر لـ Z. نظرًا لأن هذا هو التغاير بين مجموعتي متغيرات عشوائية ، فإنه سيتضمن العديد من مجموعات التغاير التي ستعتمد على متغيرات المؤشر. إذا كان احتمال الاختيار غير مرتبط (على سبيل المثال:) ، سيظل هذا المصطلح يتضمن مجموع n التغايرات لكل عنصر i بينو. يساعد هذا في توضيح أن هذه الصيغة تتضمن تأثير الارتباط بين y و z على تباين مقدرات النسبة.

عند تحديدما سبق يصبح: [2] : 182 

إذا كان احتمال الاختيار غير مرتبط (على سبيل المثال:) ، وعند افتراض أن احتمال كل عنصر صغير جدًا (على سبيل المثال:) ، ثم اختصر ما سبق إلى ما يلي:

تم تقديم إعادة إنشاء مماثلة للإثبات (حتى بعض الأخطاء في النهاية) بواسطة Thomas Lumley في التحقق المتقاطع. [3]

لدينا (على الأقل) نسختان من التباين للمتوسط ​​الموزون: أحدهما معروف والآخر بتقدير غير معروف لحجم المجتمع. لا يوجد نهج أفضل بشكل موحد ، لكن الأدبيات تقدم عدة حجج لتفضيل استخدام إصدار تقدير السكان (حتى عندما يكون حجم المجتمع معروفًا). [2] : 188  على سبيل المثال: إذا كانت جميع قيم y ثابتة ، فإن المقدّر ذي الحجم السكاني غير المعروف سيعطي النتيجة الصحيحة ، في حين أن القيم ذات الحجم السكاني المعروف سيكون لها بعض التباين. أيضًا ، عندما يكون حجم العينة نفسه عشوائيًا (على سبيل المثال: في أخذ عينات بواسون) ، يعتبر الإصدار ذو الوسط السكاني غير المعروف أكثر استقرارًا. أخيرًا ، إذا كانت نسبة أخذ العينات مرتبطة سلبًا بالقيم (أي: فرصة أصغر لتجربة ملاحظة كبيرة) ، فإن نسخة حجم المجتمع غير المعروف تعوض ذلك قليلاً.


التحقق من التمهيد

وقد تم عرضها بواسطة Gatz et. آل. (1995) ، أنه بالمقارنة مع طرق التمهيد ، فإن ما يلي (تقدير التباين لمتوسط ​​النسبة باستخدام خطية سلسلة تايلور ) هو تقدير معقول لمربع الخطأ المعياري للمتوسط ​​(عند استخدامه في سياق قياس المكونات الكيميائية) : [4] : 1186 

أين. مزيد من التبسيط يؤدي إلى

جاتز وآخرون آل. أذكر أن الصيغة المذكورة أعلاه قد تم نشرها بواسطة Endlich et. آل. (1988) عند معالجة المتوسط ​​المرجح على أنه توليفة من مقدر إجمالي مرجح مقسومًا على مقدر حجم السكان .. [5] ، بناءً على الصيغة المنشورة بواسطة Cochran (1977) ، كتقريب لمتوسط ​​النسبة. ومع ذلك ، Endlich et. آل. لم ينشروا هذا الاشتقاق في ورقتهم (على الرغم من أنهم ذكروا أنهم استخدموه) ، ويتضمن كتاب كوكران صياغة مختلفة قليلاً. [1] : 155  ومع ذلك ، فهي تقريبًا مطابقة للصيغ الموصوفة في الأقسام السابقة.

المقدرات القائمة على النسخ المتماثل

نظرًا لعدم وجود شكل تحليلي مغلق لتباين المتوسط ​​المرجح ، تم اقتراحه في الأدبيات للاعتماد على طرق النسخ مثل Jackknife و Bootstrapping . [1] : 321 

ملاحظات أخرى

للملاحظات غير المترابطة مع الفروق، تباين متوسط ​​العينة الموزونة هو [ بحاجة لمصدر ]

جذرها التربيعييمكن أن يسمى الخطأ المعياري للمتوسط ​​المرجح (الحالة العامة) . [ بحاجة لمصدر ]

وبالتالي ، إذا كانت جميع الملاحظات لها تباين متساوٍ ،، فإن متوسط ​​العينة الموزونة سيكون له تباين

أين. يصل التباين إلى قيمته القصوى ،، عندما تكون جميع الأوزان باستثناء واحد تساوي صفرًا. يتم العثور على قيمته الدنيا عندما تكون جميع الأوزان متساوية (أي متوسط ​​غير مرجح) ، وفي هذه الحالة يكون لدينا، أي أنه يتدهور إلى الخطأ المعياري للمتوسط التربيعي.

لاحظ أنه نظرًا لأنه يمكن للمرء دائمًا تحويل الأوزان غير الطبيعية إلى أوزان قياسية ، يمكن تكييف جميع المعادلات في هذا القسم للأوزان غير المعيارية عن طريق استبدال الكل.

حالات استخدام المتوسط ​​المرجح

أوزان التباين

للمتوسط ​​المرجح لقائمة البيانات لكل عنصريحتمل أن يأتي من توزيع احتمالي مختلف مع تباين معروف ، لكل منها نفس المتوسط ​​، يتم إعطاء خيار واحد ممكن للأوزان من خلال متبادل التباين:

المتوسط ​​المرجح في هذه الحالة هو:

والخطأ المعياري للمتوسط ​​المرجح (بأوزان التباين) هو:

لاحظ أن هذا يقلل إلىعندما تكون جميع. إنها حالة خاصة من الصيغة العامة في القسم السابق ،

يمكن دمج المعادلات أعلاه للحصول على:

تكمن أهمية هذا الاختيار في أن هذا المتوسط ​​المرجح هو الحد الأقصى لمقدر الاحتمالية لمتوسط التوزيعات الاحتمالية بافتراض أنها مستقلة ويتم توزيعها عادةً بنفس المتوسط.

تصحيح التشتت المفرط أو الناقص

تُستخدم الوسائل الموزونة عادةً للعثور على المتوسط ​​المرجح للبيانات التاريخية ، بدلاً من البيانات التي تم إنشاؤها نظريًا. في هذه الحالة ، سيكون هناك خطأ ما في تباين كل نقطة بيانات. عادة قد يتم التقليل من الأخطاء التجريبية بسبب عدم مراعاة المجرب لجميع مصادر الخطأ في حساب التباين لكل نقطة بيانات. في هذه الحالة ، يجب تصحيح التباين في المتوسط ​​المرجح لمراعاة حقيقة ذلككبير جدا. التصحيح الذي يجب القيام به هو

أينهو مربع كاي المخفض :

الجذر التربيعييمكن أن يسمى الخطأ المعياري للمتوسط ​​المرجح (أوزان التباين ، المقياس المصحح) .

عندما تكون جميع تباينات البيانات متساوية ،، تلغي في متوسط ​​التباين الموزون ،، مما يقلل مرة أخرى إلى الخطأ القياسي للمتوسط (التربيعي) ،، تمت صياغته من حيث نموذج الانحراف المعياري (التربيعي) ،

المفاهيم ذات الصلة

تباين العينة الموزون

عادةً عندما يتم حساب المتوسط ​​، من المهم معرفة التباين والانحراف المعياري حول هذا المتوسط. عندما يكون متوسط ​​مرجحعند استخدامه ، يختلف تباين العينة الموزونة عن تباين العينة غير الموزونة.

تباين العينة الموزونة المتحيزة يتم تعريفه بشكل مشابه لتباين العينة المتحيزة العادي:

أينللأوزان الطبيعية. إذا كانت الأوزان عبارة عن أوزان ترددية (وبالتالي فهي متغيرات عشوائية) ، فيمكن إثبات ذلكهو أقصى تقدير للاحتمالية لـبالنسبة لملاحظات iid Gaussian.

بالنسبة للعينات الصغيرة ، من المعتاد استخدام مقدر غير متحيز لتباين المجتمع. في العينات العادية غير الموزونة ، يتم تغيير N في المقام (المقابل لحجم العينة) إلى N  - 1 (انظر تصحيح Bessel ). في الإعداد الموزون ، يوجد في الواقع مقدران مختلفان غير متحيزين ، أحدهما لحالة أوزان التردد والآخر لحالة أوزان الموثوقية .

أوزان التردد

إذا كانت الأوزان عبارة عن أوزان تكرارية (حيث يساوي الوزن عدد مرات الحدوث) ، فإن المقدر غير المتحيز هو:

هذا يطبق بشكل فعال تصحيح Bessel لأوزان التردد.

على سبيل المثال ، إذا كانت القيممأخوذة من نفس التوزيع ، ثم يمكننا التعامل مع هذه المجموعة كعينة غير مرجحة ، أو يمكننا التعامل معها كعينة مرجحةمع الأوزان المقابلة، ونحصل على نفس النتيجة في كلتا الحالتين.

إذا كانت أوزان التردديتم تطبيعها إلى 1 ، ثم يصبح التعبير الصحيح بعد تصحيح Bessel

حيث العدد الإجمالي للعينات(ليس). على أي حال ، فإن المعلومات الخاصة بالعدد الإجمالي للعينات ضرورية للحصول على تصحيح غير متحيز ، حتى لوله معنى مختلف بخلاف وزن التردد.

لاحظ أن المقدر يمكن أن يكون غير متحيز فقط إذا لم تكن الأوزان موحدة أو موحدة ، فهذه العمليات تغير متوسط ​​البيانات وتباينها وبالتالي تؤدي إلى فقدان المعدل الأساسي (عدد السكان ، وهو مطلب لتصحيح Bessel).

أوزان الموثوقية

إذا كانت الأوزان بدلاً من ذلك غير عشوائية ( أوزان الموثوقية [ التعريف مطلوب ] ) ، فيمكننا تحديد عامل تصحيح للحصول على مقدر غير متحيز. بافتراض أخذ عينات من كل متغير عشوائي من نفس التوزيع بمتوسطوالتباين الفعلي، مع الأخذ في الاعتبار التوقعات لدينا ،

أينو. لذلك ، فإن التحيز في مقدرنا هو، مشابه لالتحيز في المقدّر غير المرجح (لاحظ أيضًا ذلكهو حجم العينة الفعال ). هذا يعني أنه من أجل عدم التحيز في مقدرنا ، نحتاج إلى القسمة مسبقًا على، التأكد من أن القيمة المتوقعة للتباين المقدر تساوي التباين الفعلي لتوزيع العينات.

التقدير النهائي غير المتحيز لتباين العينة هو:

[6]

أين.

تختلف درجات حرية تباين العينة الموزون وغير المتحيز وفقًا لذلك من N  - 1 نزولاً إلى 0.

الانحراف المعياري هو ببساطة الجذر التربيعي للتباين أعلاه.

كملاحظة جانبية ، تم وصف طرق أخرى لحساب تباين العينة الموزونة. [7]

التباين المشترك للعينة الموزونة

في عينة مرجحة ، كل متجه صف(كل مجموعة من الملاحظات الفردية على كل من المتغيرات العشوائية K ) يتم تعيين وزن لها.

ثم المتجه المتوسط ​​المرجحاعطي من قبل

ويتم الحصول على مصفوفة التغاير الموزون بالصيغة التالية: [8]

على غرار تباين العينة الموزونة ، هناك نوعان مختلفان من المقدرين غير المتحيزين اعتمادًا على نوع الأوزان.

أوزان التردد

إذا كانت الأوزان عبارة عن أوزان تكرارية ، فإن التقدير الموزون غير المتحيز لمصفوفة التغاير، مع تصحيح بيسل ، من خلال: [8]

لاحظ أن هذا المقدر يمكن أن يكون غير متحيز فقط إذا لم تكن الأوزان موحدة أو موحدة ، فهذه العمليات تغير متوسط ​​البيانات وتباينها وبالتالي تؤدي إلى فقدان المعدل الأساسي (عدد السكان ، وهو مطلب لتصحيح Bessel).

أوزان الموثوقية

في حالة أوزان الموثوقية ، تتم تسوية الأوزان :

(إذا لم تكن كذلك ، قسّم الأوزان على مجموعها لتسويتها قبل الحساب:

ثم المتجه المتوسط ​​المرجحيمكن تبسيطها إلى

والتقدير الموزون غير المتحيز لمصفوفة التغايرهو: [9]

المنطق هنا هو نفسه كما في القسم السابق.

بما أننا نفترض أن الأوزان طبيعية ، إذنوهذا يقلل إلى:

إذا كانت جميع الأوزان متساوية ، على سبيل المثال، ثم يتم تقليل المتوسط ​​المرجح والتغاير إلى متوسط ​​العينة غير الموزون والتغاير أعلاه.

تقديرات متجهية القيمة

ما سبق يعمم بسهولة في حالة أخذ متوسط ​​التقديرات ذات القيمة المتجهية. على سبيل المثال ، قد تكون تقديرات الموقع على مستوى أقل يقينًا في اتجاه واحد من اتجاه آخر. كما هو الحال في الحالة العددية ، يمكن أن يوفر المتوسط ​​المرجح لتقديرات متعددة أقصى تقدير احتمالية. نحن ببساطة نستبدل التباينبواسطة مصفوفة التغاير والمعكوس الحسابي من خلال معكوس المصفوفة (كلاهما يُشار إليه بنفس الطريقة ، عبر الأحرف الفوقية) ؛ ثم تقرأ مصفوفة الوزن: [10]

المتوسط ​​المرجح في هذه الحالة هو:

(حيث لا يكون ترتيب منتج متجه المصفوفة تبادليًا ) ، من حيث التباين المشترك للمتوسط ​​المرجح:

على سبيل المثال ، ضع في الاعتبار المتوسط ​​المرجح للنقطة [1 0] ذات التباين العالي في المكون الثاني و [0 1] مع التباين العالي في المكون الأول. ثم

ثم المتوسط ​​المرجح هو:

وهو أمر منطقي: التقدير [1 0] "متوافق" في المكون الثاني والتقدير [0 1] متوافق في المكون الأول ، وبالتالي فإن المتوسط ​​المرجح هو تقريبًا [1 1].

المحاسبة عن الارتباطات

في الحالة العامة ، افترض ذلكوهي مصفوفة التغاير المتعلقة بالكمياتوهي الوسيلة الشائعة التي يجب تقديرها ، وهي مصفوفة تصميم تساوي متجهًا منها (من الطول). تنص نظرية Gauss-Markov على أن تقدير المتوسط ​​الذي يحتوي على حد أدنى من التباين يتم تقديمه من خلال:

و

أين:

انخفاض قوة التفاعلات

ضع في اعتبارك السلسلة الزمنية لمتغير مستقلومتغير تابع، معأخذ عينات الملاحظات في أوقات منفصلة. في العديد من المواقف الشائعة ، تكون قيمةفي الوقتلا يعتمد فقط علىولكن أيضًا على قيمها السابقة. بشكل عام ، تقل قوة هذا الاعتماد مع زيادة فصل الملاحظات مع مرور الوقت. لنمذجة هذا الموقف ، يمكن استبدال المتغير المستقل بمتوسطه المنزلقلحجم النافذة.

الأوزان المتناقصة بشكل كبير

في السيناريو الموضح في القسم السابق ، غالبًا ما يتبع الانخفاض في قوة التفاعل قانونًا أسيًا سلبيًا. إذا تم أخذ عينات الملاحظات في أوقات متساوية البعد ، فإن الانخفاض الأسي يعادل الانخفاض بمقدار كسر ثابتفي كل خطوة زمنية. جلسةيمكننا تحديدأوزان طبيعية

أينهو مجموع الأوزان غير الطبيعية. في هذه الحالةهو ببساطة

يقتربلقيم كبيرة من.

ثابت التخميديجب أن يتوافق مع الانخفاض الفعلي في قوة التفاعل. إذا تعذر تحديد ذلك من الاعتبارات النظرية ، فإن الخصائص التالية للأوزان المتناقصة بشكل كبير مفيدة في اتخاذ خيار مناسب: في الخطوة، الوزن يساوي تقريبا، منطقة الذيل القيمة، منطقة الرأس. منطقة الذيل في الخطوةيكون. حيث في المقام الأول الأقربالملاحظات مهمة ويمكن تجاهل تأثير الملاحظات المتبقية بأمان ، ثم اختربحيث تكون منطقة الذيل صغيرة بدرجة كافية.

المتوسطات المرجحة للوظائف

يمكن توسيع مفهوم المتوسط ​​المرجح ليشمل الوظائف. [11] تلعب المتوسطات المرجحة للوظائف دورًا مهمًا في أنظمة التفاضل الموزون وحساب التفاضل والتكامل. [12]

انظر أيضا

المراجع

  1. ^ أ ب ج د كوكران ، دبليو جي (1977). تقنيات أخذ العينات (الطبعة الثالثة). ناشفيل ، تينيسي: جون وايلي وأولاده. ردمك  978-0-471-16240-7
  2. ^ a b c d e f g h i j k l m n o p q Carl-Erik Sarndal ، Bengt Swensson ، Jan Wretman (1992). أخذ عينات المسح بمساعدة النموذج . رقم ISBN 9780387975283.{{cite book}}: صيانة CS1: يستخدم معلمة المؤلفين ( رابط )
  3. ^ توماس لوملي ( https://stats.stackexchange.com/users/249135/thomas-lumley ) ، كيفية تقدير التباين (التقريبي) للمتوسط ​​المرجح ؟، URL (الإصدار: 2021-06-08): https: //stats.stackexchange.com/q/525770
  4. ^ جاتز ، دونالد ف. سميث ، لوثر (يونيو 1995). "الخطأ المعياري لمتوسط ​​مرجح للتركيز - I. Bootstrapping مقابل طرق أخرى". بيئة الغلاف الجوي . 29 (11): 1185-1193. بيب كود : 1995 AtmEn..29.1185G . دوى : 10.1016 / 1352-2310 (94) 00210-C .- رابط pdf
  5. ^ إندليش ، آر إم ، وآخرون. "التحليل الإحصائي لقياسات كيمياء هطول الأمطار في شرق الولايات المتحدة. الجزء الأول: الأنماط والارتباطات الموسمية والإقليمية." مجلة الأرصاد الجوية التطبيقية (1988-2005) (1988): 1322-1333. (بي دي إف)
  6. ^ "مكتبة جنو العلمية - دليل مرجعي: عينات مرجحة" . Gnu.org . تم الاسترجاع 22 ديسمبر 2017 .
  7. ^ "خطأ معياري مرجح وتأثيره على اختبار الأهمية (WinCross مقابل Quantum & SPSS) ، دكتور ألبرت مادانسكي" (PDF) . أناليتيكال جروب . تم الاسترجاع 22 ديسمبر 2017 .
  8. ^ أ ب برايس ، جورج ر. (أبريل 1972). "تمديد التغاير في رياضيات الاختيار" (PDF) . حوليات علم الوراثة البشرية . 35 (4): 485-490. دوى : 10.1111 / j.1469-1809.1957.tb01874.x . بميد 5073694 . S2CID 37828617 .   
  9. ^ مارك جالاسي ، وجيم ديفيز ، وجيمس تيلر ، وبريان جوف ، وجيرارد جونغمان ، ومايكل بوث ، وفابريس روسي. مكتبة جنو العلمية - دليل مرجعي ، الإصدار 1.15 ، 2011. ثانية. 21.7 العينات المرجحة
  10. ^ جيمس ، فريدريك (2006). الطرق الإحصائية في الفيزياء التجريبية (الطبعة الثانية). سنغافورة: العالم العلمي. ص. 324. ISBN 981-270-527-9.
  11. ^ جي إتش هاردي وجيه إي ليتلوود وجي بوليا. عدم المساواة (الطبعة الثانية) ، مطبعة جامعة كامبريدج ، ISBN 978-0-521-35880-4 ، 1988. 
  12. ^ جين غروسمان ومايكل غروسمان وروبرت كاتز. النظم الأولى في حساب التفاضل والتكامل الموزون ، ISBN 0-9771170-1-4 ، 1980. 

قراءات إضافية

  • بيفينجتون ، فيليب ر (1969). تقليل البيانات وتحليل الخطأ للعلوم الفيزيائية . نيويورك ، نيويورك: ماكجرو هيل. OCLC  300283069 .
  • Strutz ، T. (2010). ملاءمة البيانات وعدم اليقين (مقدمة عملية للمربعات الصغرى المرجحة وما بعدها) . Vieweg + Teubner. رقم ISBN 978-3-8348-1022-9.

روابط خارجية