المتغير القاطع

في الإحصاء ، المتغير الفئوي (ويسمى أيضًا المتغير النوعي ) هو متغير يمكن أن يأخذ واحدة من عدد محدود، وعادة ما يكون ثابتًا، من القيم المحتملة، مع تعيين كل فرد أو وحدة ملاحظة أخرى لمجموعة معينة أو فئة اسمية على أساس بعض الممتلكات النوعية . [1] في علوم الكمبيوتر وبعض فروع الرياضيات، يشار إلى المتغيرات الفئوية بالتعدادات أو الأنواع المعدودة . بشكل عام (ولكن ليس في هذه المقالة)، تتم الإشارة إلى كل من القيم المحتملة للمتغير الفئوي على أنها مستوى . يسمى التوزيع الاحتمالي المرتبط بمتغير فئوي عشوائي بالتوزيع الفئوي .

البيانات الفئوية هي نوع البيانات الإحصائية التي تتكون من متغيرات فئوية أو من البيانات التي تم تحويلها إلى هذا النموذج، على سبيل المثال كبيانات مجمعة . وبشكل أكثر تحديدًا، قد يتم استخلاص البيانات الفئوية من الملاحظات التي يتم إجراؤها على البيانات النوعية التي يتم تلخيصها كأعداد أو جداول متقاطعة ، أو من ملاحظات البيانات الكمية المجمعة ضمن فترات زمنية معينة. في كثير من الأحيان، يتم تلخيص البيانات الفئوية البحتة في شكل جدول طوارئ . ومع ذلك، خاصة عند النظر في تحليل البيانات، فمن الشائع استخدام مصطلح "البيانات الفئوية" لتطبيقه على مجموعات البيانات التي، على الرغم من أنها تحتوي على بعض المتغيرات الفئوية، قد تحتوي أيضًا على متغيرات غير فئوية.

يُطلق على المتغير القاطع الذي يمكن أن يأخذ قيمتين بالضبط اسم المتغير الثنائي أو المتغير الثنائي ؛ حالة خاصة مهمة هي متغير برنولي . تسمى المتغيرات الفئوية التي تحتوي على أكثر من قيمتين محتملتين بالمتغيرات المتعددة . غالبًا ما يُفترض أن المتغيرات الفئوية متعددة المتغيرات ما لم يُنص على خلاف ذلك. يتعامل التمييز مع البيانات المستمرة كما لو كانت قاطعة. يتعامل التقسيم الثنائي مع البيانات المستمرة أو المتغيرات المتعددة كما لو كانت متغيرات ثنائية. يعالج تحليل الانحدار في كثير من الأحيان عضوية الفئة بواحد أو أكثر من المتغيرات الوهمية الكمية .

أمثلة على المتغيرات الفئوية

أمثلة على القيم التي يمكن تمثيلها في متغير فئوي:

  • رمي حجر نرد ذو ستة جوانب: النتائج المحتملة هي 1،2،3،4،5، أو 6.
  • المعلومات الديموغرافية للسكان: الجنس، وحالة المرض.
  • فصيلة دم الشخص : A، B، AB أو O.
  • الحزب السياسي الذي قد يصوت له الناخب، ه. ز. حزب الخضر ، الديمقراطي المسيحي ، الديمقراطي الاجتماعي ، الخ.
  • نوع الصخر: ناري أو رسوبي أو متحول .
  • هوية كلمة معينة (على سبيل المثال، في نموذج اللغة ): أحد الخيارات الممكنة V ، لمفردات بالحجم V .

الرموز

لسهولة المعالجة الإحصائية، قد يتم تعيين مؤشرات رقمية للمتغيرات الفئوية، على سبيل المثال، من 1 إلى K للمتغير الفئوي K -way (أي متغير يمكنه التعبير بالضبط عن قيم K المحتملة). بشكل عام، ومع ذلك، فإن الأرقام عشوائية، وليس لها أي أهمية تتجاوز مجرد توفير تسمية مناسبة لقيمة معينة. بمعنى آخر، القيم الموجودة في المتغير الفئوي موجودة على مقياس اسمي : يمثل كل منها مفهومًا منفصلاً منطقيًا، ولا يمكن بالضرورة ترتيبها بشكل هادف ، ولا يمكن التلاعب بها بطريقة أخرى كما يمكن أن تكون الأرقام. بدلاً من ذلك، العمليات الصالحة هي التكافؤ ، وعضوية المجموعة ، والعمليات الأخرى المرتبطة بالمجموعة.

ونتيجة لذلك، فإن الاتجاه المركزي لمجموعة من المتغيرات الفئوية يعطى من خلال نمطها ؛ لا يمكن تعريف المتوسط ​​ولا الوسيط . على سبيل المثال، بالنظر إلى مجموعة من الأشخاص، يمكننا النظر في مجموعة المتغيرات الفئوية المقابلة لأسمائهم الأخيرة. يمكننا النظر في عمليات مثل التكافؤ (ما إذا كان هناك شخصان لهما نفس الاسم الأخير)، أو تعيين العضوية (ما إذا كان لدى الشخص اسم في قائمة معينة)، أو العد (عدد الأشخاص الذين لديهم اسم عائلة معين)، أو العثور على الوضع ( الاسم الذي يحدث في أغلب الأحيان). ومع ذلك، لا يمكننا حساب "مجموع" سميث + جونسون بشكل هادف، أو التساؤل عما إذا كان سميث "أقل من" أو "أكبر من" جونسون. ونتيجة لذلك، لا يمكننا أن نسأل بشكل هادف ما هو "الاسم المتوسط" (المتوسط) أو "الاسم الأوسط" (الوسيط) في مجموعة من الأسماء.

وهذا يتجاهل مفهوم الترتيب الأبجدي ، وهي خاصية ليست متأصلة في الأسماء نفسها، ولكن في الطريقة التي نبني بها التسميات. على سبيل المثال، إذا كتبنا الأسماء باللغة السيريلية وأخذنا في الاعتبار ترتيب الحروف السيريلية، فقد نحصل على نتيجة مختلفة لتقييم "Smith < Johnson" عما لو كنا نكتب الأسماء بالأبجدية اللاتينية القياسية ؛ وإذا كتبنا الأسماء بالأحرف الصينية ، فلن نتمكن من تقييم "Smith < Johnson" على الإطلاق، لأنه لا يوجد ترتيب ثابت محدد لمثل هذه الأحرف. ومع ذلك، إذا اعتبرنا الأسماء مكتوبة، على سبيل المثال، بالأبجدية اللاتينية، وقمنا بتحديد ترتيب يتوافق مع الترتيب الأبجدي القياسي، فقد قمنا بتحويلها بشكل فعال إلى متغيرات ترتيبية محددة على مقياس ترتيبي .

عدد القيم الممكنة

عادةً ما يتم وصف المتغيرات العشوائية الفئوية إحصائيًا من خلال التوزيع الفئوي ، والذي يسمح بالتعبير عن المتغير الفئوي التعسفي لـ K باحتمالات منفصلة محددة لكل من النتائج المحتملة لـ K. غالبًا ما يتم تحليل هذه المتغيرات الفئوية متعددة الفئات باستخدام توزيع متعدد الحدود ، والذي يحسب تكرار كل مجموعة محتملة من أعداد تكرارات الفئات المختلفة. يتم إجراء تحليل الانحدار على النتائج الفئوية من خلال الانحدار اللوجستي متعدد الحدود أو الاحتمال متعدد الحدود أو نوع ذي صلة من نموذج الاختيار المنفصل .

تُعرف المتغيرات الفئوية التي لها نتيجتين محتملتين فقط (على سبيل المثال، "نعم" مقابل "لا" أو "النجاح" مقابل "الفشل") بالمتغيرات الثنائية (أو متغيرات برنولي ). نظرًا لأهميتها، غالبًا ما تُعتبر هذه المتغيرات فئة منفصلة، ​​مع توزيع منفصل ( توزيع برنولي ) ونماذج انحدار منفصلة ( الانحدار اللوجستي ، والانحدار الاحتمالي ، وما إلى ذلك). ونتيجة لذلك، غالبًا ما يتم حجز مصطلح "المتغير الفئوي" للحالات التي تحتوي على 3 نتائج أو أكثر، ويطلق عليه أحيانًا متغير متعدد الاتجاهات في مقابل المتغير الثنائي.

من الممكن أيضًا مراعاة المتغيرات الفئوية حيث لا يتم تحديد عدد الفئات مسبقًا. على سبيل المثال، بالنسبة للمتغير الفئوي الذي يصف كلمة معينة، قد لا نعرف مسبقًا حجم المفردات، ونود أن نسمح بإمكانية مواجهة كلمات لم نرها بالفعل. تفترض النماذج الإحصائية القياسية، مثل تلك التي تتضمن التوزيع الفئوي والانحدار اللوجستي متعدد الحدود ، أن عدد الفئات معروف مسبقًا، وأن تغيير عدد الفئات بسرعة أمر صعب. في مثل هذه الحالات، يجب استخدام تقنيات أكثر تقدما. ومن الأمثلة على ذلك عملية ديريشليت ، التي تقع في مجال الإحصائيات اللامعلمية . في مثل هذه الحالة، من المفترض منطقيًا وجود عدد لا حصر له من الفئات، ولكن في أي وقت لم يتم رؤية معظمها (في الواقع، جميعها باستثناء عدد محدود). تتم صياغة جميع الصيغ من حيث عدد الفئات التي تمت مشاهدتها فعليًا حتى الآن بدلاً من العدد الإجمالي (اللانهائي) للفئات المحتملة الموجودة، ويتم إنشاء طرق للتحديث المتزايد للتوزيعات الإحصائية، بما في ذلك إضافة فئات "جديدة".

المتغيرات الفئوية والانحدار

تمثل المتغيرات الفئوية طريقة نوعية لتسجيل البيانات (أي تمثل الفئات أو عضوية المجموعة). يمكن تضمينها كمتغيرات مستقلة في تحليل الانحدار أو كمتغيرات تابعة في الانحدار اللوجستي أو الانحدار الاحتمالي ، ولكن يجب تحويلها إلى بيانات كمية حتى تتمكن من تحليل البيانات. ويتم ذلك من خلال استخدام أنظمة الترميز. يتم إجراء التحليلات بحيث يتم ترميز g -1 فقط ( g هو عدد المجموعات). يؤدي هذا إلى تقليل التكرار مع الاستمرار في تمثيل مجموعة البيانات الكاملة حيث لن يتم الحصول على معلومات إضافية من ترميز إجمالي مجموعات g : على سبيل المثال، عند ترميز الجنس (حيث g = 2: ذكر وأنثى)، إذا قمنا بترميز الإناث فقط، فإن كل ما تبقى سيفعل يكون بالضرورة ذكورا. بشكل عام، المجموعة التي لا يتم ترميزها هي المجموعة الأقل أهمية. [2]

هناك ثلاثة أنظمة تشفير رئيسية تستخدم عادةً في تحليل المتغيرات الفئوية في الانحدار: التشفير الوهمي، وترميز التأثيرات، وترميز التباين. تأخذ معادلة الانحدار الشكل Y = bX + a ، حيث b هو الميل ويعطي الوزن المخصص تجريبيًا للمفسر، و X هو المتغير التوضيحي، و a هو تقاطع Y ، وتأخذ هذه القيم معاني مختلفة بناءً على على نظام الترميز المستخدم. ولا يؤثر اختيار نظام التشفير على إحصائيات F أو R 2 . ومع ذلك، يختار المرء نظام تشفير يعتمد على المقارنة بين الاهتمامات حيث أن تفسير قيم b سوف يختلف. [2]

الترميز الوهمي

يتم استخدام الترميز الوهمي عندما تكون هناك مجموعة تحكم أو مقارنة في الاعتبار. لذلك يتم تحليل بيانات مجموعة واحدة فيما يتعلق بمجموعة المقارنة: يمثل a متوسط ​​المجموعة الضابطة و b هو الفرق بين متوسط ​​المجموعة التجريبية ومتوسط ​​المجموعة الضابطة. يُقترح استيفاء ثلاثة معايير لتحديد مجموعة مراقبة مناسبة: يجب أن تكون المجموعة مجموعة راسخة (على سبيل المثال، لا ينبغي أن تكون فئة "أخرى")، ويجب أن يكون هناك سبب منطقي لاختيار هذه المجموعة على سبيل المقارنة ( على سبيل المثال، من المتوقع أن تسجل المجموعة أعلى الدرجات على المتغير التابع)، وأخيرًا، يجب أن يكون حجم عينة المجموعة كبيرًا وليس صغيرًا مقارنة بالمجموعات الأخرى. [3]

في الترميز الوهمي، يتم تعيين قيمة 0 للمجموعة المرجعية لكل متغير رمز، ويتم تعيين المجموعة محل الاهتمام للمقارنة بالمجموعة المرجعية قيمة 1 لمتغير الكود المحدد الخاص بها، بينما يتم تعيين جميع المجموعات الأخرى 0 لذلك المعين. متغير الكود. [2]

يجب تفسير القيم b بحيث تتم مقارنة المجموعة التجريبية بالمجموعة الضابطة. ولذلك، فإن الحصول على قيمة b سالبة يستلزم حصول المجموعة التجريبية على درجات أقل من المجموعة الضابطة في المتغير التابع . لتوضيح ذلك، لنفترض أننا نقيس التفاؤل بين عدة جنسيات وقررنا أن الشعب الفرنسي سيكون بمثابة عنصر تحكم مفيد. إذا قمنا بمقارنتهم بالإيطاليين، ولاحظنا قيمة b سلبية ، فإن هذا قد يشير إلى أن الإيطاليين يحصلون على درجات تفاؤل أقل في المتوسط.

الجدول التالي هو مثال على الترميز الوهمي مع الفرنسية كمجموعة تحكم وC1 وC2 وC3 على التوالي هي رموز الإيطالية والألمانية وغيرها ( ليست الفرنسية ولا الإيطالية ولا الألمانية) :

جنسية ج1 ج2 ج3
فرنسي 0 0 0
ايطالي 1 0 0
ألمانية 0 1 0
آخر 0 0 1

ترميز التأثيرات

في نظام ترميز التأثيرات، يتم تحليل البيانات من خلال مقارنة مجموعة واحدة بجميع المجموعات الأخرى. على عكس الترميز الوهمي، لا توجد مجموعة تحكم. وبدلا من ذلك، يتم إجراء المقارنة على متوسط ​​جميع المجموعات مجتمعة ( أ هو الآن المتوسط ​​الكبير ). لذلك، لا يبحث المرء عن بيانات تتعلق بمجموعة أخرى، بل يبحث عن بيانات تتعلق بالمتوسط ​​الكبير. [2]

يمكن أن يكون ترميز التأثيرات مرجحًا أو غير مرجح. يقوم ترميز التأثيرات المرجحة ببساطة بحساب المتوسط ​​الكبير المرجح، وبالتالي أخذ حجم العينة في كل متغير بعين الاعتبار. وهذا هو الأنسب في الحالات التي تكون فيها العينة ممثلة للمجتمع المعني. يعد تشفير التأثيرات غير الموزونة هو الأكثر ملاءمة في الحالات التي تكون فيها الاختلافات في حجم العينة نتيجة لعوامل عرضية. ويختلف تفسير b لكل منهما: في التأثيرات غير الموزونة، يكون الترميز b هو الفرق بين متوسط ​​المجموعة التجريبية والمتوسط ​​الكبير، بينما في الحالة المرجحة يكون متوسط ​​المجموعة التجريبية مطروحًا منه المتوسط ​​الكبير المرجح. [2]

في تشفير التأثيرات، نقوم بترميز المجموعة محل الاهتمام بالرقم 1، تمامًا كما نفعل مع الترميز الوهمي. والفرق الرئيسي هو أننا نقوم بترميز −1 للمجموعة التي نحن أقل اهتمامًا بها. وبما أننا نواصل استخدام نظام ترميز g - 1، فإن المجموعة المشفرة −1 هي في الواقع لن تنتج بيانات، ومن هنا حقيقة أننا هم الأقل اهتماما بهذه المجموعة. يتم تعيين رمز 0 لجميع المجموعات الأخرى.

ينبغي تفسير القيم b بحيث تتم مقارنة المجموعة التجريبية بمتوسط ​​جميع المجموعات مجتمعة (أو المتوسط ​​الكبير المرجح في حالة تشفير التأثيرات المرجحة). ولذلك، فإن الحصول على قيمة b سالبة يستلزم حصول المجموعة المشفرة على نقاط أقل من متوسط ​​جميع المجموعات في المتغير التابع. باستخدام مثالنا السابق لدرجات التفاؤل بين الجنسيات، إذا كانت المجموعة محل الاهتمام إيطاليين، فإن ملاحظة قيمة b سلبية تشير إلى حصولهم على درجة تفاؤل أقل.

الجدول التالي هو مثال لترميز التأثيرات مع مجموعة أخرى باعتبارها المجموعة الأقل أهمية.

جنسية ج1 ج2 ج3
فرنسي 0 0 1
ايطالي 1 0 0
ألمانية 0 1 0
آخر -1 -1 -1

ترميز التباين

يسمح نظام ترميز التباين للباحث بطرح أسئلة محددة مباشرة. بدلاً من جعل نظام الترميز يفرض المقارنة التي يتم إجراؤها (أي ضد مجموعة مراقبة كما هو الحال في الترميز الوهمي، أو ضد جميع المجموعات كما هو الحال في ترميز التأثيرات)، يمكن للمرء تصميم مقارنة فريدة تلبي سؤال البحث المحدد الخاص به. تعتمد هذه الفرضية المصممة بشكل عام على النظرية و/أو البحث السابق. الفرضيات المقترحة عمومًا هي كما يلي: أولاً، هناك الفرضية المركزية التي تفترض وجود فرق كبير بين مجموعتين من المجموعات؛ وتشير الفرضية الثانية إلى أن الاختلافات بين المجموعات صغيرة داخل كل مجموعة. من خلال فرضياته المسبقة المركزة، قد يؤدي تشفير التباين إلى زيادة في قوة الاختبار الإحصائي عند مقارنته بأنظمة التشفير السابقة الأقل توجيهًا. [2]

تظهر بعض الاختلافات عندما نقارن معاملاتنا المسبقة بين ANOVA والانحدار. على عكس ما يتم استخدامه في تحليل التباين (ANOVA)، حيث يكون وفقًا لتقدير الباحث ما إذا كان يختار قيم المعاملات التي تكون إما متعامدة أو غير متعامدة، في الانحدار، من الضروري أن تكون قيم المعاملات المخصصة في ترميز التباين متعامدة. علاوة على ذلك، في الانحدار، يجب أن تكون قيم المعاملات إما في شكل كسري أو عشري. لا يمكنهم أخذ قيم الفاصل الزمني.

يقتصر إنشاء رموز التباين على ثلاث قواعد:

  1. يجب أن يساوي مجموع معاملات التباين لكل متغير رمز صفرًا.
  2. الفرق بين مجموع المعاملات الإيجابية ومجموع المعاملات السلبية يجب أن يساوي 1.
  3. يجب أن تكون المتغيرات المشفرة متعامدة. [2]

يؤدي انتهاك القاعدة 2 إلى إنتاج قيم R 2 و F دقيقة ، مما يشير إلى أننا سنصل إلى نفس الاستنتاجات حول ما إذا كان هناك فرق كبير أم لا؛ ومع ذلك، لم يعد بإمكاننا تفسير القيم b على أنها فرق متوسط.

لتوضيح بناء رموز التباين، خذ بعين الاعتبار الجدول التالي. تم اختيار المعاملات لتوضيح فرضياتنا المسبقة: الفرضية 1: سيحصل الأشخاص الفرنسيون والإيطاليون على درجات أعلى في التفاؤل من الألمان (الفرنسية = +0.33، الإيطالية = +0.33، الألمانية = .60.66). ويتجلى ذلك من خلال تخصيص نفس المعامل للفئتين الفرنسية والإيطالية ومعامل مختلف للألمان. وتشير العلامات المخصصة إلى اتجاه العلاقة (وبالتالي فإن إعطاء الألمان إشارة سلبية يدل على انخفاض درجات التفاؤل المفترضة لديهم). الفرضية 2: من المتوقع أن يختلف الفرنسيون والإيطاليون في درجات تفاؤلهم (الفرنسية = +0.50، الإيطالية = .50.50، الألمانية = 0). وهنا فإن إعطاء قيمة صفر للألمان يدل على عدم شمولهم في تحليل هذه الفرضية. مرة أخرى، العلامات المخصصة تدل على العلاقة المقترحة.

جنسية ج1 ج2
فرنسي +0.33 +0.50
ايطالي +0.33 -0.50
ألمانية -0.66 0

ترميز هراء

يحدث الترميز الهراء عندما يستخدم المرء قيمًا عشوائية بدلاً من "0" و"1" و"-1" المعينة في أنظمة التشفير السابقة. على الرغم من أنه ينتج قيمًا متوسطة صحيحة للمتغيرات، إلا أنه لا يوصى باستخدام الترميز الهراء لأنه سيؤدي إلى نتائج إحصائية غير قابلة للتفسير. [2]

التضمين

التضمينات هي ترميزات لقيم فئوية في مساحات متجهة ذات قيمة حقيقية منخفضة الأبعاد (أحيانًا ذات قيمة معقدة )، عادةً بطريقة يتم فيها تعيين قيم "مشابهة" متجهات "مشابهة"، أو فيما يتعلق بنوع آخر من المعايير التي تجعل ناقلات مفيدة للتطبيق المعني. إحدى الحالات الخاصة الشائعة هي تضمينات الكلمات ، حيث تكون القيم المحتملة للمتغير الفئوي هي الكلمات الموجودة في اللغة ويتم تعيين الكلمات ذات المعاني المتشابهة متجهات مماثلة.

التفاعلات

قد ينشأ التفاعل عند النظر في العلاقة بين ثلاثة متغيرات أو أكثر، ويصف الحالة التي يكون فيها التأثير المتزامن لمتغيرين على متغير ثالث غير إضافي. يمكن أن تنشأ التفاعلات مع المتغيرات الفئوية بطريقتين: إما فئوية عن طريق تفاعلات المتغيرات الفئوية، أو فئوية عن طريق تفاعلات متغيرة مستمرة.

فئوي حسب التفاعلات المتغيرة الفئوية

ينشأ هذا النوع من التفاعل عندما يكون لدينا متغيرين قاطعين. من أجل استكشاف هذا النوع من التفاعل، يمكن للمرء أن يقوم بالبرمجة باستخدام النظام الذي يعالج فرضية الباحث بشكل مناسب. منتج الرموز ينتج التفاعل. يمكن للمرء بعد ذلك حساب القيمة b وتحديد ما إذا كان التفاعل مهمًا أم لا. [2]

قاطعة بالتفاعلات المتغيرة المستمرة

تحليل المنحدرات البسيطة هو اختبار لاحق شائع يستخدم في الانحدار وهو مشابه لتحليل التأثيرات البسيطة في تحليل التباين (ANOVA)، المستخدم لتحليل التفاعلات. في هذا الاختبار، نقوم بفحص الميل البسيط لأحد المتغيرات المستقلة عند قيم محددة للمتغير المستقل الآخر. لا يقتصر مثل هذا الاختبار على استخدامه مع المتغيرات المستمرة، ولكن يمكن استخدامه أيضًا عندما يكون المتغير المستقل قاطعًا. لا يمكننا ببساطة اختيار القيم لاستكشاف التفاعل كما نفعل في حالة المتغير المستمر بسبب الطبيعة الاسمية للبيانات (أي، في الحالة المستمرة، يمكن للمرء تحليل البيانات عند مستويات عالية ومتوسطة ومنخفضة مع تعيين انحراف معياري واحد) أعلى من المتوسط، وعند المتوسط، وعند انحراف معياري واحد أقل من المتوسط ​​على التوالي). في حالتنا الفئوية سوف نستخدم معادلة انحدار بسيطة لكل مجموعة لدراسة المنحدرات البسيطة. من الممارسات الشائعة توحيد المتغيرات أو توسيطها لجعل البيانات أكثر قابلية للتفسير في تحليل المنحدرات البسيط؛ ومع ذلك، لا ينبغي أبدا أن تكون المتغيرات الفئوية موحدة أو مركزية. يمكن استخدام هذا الاختبار مع جميع أنظمة الترميز. [2]

أنظر أيضا

مراجع

  1. ^ ييتس ، دانيال س. مور، ديفيد س.؛ ستارنز، دارين س. (2003). ممارسة الإحصاء (الطبعة الثانية). نيويورك: فريمان . رقم ISBN 978-0-7167-4773-4. مؤرشفة من الأصلي بتاريخ 2005-02-09 . تم الاسترجاع 2014/09/28 .
  2. ^ abcdefghij كوهين، J.؛ كوهين، ب. الغرب، سان جرمان. أيكن، ليرة سورية (2003). تطبيق تحليل الانحدار / الارتباط المتعدد للعلوم السلوكية (الطبعة الثالثة) . نيويورك، نيويورك: روتليدج.
  3. ^ هاردي ، ميليسا (1993). الانحدار مع المتغيرات الوهمية . نيوبري بارك، كاليفورنيا: سيج.

قراءة متعمقة

  • أندرسن، إيرلينج ب. 1980. النماذج الإحصائية المنفصلة مع تطبيقات العلوم الاجتماعية . شمال هولندا، 1980.
  • أسقف, YMM ; الأماكن القريبة : هولندا، PW (1975). التحليل متعدد المتغيرات المنفصلة: النظرية والتطبيق . مطبعة معهد ماساتشوستس للتكنولوجيا. رقم ISBN 978-0-262-02113-5. السيد  0381130.
  • كريستنسن، رونالد (1997). النماذج اللوغاريتمية الخطية والانحدار اللوجستي . نصوص سبرينغر في الإحصاء (الطبعة الثانية). نيويورك: سبرينغر-فيرلاغ. ص السادس عشر+483. رقم ISBN 0-387-98247-7. السيد  1633357.
  • ودية، مايكل . تصور البيانات الفئوية. معهد ساس، 2000.
  • لوريتزن، ستيفن إل. (2002) [1979]. محاضرات حول جداول الطوارئ (PDF) (نسخة إلكترونية محدثة من (جامعة ألبورج) الطبعة الثالثة (1989)).
  • NIST/SEMATEK (2008) دليل الأساليب الإحصائية
تم الاسترجاع من "https://en.wikipedia.org/w/index.php?title=Categorical_variable&oldid=1188051649"