สถิติ

จากวิกิพีเดีย สารานุกรมเสรี
ข้ามไปที่การนำทาง ข้ามไปที่การค้นหา
การแจกแจง แบบปกติ ความหนาแน่นของความน่าจะเป็นทั่วไปมีประโยชน์เนื่องจากทฤษฎีบทขีดจำกัดกลาง
พ ล็อตกระจายใช้ในสถิติพรรณนาเพื่อแสดงความสัมพันธ์ที่สังเกตได้ระหว่างตัวแปรต่างๆ โดยใช้ชุดข้อมูลดอกไอริ

สถิติเป็นสาขาวิชาที่เกี่ยวข้องกับการรวบรวม การจัดองค์กร การวิเคราะห์ การตีความ และการนำเสนอข้อมูล [1] [2] [3]ในการใช้สถิติกับปัญหาทางวิทยาศาสตร์ อุตสาหกรรม หรือสังคม เป็นเรื่องปกติที่จะเริ่มต้นด้วยประชากรทางสถิติหรือแบบจำลองทางสถิติที่จะศึกษา ประชากรอาจเป็นกลุ่มคนหรือวัตถุที่หลากหลาย เช่น "ทุกคนที่อาศัยอยู่ในประเทศหนึ่ง" หรือ "ทุกอะตอมที่ประกอบเป็นคริสตัล" สถิติเกี่ยวข้องกับทุกแง่มุมของข้อมูล รวมถึงการวางแผนการรวบรวมข้อมูลในแง่ของการออกแบบการสำรวจและการทดลอง [4]

เมื่อไม่สามารถรวบรวมข้อมูลสำมะโน ได้ นัก สถิติ จะ รวบรวมข้อมูลโดยการพัฒนาการออกแบบการทดลองและตัวอย่าง การสำรวจที่เฉพาะ เจาะจง การสุ่มตัวอย่างแบบตัวแทนช่วยให้มั่นใจได้ว่าการอนุมานและข้อสรุปสามารถขยายจากกลุ่มตัวอย่างไปสู่ประชากรโดยรวมได้อย่างสมเหตุสมผล การศึกษาเชิงทดลองเกี่ยวข้องกับการวัดของระบบภายใต้การศึกษา การจัดการระบบ จากนั้นจึงทำการวัดเพิ่มเติมโดยใช้ขั้นตอนเดียวกันเพื่อพิจารณาว่าการปรับเปลี่ยนได้แก้ไขค่าของการวัดหรือไม่ ในทางตรงกันข้าม การศึกษาเชิงสังเกตไม่เกี่ยวข้องกับการทดลองดัดแปลง

การวิเคราะห์ข้อมูลใช้วิธีทางสถิติหลักสองวิธี: สถิติพรรณนาซึ่งสรุปข้อมูลจากตัวอย่างโดยใช้ดัชนีเช่นค่าเฉลี่ยหรือส่วนเบี่ยงเบนมาตรฐานและสถิติอนุมานซึ่งสรุปจากข้อมูลที่มีการแปรผันแบบสุ่ม (เช่น ข้อผิดพลาดจากการสังเกต รูปแบบการสุ่มตัวอย่าง) [5]สถิติเชิงพรรณนามักเกี่ยวข้องกับคุณสมบัติของการแจกแจง สองชุด (ตัวอย่างหรือจำนวนประชากร): แนวโน้มศูนย์กลาง (หรือตำแหน่ง ) พยายามที่จะกำหนดลักษณะค่าส่วนกลางหรือค่าปกติของการแจกแจง ในขณะที่การกระจาย (หรือความแปรปรวน ) กำหนดลักษณะขอบเขตที่สมาชิกของการกระจายออกจากศูนย์กลางและกันและกัน การอนุมานเกี่ยวกับสถิติทางคณิตศาสตร์อยู่ภายใต้กรอบของทฤษฎีความน่าจะเป็น ซึ่งเกี่ยวข้องกับการวิเคราะห์ปรากฏการณ์สุ่ม

ขั้นตอนทางสถิติมาตรฐานเกี่ยวข้องกับการรวบรวมข้อมูลที่นำไปสู่การทดสอบความสัมพันธ์ระหว่างชุดข้อมูลทางสถิติสองชุด หรือชุดข้อมูลและข้อมูลสังเคราะห์ที่ดึงมาจากแบบจำลองในอุดมคติ มีการเสนอสมมติฐานสำหรับความสัมพันธ์ทางสถิติระหว่างชุดข้อมูลสองชุด และนี่เป็นการเปรียบเทียบเป็นทางเลือกแทนสมมติฐานว่างในอุดมคติที่ไม่มีความสัมพันธ์ระหว่างชุดข้อมูลสองชุด การปฏิเสธหรือหักล้างสมมติฐานว่างทำได้โดยใช้การทดสอบทางสถิติที่หาปริมาณความรู้สึกที่ค่าว่างสามารถพิสูจน์ได้ว่าเป็นเท็จ โดยพิจารณาจากข้อมูลที่ใช้ในการทดสอบ การทำงานจากสมมติฐานว่าง จะรับรู้รูปแบบพื้นฐานของข้อผิดพลาดสองรูปแบบ: ข้อผิดพลาดประเภทที่ 1 (สมมติฐานว่างถูกปฏิเสธอย่างไม่ถูกต้องโดยให้ "ผลบวกเท็จ") และข้อผิดพลาดประเภท II (สมมติฐานว่างไม่สามารถปฏิเสธได้ และพลาดความสัมพันธ์ที่แท้จริงระหว่างประชากรโดยให้ "ค่าลบเท็จ") [6]ปัญหามากมายที่เกี่ยวข้องกับกรอบการทำงานนี้ ตั้งแต่การได้มาซึ่งขนาดตัวอย่างที่เพียงพอ ไปจนถึงการระบุสมมติฐานว่างที่เพียงพอ [5]

กระบวนการวัดที่สร้างข้อมูลทางสถิติอาจมีข้อผิดพลาดเช่นกัน ข้อผิดพลาดเหล่านี้จำนวนมากจัดอยู่ในประเภทสุ่ม (สัญญาณรบกวน) หรืออย่างเป็นระบบ ( อคติ ) แต่ข้อผิดพลาดประเภทอื่นๆ (เช่น ข้อผิดพลาด เช่น เมื่อนักวิเคราะห์รายงานหน่วยที่ไม่ถูกต้อง) ก็อาจเกิดขึ้นได้เช่นกัน การมีอยู่ของข้อมูลที่ขาดหายไปหรือการเซ็นเซอร์อาจส่งผลให้เกิดการประมาณการที่ลำเอียง และได้มีการพัฒนาเทคนิคเฉพาะเพื่อแก้ไขปัญหาเหล่านี้

บทนำ

สถิติเป็นเนื้อหาทางคณิตศาสตร์ของวิทยาศาสตร์ที่เกี่ยวข้องกับการรวบรวม การวิเคราะห์ การตีความหรือคำอธิบาย และการนำเสนอข้อมูล [ 7]หรือเป็นสาขาวิชาคณิตศาสตร์ [8]บางคนถือว่าสถิติเป็นศาสตร์ทางคณิตศาสตร์ที่แตกต่างออกไป มากกว่าที่จะเป็นสาขาหนึ่งของคณิตศาสตร์ ในขณะที่การสืบสวนทางวิทยาศาสตร์จำนวนมากใช้ข้อมูล สถิติเกี่ยวข้องกับการใช้ข้อมูลในบริบทของความไม่แน่นอนและการตัดสินใจเมื่อเผชิญกับความไม่แน่นอน [9] [10]

ในการนำสถิติมาใช้กับปัญหา เป็นเรื่องปกติที่จะเริ่มต้นด้วยประชากรหรือกระบวนการที่จะศึกษา ประชากรอาจเป็นหัวข้อที่หลากหลาย เช่น "ทุกคนที่อาศัยอยู่ในประเทศหนึ่ง" หรือ "ทุกๆ อะตอมที่ประกอบเป็นคริสตัล" ตามหลักการแล้ว นักสถิติจะรวบรวมข้อมูลเกี่ยวกับประชากรทั้งหมด (การดำเนินการที่เรียกว่าสำมะโน ). อาจจัดโดยสถาบันสถิติของรัฐ สถิติเชิงพรรณนาสามารถใช้เพื่อสรุปข้อมูลประชากรได้ ตัวอธิบายเชิงตัวเลขประกอบด้วยค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานสำหรับข้อมูลต่อเนื่อง (เช่น รายได้) ในขณะที่ความถี่และเปอร์เซ็นต์มีประโยชน์มากกว่าในแง่ของการอธิบายข้อมูลเชิงหมวดหมู่ (เช่น การศึกษา)

เมื่อไม่สามารถทำสำมะโนได้ จะมีการ ศึกษากลุ่มย่อยที่เลือกของประชากรที่เรียกว่ากลุ่มตัวอย่าง เมื่อกำหนดตัวอย่างที่เป็นตัวแทนของประชากรแล้ว ข้อมูลจะถูกรวบรวมสำหรับสมาชิกกลุ่มตัวอย่างในการตั้งค่าเชิงสังเกตหรือการทดลอง อีกครั้ง สามารถใช้สถิติเชิงพรรณนาเพื่อสรุปข้อมูลตัวอย่างได้ อย่างไรก็ตาม การวาดภาพตัวอย่างมีองค์ประกอบของการสุ่ม ดังนั้น ตัวบอกเชิงตัวเลขจากกลุ่มตัวอย่างจึงมีแนวโน้มที่จะเกิดความไม่แน่นอนเช่นกัน ในการสรุปผลที่มีความหมายเกี่ยวกับประชากรทั้งหมดจำเป็นต้องมีสถิติเชิงอนุมาน มันใช้รูปแบบในข้อมูลตัวอย่างเพื่อทำการอนุมานเกี่ยวกับประชากรที่แสดงในขณะที่ทำการสุ่ม การอนุมานเหล่านี้อาจอยู่ในรูปแบบของการตอบคำถามใช่/ไม่ใช่เกี่ยวกับข้อมูล (การทดสอบสมมติฐาน ) การประมาณลักษณะเชิงตัวเลขของข้อมูล ( การประมาณค่า ) การอธิบายการเชื่อมโยงภายในข้อมูล ( สหสัมพันธ์ ) และการสร้างแบบจำลองความสัมพันธ์ภายในข้อมูล (เช่น การใช้การวิเคราะห์การถดถอย ) การอนุมานสามารถขยายไปถึงการพยากรณ์การคาดคะเนและการประมาณค่าที่ยังไม่ได้สังเกต ไม่ว่าจะในหรือเกี่ยวข้องกับประชากรที่กำลังศึกษา ซึ่งอาจรวมถึง การ อนุมานและ การ ประมาณ ค่า ของอนุกรมเวลาหรือข้อมูลเชิงพื้นที่และการทำเหมืองข้อมูล

สถิติทางคณิตศาสตร์

สถิติทางคณิตศาสตร์คือการประยุกต์ใช้คณิตศาสตร์กับสถิติ เทคนิคทางคณิตศาสตร์ที่ใช้สำหรับสิ่งนี้ ได้แก่ การวิเคราะห์ ทางคณิตศาสตร์พีชคณิตเชิงเส้นการวิเคราะห์สุ่ม สม การเชิงอนุพันธ์และทฤษฎีความน่าจะเป็นเชิงการวัด [11] [12]

ประวัติ

Gerolamo Cardanoผู้บุกเบิกคณิตศาสตร์ของความน่าจะเป็น

งานเขียนเบื้องต้นเกี่ยวกับการอนุมานทางสถิติมีอายุย้อนไปถึงนักคณิตศาสตร์และ นัก เข้ารหัส ชาวอาหรับ ในช่วงยุคทองของอิสลามระหว่างศตวรรษที่ 8 ถึง 13 Al-Khalil (717–786) เขียนBook of Cryptographic Messagesซึ่งมีการใช้พีชคณิตและการผสมผสาน ครั้งแรก เพื่อแสดง คำ ภาษาอาหรับ ที่เป็นไปได้ทั้งหมดที่ มีและไม่มีสระ [13]ในหนังสือของเขาต้นฉบับเกี่ยวกับการถอดรหัสข้อความเข้ารหัส Al-Kindi ได้ให้คำอธิบายโดยละเอียดเกี่ยวกับวิธีใช้การวิเคราะห์ความถี่เพื่อถอดรหัสข้อความที่เข้ารหัส Al-Kindi ยังใช้การอนุมานทางสถิติในขณะที่เขาและต่อมานักเข้ารหัสชาวอาหรับได้พัฒนาวิธีการทางสถิติเบื้องต้นสำหรับการถอดรหัสข้อความที่เข้ารหัส Ibn Adlan (1187–1268) ได้มีส่วนสำคัญในภายหลังเกี่ยวกับการใช้ขนาดตัวอย่างในการวิเคราะห์ความถี่ [13]

งานเขียนเกี่ยวกับสถิติที่เก่าแก่ที่สุดของยุโรปมีอายุย้อนไปถึงปี 1663 โดยมีการตีพิมพ์เรื่องNatural and Political Observations on the Bills of MortalityโดยJohn Graunt [14] การประยุกต์ใช้การคิดเชิงสถิติในระยะแรกหมุนรอบความต้องการของรัฐเพื่อสร้างนโยบายเป็นฐานเกี่ยวกับข้อมูล ด้านประชากรศาสตร์และเศรษฐกิจ ดังนั้นสถิติศาสตร์ ขอบเขตของสาขาวิชาสถิติขยายกว้างขึ้นในช่วงต้นศตวรรษที่ 19 เพื่อรวมการรวบรวมและวิเคราะห์ข้อมูลโดยทั่วไป ทุกวันนี้ สถิติมีการใช้กันอย่างแพร่หลายในภาครัฐ ธุรกิจ และวิทยาศาสตร์ธรรมชาติและสังคมศาสตร์

รากฐานทางคณิตศาสตร์ของสถิติสมัยใหม่ถูกวางไว้ในศตวรรษที่ 17 โดยมีการพัฒนาทฤษฎีความน่าจะเป็นโดยGerolamo Cardano , Blaise PascalและPierre de Fermat ทฤษฎีความน่าจะเป็นทางคณิตศาสตร์เกิดขึ้นจากการศึกษาเกมแห่งโอกาสถึงแม้ว่าแนวคิดเรื่องความน่าจะเป็นได้ถูกตรวจสอบแล้วในกฎยุคกลาง และโดย นักปรัชญาเช่นJuan Caramuel [15] วิธี การของกำลังสองน้อยที่สุดได้รับการอธิบายครั้งแรกโดยAdrien-Marie Legendreในปี 1805

Karl Pearsonผู้ก่อตั้งสถิติทางคณิตศาสตร์

สาขาสถิติสมัยใหม่ปรากฏในปลายศตวรรษที่ 19 และต้นศตวรรษที่ 20 ในสามขั้นตอน [16]คลื่นลูกแรกในช่วงเปลี่ยนศตวรรษ นำโดยงานของฟรานซิส กั ลตัน และคาร์ล เพียร์สันผู้ซึ่งเปลี่ยนสถิติให้เป็นวินัยทางคณิตศาสตร์ที่เข้มงวดซึ่งใช้สำหรับการวิเคราะห์ ไม่ใช่แค่ในวิทยาศาสตร์ แต่ในอุตสาหกรรมและการเมืองด้วย . การมีส่วนร่วมของ Galton รวมถึงการแนะนำแนวคิดของส่วนเบี่ยงเบนมาตรฐานสหสัมพันธ์ การวิเคราะห์ การถดถอยและการประยุกต์ใช้วิธีการเหล่านี้ในการศึกษาลักษณะต่างๆ ของมนุษย์ เช่น ส่วนสูง น้ำหนัก ความยาวขนตา เป็นต้น [17]เพียร์สันพัฒนาสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน ผลิตภัณฑ์-โมเมนต์[18] วิธี การของโมเมนต์สำหรับการกระจายตัวอย่างที่เหมาะสม และการแจกแจงแบบเพียร์สันและอื่นๆ อีกมากมาย [19] Galton และ Pearson ก่อตั้งBiometrikaเป็นวารสารแรกเกี่ยวกับสถิติทางคณิตศาสตร์และชีวสถิติ (ซึ่งเรียกว่า biometry) และชุดหลังได้ก่อตั้งแผนกสถิติมหาวิทยาลัยแห่งแรกของโลกที่University College London (20)

โรนัลด์ ฟิชเชอร์เป็นผู้ประดิษฐ์คำว่าสมมติฐานว่างในระหว่างการ ทดลอง ชิมชาของเลดี้ซึ่ง "ไม่เคยได้รับการพิสูจน์หรือเป็นที่ยอมรับ แต่อาจพิสูจน์หักล้างได้ในระหว่างการทดลอง" [21] [22]

คลื่นลูกที่สองของทศวรรษที่ 1910 และ 20 เริ่มต้นโดยWilliam Sealy Gossetและถึงจุดสุดยอดในข้อมูลเชิงลึกของRonald Fisherผู้เขียนหนังสือเรียนที่กำหนดวินัยทางวิชาการในมหาวิทยาลัยทั่วโลก สิ่งตีพิมพ์ที่สำคัญที่สุดของฟิชเชอร์คือบทความของเขาในปี 1918 เรื่องThe Correlation between Relatives on the Supposition of Mendelian Inheritance (ซึ่งเป็นครั้งแรกที่ใช้คำทางสถิติความแปรปรวน ) งานคลาสสิกของเขาในปี 1925 วิธีการทางสถิติสำหรับนักวิจัยและ 1935 การออกแบบการทดลองของเขา[23] [24] [25] ซึ่งเขาได้พัฒนาการ ออกแบบการทดลองอย่างเข้มงวดโมเดล เขาริเริ่มแนวคิดเรื่องความพอเพียงสถิติเสริม ตัว จำแนกเชิงเส้นของ ฟิ ช เชอร์ และข้อมูล ของฟิชเชอ ร์ [26]ในหนังสือของเขาในปี 1930 เรื่องThe Genetical Theory of Natural Selectionเขาได้ใช้สถิติกับ แนวคิด ทางชีววิทยา ต่างๆ เช่นหลักการของฟิชเชอร์[27] (ซึ่งAWF Edwardsเรียกว่า "น่าจะเป็นข้อโต้แย้งที่โด่งดังที่สุดในชีววิทยาวิวัฒนาการ ") และFisherian runaway , [28 ] [29] [30] [31] [32] [33]แนวคิดในการเลือกทางเพศเกี่ยวกับผลตอบรับเชิงบวกที่พบใน วิวัฒนาการ

คลื่นสุดท้ายซึ่งส่วนใหญ่เห็นการปรับแต่งและการขยายตัวของการพัฒนาก่อนหน้านี้เกิดขึ้นจากการทำงานร่วมกันระหว่างEgon PearsonและJerzy Neymanในช่วงทศวรรษที่ 1930 พวกเขาแนะนำแนวคิดของข้อผิดพลาด " Type II " พลังของการทดสอบและ ช่วง ความเชื่อมั่น Jerzy Neyman ในปี 1934 แสดงให้เห็นว่าการสุ่มตัวอย่างแบบแบ่งชั้นโดยทั่วไปเป็นวิธีที่ดีกว่าในการประมาณค่ามากกว่าการสุ่มตัวอย่างแบบเจาะจง (โควตา) [34]

ทุกวันนี้ วิธีการทางสถิติถูกนำมาใช้ในทุกสาขาที่เกี่ยวข้องกับการตัดสินใจ สำหรับการอนุมานที่แม่นยำจากเนื้อหาที่รวบรวม และสำหรับการตัดสินใจเมื่อเผชิญกับความไม่แน่นอนตามวิธีการทางสถิติ การใช้ คอมพิวเตอร์สมัยใหม่ช่วยเร่งการคำนวณทางสถิติในวงกว้าง และทำให้วิธีการใหม่ๆ เป็นไปได้ซึ่งไม่สามารถดำเนินการด้วยตนเองได้ สถิติยังคงเป็นพื้นที่ของการวิจัยเชิงรุก เช่น ปัญหาการวิเคราะห์ ข้อมูล ขนาดใหญ่ [35]

ข้อมูลสถิติ

การเก็บรวบรวมข้อมูล

การสุ่มตัวอย่าง

เมื่อไม่สามารถรวบรวมข้อมูลสำมะโนทั้งหมดได้ นักสถิติจะรวบรวมข้อมูลตัวอย่างโดยการพัฒนาการออกแบบการทดลองและตัวอย่างการสำรวจ ที่เฉพาะ เจาะจง สถิติยังมีเครื่องมือสำหรับการทำนายและการพยากรณ์ผ่าน แบบจำลอง ทาง สถิติ

ในการใช้ตัวอย่างเป็นแนวทางสำหรับประชากรทั้งหมด สิ่งสำคัญคือต้องแสดงตัวอย่างประชากรโดยรวมอย่างแท้จริง การสุ่มตัวอย่างแบบตัวแทนช่วยให้มั่นใจได้ว่าการอนุมานและข้อสรุปสามารถขยายจากกลุ่มตัวอย่างไปสู่ประชากรโดยรวมได้อย่างปลอดภัย ปัญหาสำคัญอยู่ที่การพิจารณาขอบเขตที่กลุ่มตัวอย่างที่เลือกเป็นตัวแทนจริง สถิติเสนอวิธีการประมาณการและแก้ไขความเอนเอียงภายในขั้นตอนการสุ่มตัวอย่างและรวบรวมข้อมูล นอกจากนี้ยังมีวิธีการออกแบบการทดลองสำหรับการทดลองที่สามารถลดปัญหาเหล่านี้ได้ในตอนเริ่มต้นของการศึกษา ซึ่งช่วยเสริมความสามารถในการแยกแยะความจริงเกี่ยวกับประชากร

ทฤษฎีการสุ่มตัวอย่างเป็นส่วนหนึ่งของวินัยทางคณิตศาสตร์ของทฤษฎีความน่าจะเป็น ความน่าจะเป็นที่ใช้ในสถิติทางคณิตศาสตร์เพื่อศึกษาการกระจาย ตัวตัวอย่าง ของสถิติตัวอย่างและโดยทั่วไป คุณสมบัติของ ขั้นตอน ทางสถิติ การใช้วิธีการทางสถิติใดๆ จะใช้ได้เมื่อระบบหรือประชากรที่อยู่ระหว่างการพิจารณาเป็นไปตามสมมติฐานของวิธีการ ความแตกต่างในมุมมองระหว่างทฤษฎีความน่าจะเป็นแบบคลาสสิกกับทฤษฎีสุ่มตัวอย่างคือ ทฤษฎีความน่าจะเป็นนั้นเริ่มต้นจากพารามิเตอร์ที่กำหนดของประชากรทั้งหมดเพื่ออนุมานความน่าจะเป็นที่เกี่ยวข้องกับตัวอย่าง อย่างไรก็ตาม การอนุมานทางสถิติจะเคลื่อนที่ไปในทิศทางตรงกันข้าม—โดยอนุมานแบบอุปนัยจากตัวอย่างไปจนถึงพารามิเตอร์ของประชากรจำนวนมากขึ้นหรือทั้งหมด

การศึกษาเชิงทดลองและการสังเกต

เป้าหมายร่วมกันสำหรับโครงการวิจัยทางสถิติคือการตรวจสอบความเป็นเหตุเป็นผลและโดยเฉพาะอย่างยิ่งเพื่อสรุปเกี่ยวกับผลกระทบของการเปลี่ยนแปลงในค่าของตัวทำนายหรือตัวแปรอิสระต่อตัวแปรตาม การศึกษาเชิงสถิติเชิงสาเหตุมีสองประเภทหลัก: การศึกษาเชิงทดลองและการศึกษาเชิงสังเกต. ในการศึกษาทั้งสองประเภท จะสังเกตผลของความแตกต่างของตัวแปรอิสระ (หรือตัวแปร) ต่อพฤติกรรมของตัวแปรตาม ความแตกต่างระหว่างทั้งสองประเภทอยู่ที่วิธีดำเนินการศึกษาจริง แต่ละคนสามารถมีประสิทธิภาพมาก การศึกษาเชิงทดลองเกี่ยวข้องกับการวัดของระบบภายใต้การศึกษา การจัดการระบบ จากนั้นจึงทำการวัดเพิ่มเติมโดยใช้ขั้นตอนเดียวกันเพื่อพิจารณาว่าการปรับเปลี่ยนได้แก้ไขค่าของการวัดหรือไม่ ในทางตรงกันข้าม การศึกษาเชิงสังเกตไม่เกี่ยวข้องกับการทดลองดัดแปลง แต่จะมีการรวบรวมข้อมูลและทำการตรวจสอบความสัมพันธ์ระหว่างตัวทำนายและการตอบสนอง ในขณะที่เครื่องมือวิเคราะห์ข้อมูลทำงานได้ดีที่สุดกับข้อมูลจากการศึกษาแบบสุ่มนอกจากนี้ยังนำไปใช้กับข้อมูลประเภทอื่นๆ เช่นการทดลองตามธรรมชาติและการศึกษาเชิงสังเกต[36]ซึ่งนักสถิติจะใช้วิธีการประมาณค่าที่มีการปรับเปลี่ยนและมีโครงสร้างมากขึ้น (เช่นความแตกต่างในการประมาณค่า ส่วนต่าง และตัวแปรเครื่องมือเป็นต้น) ที่ สร้างตัวประมาณที่สอดคล้องกัน

การทดลอง

ขั้นตอนพื้นฐานของการทดสอบทางสถิติคือ:

  1. วางแผนการวิจัย รวมถึงการหาจำนวนของการศึกษาซ้ำ โดยใช้ข้อมูลต่อไปนี้: การประมาณการเบื้องต้นเกี่ยวกับขนาดของผลการรักษาสมมติฐานทางเลือกและความแปรปรวนของการทดลองโดย ประมาณ การพิจารณาคัดเลือกวิชาทดลองและจริยธรรมการวิจัยเป็นสิ่งจำเป็น นักสถิติแนะนำว่าการทดลองเปรียบเทียบ (อย่างน้อย) การรักษาใหม่หนึ่งการรักษากับการรักษามาตรฐานหรือการควบคุม เพื่อให้สามารถประมาณการความแตกต่างของผลการรักษาได้อย่างเป็นกลาง
  2. การออกแบบการทดลองใช้การปิดกั้นเพื่อลดอิทธิพลของตัวแปรที่สับสนและการกำหนดแบบสุ่มของการรักษาให้กับอาสาสมัครเพื่อให้สามารถ ประมาณ ผลการรักษาและข้อผิดพลาดในการทดลองได้อย่างเป็นกลาง ในขั้นตอนนี้ ผู้ทดลองและนักสถิติจะเขียนโปรโตคอลการทดลองที่จะชี้นำประสิทธิภาพของการทดลองและระบุการวิเคราะห์เบื้องต้นของข้อมูลการทดลอง
  3. ดำเนินการทดลองตามโปรโตคอลการทดลองและวิเคราะห์ข้อมูลตามโปรโตคอลการทดลอง
  4. ตรวจสอบชุดข้อมูลเพิ่มเติมในการวิเคราะห์ขั้นทุติยภูมิ เพื่อเสนอแนะสมมติฐานใหม่สำหรับการศึกษาในอนาคต
  5. จัดทำเอกสารและนำเสนอผลการศึกษา

การทดลองเกี่ยวกับพฤติกรรมของมนุษย์มีข้อกังวลเป็นพิเศษ การศึกษาที่มีชื่อเสียงของHawthorneได้ตรวจสอบการเปลี่ยนแปลงสภาพแวดล้อมการทำงานที่โรงงาน Hawthorne ของWestern Electric Company นักวิจัยมีความสนใจในการพิจารณาว่าการเพิ่มแสงสว่างจะช่วยเพิ่มประสิทธิภาพการทำงานของคนงาน ใน สายการประกอบ หรือไม่ นักวิจัยได้วัดผลผลิตในโรงงานก่อน จากนั้นจึงปรับเปลี่ยนการส่องสว่างในพื้นที่ของโรงงาน และตรวจสอบว่าการเปลี่ยนแปลงของแสงสว่างส่งผลต่อผลผลิตหรือไม่ ปรากฎว่าผลผลิตดีขึ้นจริงๆ (ภายใต้เงื่อนไขการทดลอง) อย่างไรก็ตาม การศึกษาถูกวิพากษ์วิจารณ์อย่างหนักในวันนี้เกี่ยวกับข้อผิดพลาดในขั้นตอนการทดลอง โดยเฉพาะการขาดกลุ่มควบคุมและตาบอด _ ผลกระทบของฮอว์ธอร์นหมายถึงการค้นพบว่าผลลัพธ์ (ในกรณีนี้คือประสิทธิภาพการทำงานของคนงาน) เปลี่ยนไปเนื่องจากการสังเกตเอง ผู้ที่อยู่ในการศึกษาของ Hawthorne มีประสิทธิผลมากกว่าไม่ใช่เพราะว่าแสงถูกเปลี่ยน แต่เพราะถูกสังเกต [37]

การศึกษาเชิงสังเกต

ตัวอย่างของการศึกษาเชิงสังเกตคือการศึกษาที่สำรวจความสัมพันธ์ระหว่างการสูบบุหรี่กับมะเร็งปอด การศึกษาประเภทนี้มักใช้การสำรวจเพื่อรวบรวมข้อสังเกตเกี่ยวกับพื้นที่ที่สนใจ จากนั้นจึงทำการวิเคราะห์ทางสถิติ ในกรณีนี้ นักวิจัยจะรวบรวมข้อสังเกตของผู้สูบบุหรี่และผู้ไม่สูบบุหรี่ โดยอาจผ่านการศึกษาตามรุ่นแล้วมองหาจำนวนผู้ป่วยมะเร็งปอดในแต่ละกลุ่ม [38]การศึกษาเฉพาะกรณีเพื่อควบคุมเป็นการศึกษาเชิงสังเกตอีกประเภทหนึ่งซึ่งเชิญผู้ที่มีและไม่มีผลลัพธ์ที่น่าสนใจ (เช่น มะเร็งปอด) เข้าร่วมและรวบรวมประวัติการสัมผัสของพวกเขา

ประเภทของข้อมูล

มีความพยายามหลายอย่างในการสร้างอนุกรมวิธานของระดับการวัด นักจิตวิทยาสแตนลีย์ สมิธ สตีเวนส์ได้กำหนดมาตราส่วนเล็กน้อย ลำดับ ช่วงเวลา และอัตราส่วน การวัดค่าที่กำหนดไม่มีลำดับอันดับที่มีความหมายระหว่างค่าต่างๆ และอนุญาตให้มีการแปลงแบบหนึ่งต่อหนึ่ง (แบบฉีด) ใดๆ การวัดลำดับมีความแตกต่างที่ไม่ชัดเจนระหว่างค่าที่ต่อเนื่องกัน แต่มีลำดับที่มีความหมายสำหรับค่าเหล่านั้น และอนุญาตให้มีการแปลงแบบคงไว้ซึ่งลำดับใดๆ การวัดตามช่วงเวลามีระยะทางที่มีความหมายระหว่างการวัดที่กำหนด แต่ค่าศูนย์เป็นค่าที่อำเภอใจ (เช่นในกรณีของ การวัด ลองจิจูดและอุณหภูมิในหน่วยเซลเซียสหรือฟาเรนไฮต์) และอนุญาตการแปลงเชิงเส้นใดๆ การวัดอัตราส่วนมีทั้งค่าศูนย์ที่มีความหมายและระยะห่างระหว่างการวัดต่างๆ ที่กำหนดไว้ และอนุญาตให้มีการแปลงมาตราส่วนใดๆ

เนื่องจากตัวแปรที่สอดคล้องกับการวัดค่าเล็กน้อยหรือค่าลำดับเท่านั้นจึงไม่สามารถวัดเป็นตัวเลขได้อย่างสมเหตุสมผล บางครั้งจึงจัดกลุ่มเข้าด้วยกันเป็นตัวแปรหมวดหมู่ในขณะที่การวัดอัตราส่วนและช่วงเวลาจะถูกจัดกลุ่มเข้าด้วยกันเป็นตัวแปรเชิงปริมาณซึ่งสามารถเป็นแบบไม่ต่อเนื่องหรือต่อเนื่องก็ได้ เนื่องจากลักษณะเชิงตัวเลขของพวกมัน ความแตกต่างดังกล่าวมักจะสัมพันธ์กันอย่างหลวมๆ กับประเภทข้อมูลในวิทยาการคอมพิวเตอร์ ในตัวแปรหมวดหมู่แบบสองขั้วนั้นอาจแสดงด้วยชนิดข้อมูลบูลีนตัวแปรหมวดหมู่พหุโทมัสที่มีจำนวนเต็มที่ กำหนดโดยพลการ ในประเภทข้อมูลปริพันธ์และตัวแปรต่อเนื่องกับประเภทข้อมูลจริงที่เกี่ยวข้องกับการคำนวณจุดลอยตัว แต่การทำแผนที่ประเภทข้อมูลวิทยาการคอมพิวเตอร์กับประเภทข้อมูลทางสถิติขึ้นอยู่กับการจัดหมวดหมู่หลังที่กำลังดำเนินการอยู่

มีการเสนอการจัดหมวดหมู่อื่น ๆ ตัวอย่างเช่น Mosteller และ Tukey (1977) [39]แยกเกรด ยศ เศษส่วนที่นับ นับ จำนวน และยอดคงเหลือ Nelder (1990) [40]อธิบายการนับอย่างต่อเนื่อง อัตราส่วนต่อเนื่อง อัตราส่วนการนับ และโหมดการจัดหมวดหมู่ของข้อมูล (ดูเพิ่มเติม: Chrisman (1998), [41] van den Berg (1991). [42] )

ประเด็นว่าควรใช้วิธีการทางสถิติประเภทต่างๆ กับข้อมูลที่ได้จากขั้นตอนการวัดผลแบบต่างๆ หรือไม่ มีความซับซ้อน โดยประเด็นที่เกี่ยวกับการแปลงค่าตัวแปรและการตีความคำถามวิจัยอย่างแม่นยำ "ความสัมพันธ์ระหว่างข้อมูลกับสิ่งที่พวกเขาอธิบายเพียงสะท้อนให้เห็นถึงความจริงที่ว่าข้อความทางสถิติบางประเภทอาจมีค่าความจริงที่ไม่คงที่ภายใต้การแปลงบางอย่าง การเปลี่ยนแปลงนั้นสมเหตุสมผลหรือไม่ขึ้นอยู่กับคำถามที่พยายามตอบ ." [43] : 82 

วิธีการ

สถิติเชิงพรรณนา

สถิติพรรณนา (ในความ หมายของ คำนามนับ ) เป็นสถิติสรุปที่อธิบายหรือสรุปคุณสมบัติของการรวบรวมข้อมูลเชิง ปริมาณ [44]ในขณะที่สถิติพรรณนาใน ความหมายของ คำนามโดยรวมคือกระบวนการของการใช้และวิเคราะห์สถิติเหล่านั้น สถิติเชิงพรรณนาแตกต่างจากสถิติอนุมาน (หรือสถิติอุปนัย) ในสถิติพรรณนานั้นมีจุดมุ่งหมายเพื่อสรุปตัวอย่างแทนที่จะใช้ข้อมูลเพื่อเรียนรู้เกี่ยวกับประชากรที่กลุ่มตัวอย่างข้อมูลคิดว่าจะเป็นตัวแทน

สถิติอนุมาน

การ อนุมานทางสถิติเป็นกระบวนการของการใช้การวิเคราะห์ข้อมูลเพื่อสรุปคุณสมบัติของการแจกแจงความน่าจะเป็น พื้นฐาน [45]การวิเคราะห์ทางสถิติเชิงอนุมานอนุมานคุณสมบัติของประชากรตัวอย่างเช่น โดยการทดสอบสมมติฐานและการหาค่าประมาณการ สันนิษฐานว่าชุดข้อมูลที่สังเกตได้นั้นสุ่มตัวอย่างจากประชากรจำนวนมากขึ้น สถิติเชิงอนุมานสามารถเปรียบเทียบได้กับ สถิติ เชิงพรรณนา สถิติเชิงพรรณนาเกี่ยวข้องกับคุณสมบัติของข้อมูลที่สังเกตได้เพียงอย่างเดียว ไม่ได้ขึ้นอยู่กับสมมติฐานที่ว่าข้อมูลมาจากประชากรจำนวนมากขึ้น

คำศัพท์และทฤษฎีสถิติอนุมาน

สถิติ ประมาณการ และปริมาณการพิจาณา

พิจารณาตัวแปรสุ่มแบบกระจายอย่างเหมือนกัน (IID) ที่เป็นอิสระด้วยการแจกแจงความน่าจะ เป็นที่กำหนด: การอนุมานทางสถิติมาตรฐานและทฤษฎีการประมาณค่ากำหนดตัวอย่างสุ่มเป็นเวกเตอร์สุ่ม ที่ กำหนดโดยเวกเตอร์คอลัมน์ของตัวแปร IID เหล่านี้ [46]ประชากรที่กำลังตรวจสอบอธิบายโดยการแจกแจงความน่าจะเป็นที่อาจไม่ทราบพารามิเตอร์

สถิติคือตัวแปรสุ่มที่เป็นฟังก์ชันของตัวอย่างสุ่ม แต่ไม่ใช่ฟังก์ชันของพารามิเตอร์ที่ไม่รู้จัก อย่างไรก็ตาม การแจกแจงความน่าจะเป็นของสถิติอาจมีพารามิเตอร์ที่ไม่รู้จัก พิจารณาตอนนี้เป็นฟังก์ชันของพารามิเตอร์ที่ไม่รู้จัก: ตัวประมาณคือสถิติที่ใช้ในการประมาณฟังก์ชันดังกล่าว ตัวประมาณที่ใช้กันทั่วไป ได้แก่ค่าเฉลี่ยตัวอย่าง ความแปรปรวนตัวอย่างที่ไม่เอนเอียงและความแปรปรวนร่วมของ ตัวอย่าง

ตัวแปรสุ่มที่เป็นฟังก์ชันของตัวอย่างสุ่มและของพารามิเตอร์ที่ไม่รู้จัก แต่การแจกแจงความน่าจะเป็นไม่ได้ขึ้นอยู่กับพารามิเตอร์ที่ไม่รู้จักจะเรียกว่าปริมาณพิวอทอลหรือเดือย pivots ที่ใช้กันอย่างแพร่หลาย ได้แก่z-scoreสถิติไคสแควร์ และ ค่า tของนักเรียน

ระหว่างตัวประมาณสองตัวของพารามิเตอร์ที่กำหนด ตัวหนึ่งที่มีค่าความคลาดเคลื่อนกำลังสองเฉลี่ย ต่ำกว่า จะถือว่ามีประสิทธิภาพมากกว่า นอกจากนี้ ตัวประมาณค่าจะไม่มีความเอนเอียงหากค่าที่คาดหวังไว้เท่ากับค่าที่แท้จริงของพารามิเตอร์ที่ไม่รู้จักที่กำลังประมาณค่า และไม่มีอคติแบบไม่มีซีมโทติคัลหากค่าที่คาดหวังมาบรรจบกันที่ขีดจำกัดของค่าที่แท้จริงของพารามิเตอร์ดังกล่าว

คุณสมบัติอื่นๆ ที่พึงประสงค์สำหรับตัวประมาณได้แก่: ตัวประมาณ UMVUEที่มีความแปรปรวนต่ำที่สุดสำหรับค่าที่เป็นไปได้ทั้งหมดของพารามิเตอร์ที่จะประมาณ (ซึ่งมักจะเป็นคุณสมบัติที่ง่ายกว่าในการตรวจสอบมากกว่าประสิทธิภาพ) และตัวประมาณที่สอดคล้องกันซึ่งมาบรรจบกันในความน่าจะเป็นของค่าจริงของพารามิเตอร์ดังกล่าว .

สิ่งนี้ยังคงทิ้งคำถามว่าจะหาตัวประมาณได้อย่างไรในสถานการณ์ที่กำหนดและดำเนินการคำนวณ มีการเสนอวิธีการหลายวิธี: วิธีของโมเมนต์ วิธี ความน่าจะเป็นสูงสุดวิธีกำลังสองน้อยที่สุดและวิธีการล่าสุดในการประมาณสมการ

สมมติฐานว่างและสมมติฐานทางเลือก

การตีความข้อมูลทางสถิติมักเกี่ยวข้องกับการพัฒนาสมมติฐานว่างซึ่งโดยปกติ (แต่ไม่จำเป็น) ว่าไม่มีความสัมพันธ์ระหว่างตัวแปรหรือไม่มีการเปลี่ยนแปลงเกิดขึ้นเมื่อเวลาผ่านไป [47] [48]

ภาพประกอบที่ดีที่สุดสำหรับสามเณรคือ สถานการณ์ที่การพิจารณาคดีอาญาต้องเผชิญ สมมติฐานว่าง H 0ยืนยันว่าจำเลยเป็นผู้บริสุทธิ์ ในขณะที่สมมติฐานทางเลือก H 1ยืนยันว่าจำเลยมีความผิด คำฟ้องเกิดขึ้นเพราะต้องสงสัยในความผิด H 0 (สถานะที่เป็นอยู่) ยืนหยัดตรงข้ามกับ H 1และคงไว้เว้นแต่ H 1จะได้รับการสนับสนุนจากหลักฐาน "เหนือข้อสงสัยที่สมเหตุสมผล" อย่างไรก็ตาม "ความล้มเหลวในการปฏิเสธ H 0 " ในกรณีนี้ไม่ได้หมายความถึงความไร้เดียงสา แต่เพียงว่าหลักฐานไม่เพียงพอที่จะตัดสิน ดังนั้นคณะลูกขุนจึงไม่จำเป็นต้องยอมรับ H 0แต่ล้มเหลวในการปฏิเสธ H0 . แม้ว่าเราจะไม่สามารถ "พิสูจน์" สมมติฐานที่เป็นโมฆะได้ แต่เราสามารถทดสอบว่าเป็นจริงได้ใกล้เคียงเพียงใดด้วยการทดสอบกำลังซึ่งจะทดสอบ ข้อผิดพลาด ประเภท II

สิ่งที่นักสถิติเรียกว่าสมมติฐานทางเลือกเป็นเพียงสมมติฐานที่ขัดแย้งกับสมมติฐานว่าง

ผิดพลาด

ทำงานจากสมมติฐานว่างข้อผิดพลาดสองประเภทกว้าง ๆ ได้รับการยอมรับ:

  • ข้อผิดพลาดประเภทที่ 1 ที่สมมติฐานว่างถูกปฏิเสธอย่างไม่ถูกต้อง ให้ "ผลบวกที่ผิดพลาด"
  • ข้อผิดพลาดประเภท IIที่สมมติฐานว่างไม่สามารถปฏิเสธได้ และพลาดความแตกต่างที่แท้จริงระหว่างประชากร ทำให้เกิด "ค่าลบเท็จ"

ส่วนเบี่ยงเบนมาตรฐานหมายถึงขอบเขตที่การสังเกตแต่ละรายการในกลุ่มตัวอย่างแตกต่างจากค่ากลาง เช่น ค่าเฉลี่ยของกลุ่มตัวอย่างหรือค่าเฉลี่ยประชากร ในขณะที่ข้อผิดพลาดมาตรฐานหมายถึงค่าประมาณความแตกต่างระหว่างค่าเฉลี่ยตัวอย่างและค่าเฉลี่ยประชากร

ข้อผิดพลาดทางสถิติคือจำนวนที่การสังเกตแตกต่างจากค่าที่คาดไว้ ค่าคงเหลือคือปริมาณการสังเกตที่แตกต่างจากค่าที่ตัวประมาณของค่าที่คาดหวังจะสมมติขึ้นกับตัวอย่างที่กำหนด (เรียกอีกอย่างว่าการคาดคะเน)

ค่าคลาดเคลื่อนกำลังสองเฉลี่ยใช้เพื่อให้ได้ ตัวประมาณที่ มีประสิทธิภาพซึ่งเป็นคลาสของตัวประมาณที่ใช้กันอย่างแพร่หลาย ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองเป็นเพียงสแควร์รูทของค่าคลาดเคลื่อนกำลังสองเฉลี่ย

ช่องสี่เหลี่ยมเล็กสุดพอดี: จุดที่จะติดตั้งสีแดง เส้นที่พอดีสีน้ำเงิน

วิธีการทางสถิติหลายวิธีพยายามที่จะลดผลรวมที่เหลือของกำลังสองและสิ่งเหล่านี้เรียกว่า " วิธีของกำลังสองน้อยที่สุด " ในทางตรงกันข้ามกับการเบี่ยงเบนสัมบูรณ์น้อยที่สุด ข้อผิดพลาดแบบหลังให้น้ำหนักที่เท่ากันสำหรับข้อผิดพลาดขนาดเล็กและขนาดใหญ่ ในขณะที่ข้อผิดพลาดแบบแรกให้น้ำหนักที่มากกว่าสำหรับข้อผิดพลาดที่มีขนาดใหญ่ ผลรวมของกำลังสองที่เหลือก็สามารถ หา อนุพันธ์ได้ ซึ่งให้คุณสมบัติที่มีประโยชน์สำหรับการถดถอย กำลังสองน้อยที่สุดที่ใช้กับการถดถอยเชิงเส้นเรียกว่า วิธี กำลังสองน้อยที่สุดธรรมดาและกำลังสองน้อยที่สุดที่ใช้กับการถดถอยแบบไม่เชิงเส้นเรียกว่ากำลังสองน้อยที่สุดที่ไม่เป็นเชิงเส้น. นอกจากนี้ในแบบจำลองการถดถอยเชิงเส้น ส่วนที่ไม่ได้กำหนดของแบบจำลองนั้นเรียกว่าระยะข้อผิดพลาด การรบกวน หรือสัญญาณรบกวน ทั้งการถดถอยเชิงเส้นและการถดถอยแบบไม่เชิงเส้นถูกกล่าวถึงในพหุนามกำลังสองน้อยที่สุดซึ่งยังอธิบายความแปรปรวนในการทำนายของตัวแปรตาม (แกน y) เป็นฟังก์ชันของตัวแปรอิสระ (แกน x) และการเบี่ยงเบน (ข้อผิดพลาด สัญญาณรบกวน รบกวน) จากเส้นโค้งประมาณ (พอดี)

กระบวนการวัดที่สร้างข้อมูลทางสถิติอาจมีข้อผิดพลาดเช่นกัน ข้อผิดพลาดเหล่านี้จำนวนมากจัดอยู่ในประเภทสุ่ม (สัญญาณรบกวน) หรืออย่างเป็นระบบ ( อคติ ) แต่ข้อผิดพลาดประเภทอื่นๆ (เช่น ข้อผิดพลาด เช่น เมื่อนักวิเคราะห์รายงานหน่วยที่ไม่ถูกต้อง) ก็มีความสำคัญเช่นกัน การมีอยู่ของข้อมูลที่ขาดหายไปหรือการเซ็นเซอร์อาจส่งผลให้เกิดการประมาณการที่ลำเอียงและได้มีการพัฒนาเทคนิคเฉพาะเพื่อแก้ไขปัญหาเหล่านี้ [49]

การประมาณช่วงเวลา
ช่วงความเชื่อมั่น : เส้นสีแดงคือค่าจริงสำหรับค่าเฉลี่ยในตัวอย่างนี้ เส้นสีน้ำเงินคือช่วงความเชื่อมั่นแบบสุ่มสำหรับการรับรู้ 100 ครั้ง

การศึกษาส่วนใหญ่สุ่มตัวอย่างเพียงส่วนหนึ่งของประชากร ดังนั้นผลลัพธ์จึงไม่ได้แสดงถึงประชากรทั้งหมดทั้งหมด การประมาณการใดๆ ที่ได้รับจากกลุ่มตัวอย่างจะเป็นการประมาณค่าประชากรโดยประมาณเท่านั้น ช่วงความเชื่อมั่นช่วยให้นักสถิติสามารถแสดงว่าค่าประมาณตัวอย่างตรงกับค่าจริงในประชากรทั้งหมดมากเพียงใด มักแสดงเป็นช่วงความเชื่อมั่น 95% อย่างเป็นทางการ ช่วงความเชื่อมั่น 95% สำหรับค่าหนึ่งๆ คือช่วงที่หากสุ่มตัวอย่างและการวิเคราะห์ซ้ำภายใต้เงื่อนไขเดียวกัน (โดยให้ชุดข้อมูลต่างกัน) ช่วงเวลาจะรวมค่าจริง (ประชากร) ใน 95% ของกรณีที่เป็นไปได้ทั้งหมด . นี่ไม่ได้หมายความว่าความน่าจะเป็นที่ค่าจริงอยู่ในช่วงความเชื่อมั่นคือ 95% จากคนใช้บ่อยมุมมอง การอ้างสิทธิ์ดังกล่าวไม่สมเหตุสมผลเลย เนื่องจากค่าที่แท้จริงไม่ใช่ตัวแปรสุ่ม ค่าจริงอยู่หรือไม่อยู่ในช่วงที่กำหนด อย่างไรก็ตาม เป็นความจริงที่ ก่อนที่ข้อมูลใด ๆ จะถูกสุ่มตัวอย่างและได้รับแผนสำหรับวิธีสร้างช่วงความเชื่อมั่น ความน่าจะเป็นคือ 95% ที่ช่วงที่ยังไม่ได้คำนวณจะครอบคลุมค่าที่แท้จริง ณ จุดนี้ ขีดจำกัดของช่วงเวลายังเป็นตัวแปรสุ่มที่รอ การสังเกต แนวทางหนึ่งที่ให้ค่าช่วงที่สามารถตีความได้ว่ามีความน่าจะเป็นของการมีค่าที่แท้จริงคือการใช้ช่วงที่น่าเชื่อถือจากสถิติแบบเบย์ : แนวทางนี้ขึ้นอยู่กับวิธีการตีความที่แตกต่างกันว่า "ความน่าจะเป็น" มีความหมายว่าอะไรนั่นคือความน่าจะเป็นแบบเบย์

โดยหลักการแล้ว ช่วงความเชื่อมั่นสามารถเป็นแบบสมมาตรหรือไม่สมมาตรก็ได้ ช่วงเวลาอาจไม่สมมาตรเนื่องจากทำงานเป็นขอบเขตล่างหรือบนสำหรับพารามิเตอร์ (ช่วงด้านซ้ายหรือช่วงด้านขวา) แต่ก็อาจไม่สมมาตรได้เช่นกัน เนื่องจากช่วงสองด้านสร้างการละเมิดความสมมาตรรอบค่าประมาณ บางครั้งขอบเขตของช่วงความเชื่อมั่นจะไปถึงโดยไม่มีซีมโทติค และใช้เพื่อประมาณขอบเขตที่แท้จริง

ความสำคัญ

สถิติไม่ค่อยให้คำตอบแบบใช่/ไม่ใช่แบบง่ายๆ สำหรับคำถามภายใต้การวิเคราะห์ การตีความมักจะลงมาที่ระดับของนัยสำคัญทางสถิติที่ใช้กับตัวเลข และมักหมายถึงความน่าจะเป็นของค่าที่ปฏิเสธสมมติฐานว่างอย่างถูกต้อง (บางครั้งเรียกว่าp-value )

ในกราฟนี้ เส้นสีดำคือการแจกแจงความน่าจะเป็นสำหรับสถิติการทดสอบบริเวณวิกฤตคือชุดของค่าทางด้านขวาของจุดข้อมูลที่สังเกตได้ (ค่าที่สังเกตได้ของสถิติการทดสอบ) และค่าpจะแสดงด้วยพื้นที่สีเขียว

แนวทางมาตรฐาน[46]คือการทดสอบสมมติฐานว่างกับสมมติฐานทางเลือก บริเวณวิกฤตคือชุดของค่าของตัวประมาณที่นำไปสู่การหักล้างสมมติฐานว่าง ความน่าจะเป็นของข้อผิดพลาดประเภทที่ 1 จึงเป็นความน่าจะเป็นที่ตัวประมาณค่าอยู่ในเขตวิกฤต เนื่องจากสมมติฐานว่างเป็นจริง ( นัยสำคัญทางสถิติ ) และความน่าจะเป็นของข้อผิดพลาดประเภทที่ 2 คือความน่าจะเป็นที่ตัวประมาณนั้นไม่อยู่ในขอบเขตวิกฤตที่กำหนด ว่าสมมติฐานทางเลือกนั้นเป็นจริง กำลัง ทางสถิติของการทดสอบคือความน่าจะเป็นที่จะปฏิเสธสมมติฐานว่างอย่างถูกต้องเมื่อสมมติฐานว่างเป็นเท็จ

การอ้างอิงถึงนัยสำคัญทางสถิติไม่ได้หมายความว่าผลลัพธ์โดยรวมมีนัยสำคัญในแง่โลกแห่งความเป็นจริง ตัวอย่างเช่น ในการศึกษาขนาดใหญ่ของยา อาจแสดงให้เห็นว่ายามีผลดีที่มีนัยสำคัญทางสถิติแต่มีขนาดเล็กมาก โดยที่ยาไม่น่าจะช่วยผู้ป่วยได้อย่างเห็นได้ชัด

แม้ว่าโดยหลักการแล้ว ระดับนัยสำคัญทางสถิติที่ยอมรับได้อาจถูกโต้แย้งระดับนัยสำคัญคือค่า p ที่ใหญ่ที่สุดที่ทำให้การทดสอบปฏิเสธสมมติฐานว่าง การทดสอบนี้มีเหตุผลเทียบเท่ากับการบอกว่าค่า p คือความน่าจะเป็น โดยสมมติว่าสมมติฐานว่างเป็นจริง จากการสังเกตผลลัพธ์อย่างน้อยที่สุดเท่าสถิติการทดสอบ ดังนั้น ยิ่งระดับนัยสำคัญน้อยกว่า ความน่าจะเป็นที่จะเกิดข้อผิดพลาดประเภทที่ 1 ก็จะยิ่งต่ำลง

ปัญหาบางอย่างมักเกี่ยวข้องกับกรอบนี้ (ดูการวิจารณ์การทดสอบสมมติฐาน ):

  • ความแตกต่างที่มีนัยสำคัญทางสถิติสูงยังคงไม่มีนัยสำคัญในทางปฏิบัติ แต่เป็นไปได้ที่จะกำหนดการทดสอบอย่างเหมาะสมเพื่อพิจารณาสิ่งนี้ การตอบสนองหนึ่งเกี่ยวข้องกับการทำมากกว่าการรายงานเฉพาะระดับนัยสำคัญเพื่อรวมค่าpเมื่อรายงานว่ามีการปฏิเสธหรือยอมรับสมมติฐานหรือไม่ อย่างไรก็ตาม ค่า p ไม่ได้ระบุขนาดหรือความสำคัญของผลกระทบที่สังเกตพบ และยังอาจดูเหมือนเกินจริงถึงความสำคัญของความแตกต่างเล็กน้อยในการศึกษาขนาดใหญ่ วิธีที่ดีกว่าและแพร่หลายมากขึ้นคือการรายงาน ช่วง ความเชื่อมั่น แม้ว่าสิ่งเหล่านี้จะมาจากการคำนวณแบบเดียวกับการทดสอบสมมติฐานหรือp-ค่า อธิบายทั้งขนาดของผลกระทบและความไม่แน่นอนที่อยู่รายรอบ
  • ความเข้าใจผิดของเงื่อนไขการเปลี่ยนผ่าน หรือที่เรียกว่าการเข้าใจผิดของพนักงานอัยการ : การวิพากษ์วิจารณ์เกิดขึ้นเนื่องจากวิธีการทดสอบสมมติฐานบังคับให้สมมติฐานหนึ่ง ( สมมติฐานว่าง ) เป็นที่โปรดปราน เนื่องจากสิ่งที่ได้รับการประเมินคือความน่าจะเป็นของผลลัพธ์ที่สังเกตได้จากสมมติฐานที่เป็นโมฆะและไม่ใช่ความน่าจะเป็นของ สมมติฐานว่างจากผลลัพธ์ที่สังเกตได้ ทางเลือกอื่นสำหรับวิธีนี้คือการอนุมานแบบเบย์แม้ว่าจะต้องสร้างความน่าจะเป็นก่อนก็ตาม [50]
  • การปฏิเสธสมมติฐานว่างไม่ได้พิสูจน์สมมติฐานทางเลือกโดยอัตโนมัติ
  • เนื่องจากทุกอย่างในสถิติอนุมานขึ้นอยู่กับขนาดตัวอย่าง ดังนั้นภายใต้ ค่า p ของ fat tailอาจคำนวณผิดพลาดอย่างร้ายแรง [ ต้องการคำชี้แจง ]
ตัวอย่าง

การทดสอบและขั้นตอน ทางสถิติที่รู้จักกันดี ได้แก่

การวิเคราะห์ข้อมูลเชิงสำรวจ

การวิเคราะห์ข้อมูลเชิงสำรวจ ( EDA ) เป็นแนวทางในการวิเคราะห์ ชุดข้อมูลเพื่อสรุปคุณลักษณะหลักของชุดข้อมูล ซึ่งมักใช้วิธีการมองเห็น แบบจำลองทางสถิติสามารถใช้ได้หรือไม่ แต่โดยหลักแล้ว EDA มีไว้สำหรับการดูว่าข้อมูลสามารถบอกอะไรเราได้บ้าง นอกเหนือจากการสร้างแบบจำลองที่เป็นทางการหรืองานทดสอบสมมติฐาน

ใช้ผิดวิธี

การใช้สถิติในทางที่ผิดสามารถก่อให้เกิดข้อผิดพลาดที่ละเอียดอ่อนแต่ร้ายแรงในคำอธิบายและการตีความ—ในแง่ที่ละเอียดอ่อนแม้ผู้เชี่ยวชาญที่มีประสบการณ์จะทำให้เกิดข้อผิดพลาดดังกล่าว และร้ายแรงในแง่ที่พวกเขาสามารถนำไปสู่ข้อผิดพลาดในการตัดสินใจที่ร้ายแรง ตัวอย่างเช่น นโยบายทางสังคม การปฏิบัติทางการแพทย์ และความน่าเชื่อถือของโครงสร้าง เช่น สะพาน ล้วนอาศัยการใช้สถิติอย่างเหมาะสม

ถึงแม้จะใช้เทคนิคทางสถิติอย่างถูกต้อง แต่ผลลัพธ์ก็อาจตีความได้ยากสำหรับผู้ที่ไม่มีความชำนาญ นัยสำคัญทางสถิติของแนวโน้มในข้อมูล—ซึ่งวัดขอบเขตที่แนวโน้มอาจเกิดจากการแปรผันแบบสุ่มในกลุ่มตัวอย่าง—อาจหรือไม่เห็นด้วยกับความหมายโดยสัญชาตญาณของนัยสำคัญ ชุดทักษะทางสถิติพื้นฐาน (และความสงสัย) ที่ผู้คนจำเป็นต้องจัดการกับข้อมูลในชีวิตประจำวันอย่างถูกต้องเรียกว่า การ รู้หนังสือ ทาง สถิติ

มีการรับรู้ทั่วไปว่าความรู้ทางสถิติถูกใช้อย่างจงใจโดยจงใจบ่อยครั้งเกินไปโดยหาวิธีที่จะตีความเฉพาะข้อมูลที่เป็นประโยชน์ต่อผู้นำเสนอเท่านั้น [51]ความไม่ไว้วางใจและความเข้าใจผิดของสถิติเกี่ยวข้องกับใบเสนอราคา " มีการโกหกสามประเภท: การโกหก การโกหกที่สาปแช่ง และสถิติ " การใช้สถิติในทางที่ผิดอาจเป็นได้ทั้งโดยไม่ได้ตั้งใจและโดยเจตนา และหนังสือHow to Lie with Statistics [ 51]โดยDarrell Huffได้สรุปข้อควรพิจารณาต่างๆ ในความพยายามที่จะให้ความกระจ่างเกี่ยวกับการใช้และการใช้สถิติในทางที่ผิด จะมีการทบทวนเทคนิคทางสถิติที่ใช้ในสาขาเฉพาะ (เช่น Warne, Lazo, Ramos และ Ritter (2012))[52]

วิธีหลีกเลี่ยงการใช้สถิติในทางที่ผิด ได้แก่ การใช้ไดอะแกรมที่เหมาะสมและการหลีกเลี่ยงอคติ [53] การใช้ใน ทางที่ผิดอาจเกิดขึ้นได้เมื่อมีการสรุปข้อสรุปและอ้างว่าเป็นตัวแทนของมากกว่าที่เป็นจริง โดยมักจะมองข้ามอคติในการสุ่มตัวอย่างทั้งโดยเจตนาหรือโดยไม่รู้ตัว [54]กราฟแท่งอาจเป็นไดอะแกรมที่ง่ายที่สุดในการใช้และทำความเข้าใจ และสามารถสร้างขึ้นด้วยมือหรือด้วยโปรแกรมคอมพิวเตอร์อย่างง่าย [53]น่าเสียดาย คนส่วนใหญ่ไม่ได้มองหาอคติหรือข้อผิดพลาด ดังนั้นจึงไม่สังเกตเห็น ดังนั้น ผู้คนมักจะเชื่อว่าบางสิ่งเป็นความจริง แม้ว่าจะไม่ได้แสดง ให้เห็น อย่างชัดเจนก็ตาม [54]เพื่อให้ข้อมูลที่รวบรวมจากสถิติมีความน่าเชื่อถือและแม่นยำ กลุ่มตัวอย่างที่นำมาจะต้องเป็นตัวแทนของทั้งหมด [55]ตามคำกล่าวของ Huff "ความเชื่อถือได้ของตัวอย่างสามารถถูกทำลายได้โดย [ลำเอียง]... ปล่อยให้ตัวเองมีความสงสัยในระดับหนึ่ง" [56]

เพื่อช่วยในการทำความเข้าใจสถิติ Huff ได้เสนอชุดคำถามที่จะถามในแต่ละกรณี: [51]

  • ใครพูดอย่างนั้น? (เขามีขวานสำหรับบดไหม)
  • เขา / เธอรู้ได้อย่างไร? (เขา/เธอมีแหล่งข้อมูลที่จะทราบข้อเท็จจริงหรือไม่)
  • สิ่งที่ขาดหายไป? (เขา / เธอให้ภาพที่สมบูรณ์แก่เราหรือไม่)
  • มีใครเปลี่ยนเรื่องไหม (เขา/เธอเสนอคำตอบที่ถูกต้องให้กับปัญหาที่ผิดหรือไม่)
  • มันสมเหตุสมผลหรือไม่? (ข้อสรุปของเขา/เธอมีเหตุผลและสอดคล้องกับสิ่งที่เรารู้อยู่แล้วหรือไม่)
ปัญหา ตัวแปรสับสน : XและYอาจมีความสัมพันธ์กัน ไม่ใช่เพราะมีความสัมพันธ์เชิงสาเหตุระหว่างกัน แต่เนื่องจากทั้งคู่ขึ้นอยู่กับตัวแปรที่สามZ Zเรียกว่าปัจจัยที่ทำให้เกิดความสับสน

การตีความที่ผิด: ความสัมพันธ์

แนวคิดเรื่องสหสัมพันธ์มีความสำคัญอย่างยิ่งต่อความสับสนที่อาจเกิดขึ้นได้ การวิเคราะห์ทางสถิติของชุดข้อมูลมักเผยให้เห็นว่าตัวแปร (คุณสมบัติ) สองตัวแปรของประชากรที่อยู่ระหว่างการพิจารณามีแนวโน้มที่จะแปรผันไปด้วยกัน ราวกับว่าพวกมันเชื่อมต่อกัน ตัวอย่างเช่น การศึกษารายได้ต่อปีโดยพิจารณาจากอายุที่เสียชีวิตด้วย อาจพบว่าคนจนมีแนวโน้มอายุสั้นกว่าคนร่ำรวย ตัวแปรทั้งสองมีความสัมพันธ์กัน อย่างไรก็ตามอาจเป็นสาเหตุของกันและกันหรือไม่ก็ได้ ปรากฏการณ์สหสัมพันธ์อาจเกิดจากปรากฏการณ์ที่สามซึ่งก่อนหน้านี้ยังไม่ได้พิจารณา เรียกว่า ตัวแปรแฝง หรือตัวแปรสับสน. ด้วยเหตุผลนี้ จึงไม่มีวิธีใดที่จะอนุมานถึงความสัมพันธ์เชิงสาเหตุระหว่างตัวแปรทั้งสองได้ในทันที

แอปพลิเคชัน

สถิติประยุกต์ สถิติเชิงทฤษฎี และสถิติทางคณิตศาสตร์

สถิติประยุกต์ ซึ่งบางครั้งเรียกว่าสถิติศาสตร์[57]ประกอบด้วยสถิติพรรณนาและการประยุกต์ใช้สถิติอนุมาน [58] [59] สถิติเชิงทฤษฎีเกี่ยวข้องกับข้อโต้แย้งเชิงตรรกะที่อยู่ภายใต้การให้เหตุผลในการอนุมานทางสถิติเช่นเดียวกับ สถิติ ทางคณิตศาสตร์ ที่ครอบคลุม สถิติทางคณิตศาสตร์ไม่เพียงแต่รวมการจัดการของการแจกแจงความน่าจะเป็นที่จำเป็นสำหรับการหาผลลัพธ์ที่เกี่ยวข้องกับวิธีการประมาณค่าและการอนุมานเท่านั้น แต่ยังรวมถึงแง่มุมต่างๆ ของสถิติเชิงคำนวณและการออกแบบการทดลองด้วย

ที่ปรึกษาทางสถิติสามารถช่วยองค์กรและบริษัทที่ไม่มีความเชี่ยวชาญเฉพาะด้านที่เกี่ยวข้องกับคำถามเฉพาะของตน

การเรียนรู้ของเครื่องและการขุดข้อมูล

โมเดล การเรียนรู้ของเครื่องเป็นแบบจำลองทางสถิติและความน่าจะเป็นที่จับรูปแบบในข้อมูลผ่านการใช้อัลกอริธึมการคำนวณ

สถิติทางวิชาการ

สถิติใช้ได้กับสาขาวิชาต่างๆมากมาย รวมถึงธรรมชาติและสังคมศาสตร์รัฐบาล และธุรกิจ สถิติธุรกิจใช้วิธีทางสถิติในทางเศรษฐมิติการตรวจสอบการผลิต และการดำเนินงาน รวมถึงการปรับปรุงบริการและการวิจัยการตลาด [60]การศึกษาวารสาร 2 ฉบับทางชีววิทยาเขตร้อนพบว่าการทดสอบทางสถิติ 12 แบบที่ใช้บ่อยที่สุดคือAnalysis of Variance (ANOVA), Chi-Square Test , Student's T Test , Linear Regression , Pearson's Correlation Coefficient , Mann-Whitney U Testการทดสอบ Kruskal-Wallis ดัชนีความหลากหลายของแชนนอน การทดสอบของทูคีย์ การวิเคราะห์กลุ่ม การทดสอบความสัมพันธ์ของ สเปียร์แมนและการวิเคราะห์องค์ประกอบหลัก [61]

หลักสูตรสถิติทั่วไปครอบคลุมสถิติเชิงพรรณนา ความน่าจะเป็น การแจกแจงทวินามและปกติ การทดสอบสมมติฐานและช่วงความเชื่อมั่นการถดถอยเชิงเส้นและสหสัมพันธ์ [62]หลักสูตรสถิติพื้นฐานสมัยใหม่สำหรับนักศึกษาระดับปริญญาตรีมุ่งเน้นไปที่การเลือกการทดสอบที่ถูกต้อง การตีความผลลัพธ์ และการใช้ซอฟต์แวร์สถิติฟรี [61]

การคำนวณทางสถิติ

การเพิ่มพลังประมวลผลอย่างรวดเร็วและต่อเนื่องตั้งแต่ช่วงครึ่งหลังของศตวรรษที่ 20 มีผลกระทบอย่างมากต่อการปฏิบัติด้านวิทยาศาสตร์สถิติ แบบจำลองทางสถิติช่วงแรกๆ มักมาจากคลาสของโมเดลเชิงเส้นเสมอ แต่คอมพิวเตอร์ที่ทรงพลัง ประกอบกับอัลกอริธึม เชิงตัวเลขที่เหมาะสม ทำให้เกิดความสนใจเพิ่มขึ้นในโมเดลที่ไม่เป็นเชิงเส้น (เช่นโครงข่ายประสาทเทียม ) เช่นเดียวกับการสร้างประเภทใหม่ เช่นโมเดลเชิงเส้นตรงทั่วไปและรุ่นหลายระดับ

พลังการประมวลผลที่เพิ่มขึ้นยังนำไปสู่ความนิยมที่เพิ่มขึ้นของวิธีการที่เน้นการคำนวณโดยอาศัยการสุ่มตัวอย่างซ้ำเช่นการทดสอบการเปลี่ยนแปลงและบูตสแตรป ในขณะที่เทคนิคต่างๆ เช่นการสุ่มตัวอย่างแบบกิ๊บส์ทำให้การใช้แบบจำลองเบย์เซียนเป็นไปได้มากขึ้น การปฏิวัติทางคอมพิวเตอร์มีผลกระทบต่ออนาคตของสถิติโดยเน้นที่สถิติ "เชิงทดลอง" และ "เชิงประจักษ์" ใหม่ ขณะนี้มี ซอฟต์แวร์สถิติทั้งแบบทั่วไปและแบบพิเศษจำนวนมากพร้อมใช้งานแล้ว ตัวอย่างของซอฟต์แวร์ที่มีความสามารถในการคำนวณทางสถิติที่ซับซ้อน ได้แก่ โปรแกรม เช่นMathematica , SAS , SPSSและอาร์

สถิติธุรกิจ

ในธุรกิจ "สถิติ" เป็น เครื่องมือ สนับสนุน การจัดการและการตัดสินใจที่ใช้กันอย่างแพร่หลาย โดยเฉพาะอย่างยิ่งนำไปใช้ในการจัดการทางการเงิน การจัดการการตลาดและการผลิตบริการและการจัดการการดำเนินงาน [63] [64]สถิติยังถูกใช้อย่างมากในการจัดการบัญชีและการตรวจสอบ สาขาวิชาวิทยาการจัดการกำหนดการใช้สถิติและคณิตศาสตร์อื่นๆ อย่างเป็นทางการในธุรกิจ ( เศรษฐมิติคือการประยุกต์ใช้วิธีการทางสถิติกับข้อมูลทางเศรษฐศาสตร์เพื่อให้เนื้อหาเชิงประจักษ์แก่ความสัมพันธ์ทางเศรษฐกิจ .)

หลักสูตร "สถิติธุรกิจ" โดยทั่วไปมีไว้สำหรับวิชาเอกธุรกิจและครอบคลุม[65] สถิติพรรณนา ( การ รวบรวมคำอธิบาย การวิเคราะห์ และการสรุปข้อมูล) ความน่าจะเป็น (โดยทั่วไปคือการแจกแจงแบบทวินามและ การแจกแจงแบบ ปกติ ) การทดสอบสมมติฐานและช่วงความเชื่อมั่นการถดถอยเชิงเส้นและสหสัมพันธ์ หลักสูตร (ติดตาม) อาจรวมถึงการพยากรณ์อนุกรมเวลา ต้นไม้ การตัดสินใจ การถดถอย เชิงเส้นพหุคูณและหัวข้ออื่นๆ จากการวิเคราะห์ทางธุรกิจโดยทั่วไป ดูเพิ่มเติมที่คณิตศาสตร์ธุรกิจ § ระดับมหาวิทยาลัยโปรแกรมการรับรองระดับมืออาชีพเช่นCFAมักรวมหัวข้อต่างๆ ไว้ในสถิติ

สถิติประยุกต์กับคณิตศาสตร์หรือศิลปศาสตร์

ตามเนื้อผ้า สถิติเกี่ยวข้องกับการอนุมานโดยใช้วิธีการกึ่งมาตรฐานซึ่งเป็น "การเรียนรู้ที่จำเป็น" ในวิทยาศาสตร์ส่วนใหญ่ [ ต้องการอ้างอิง ]ประเพณีนี้เปลี่ยนไปด้วยการใช้สถิติในบริบทที่ไม่อนุมาน สิ่งที่ครั้งหนึ่งเคยถูกมองว่าเป็นเรื่องไร้สาระ ซึ่งถ่ายในหลายๆ สาขาวิชาเป็นข้อกำหนดระดับปริญญา กลับถูกมองอย่างกระตือรือร้น [ ตามใคร? ]เริ่มแรกเย้ยหยันโดยนักคณิตศาสตร์บางคน ตอนนี้ถือว่าเป็นวิธีการที่สำคัญในบางพื้นที่

  • ในทฤษฎีจำนวนแผนภาพกระจายของข้อมูลที่สร้างโดยฟังก์ชันการกระจายอาจถูกแปลงด้วยเครื่องมือที่คุ้นเคยซึ่งใช้ในสถิติเพื่อแสดงรูปแบบที่ซ่อนอยู่ ซึ่งอาจนำไปสู่สมมติฐานได้
  • วิธีการทำนายสถิติในการพยากรณ์ ที่ รวมทฤษฎีความโกลาหลและเรขาคณิตเศษส่วน เข้าด้วย กันสามารถใช้เพื่อสร้างงานวิดีโอได้ [66]
  • ศิลปะกระบวนการของJackson Pollockอาศัยการทดลองทางศิลปะที่มีการเปิดเผยการแจกแจงพื้นฐานในธรรมชาติ [67]ด้วยการถือกำเนิดของคอมพิวเตอร์ วิธีการทางสถิติถูกนำมาใช้เพื่อทำให้กระบวนการทางธรรมชาติที่ขับเคลื่อนด้วยการกระจายเป็นแบบแผนเพื่อสร้างและวิเคราะห์วิดีโออาร์ตที่เคลื่อนไหว [ ต้องการการอ้างอิง ]
  • อาจใช้วิธีการทางสถิติในเชิงทำนายในศิลปะการแสดงเช่นเดียวกับในกลไพ่ตามกระบวนการ ของมาร์กอฟ ซึ่งใช้ได้ในบางครั้งเท่านั้น ซึ่งโอกาสดังกล่าวสามารถคาดการณ์ได้โดยใช้วิธีการทางสถิติ
  • สถิติสามารถใช้เพื่อสร้างงานศิลปะเชิงคาดการณ์ได้ เช่นเดียวกับในดนตรีเชิงสถิติหรือสุ่มที่คิดค้นโดยIannis Xenakisโดยที่ดนตรีนั้นใช้เฉพาะด้านการแสดง แม้ว่าศิลปะประเภทนี้จะไม่ออกมาอย่างที่คาดไว้เสมอไป แต่ก็ทำงานในลักษณะที่สามารถคาดเดาและปรับแต่งได้โดยใช้สถิติ

สาขาเฉพาะทาง

เทคนิคทางสถิติใช้ในการวิจัยทางวิทยาศาสตร์และสังคมหลายประเภท รวมถึง: ชีวสถิติชีววิทยาเชิงคำนวณ สังคมวิทยาเชิงคำนวณชีววิทยาเครือข่ายสังคมศาสตร์สังคมวิทยาและการวิจัยทางสังคม การสืบค้นข้อมูลบางสาขาใช้สถิติประยุกต์อย่างกว้างขวางจนมีคำศัพท์เฉพาะทาง สาขาวิชาเหล่านี้รวมถึง:

นอกจากนี้ยังมีการวิเคราะห์ทางสถิติบางประเภทที่พัฒนาคำศัพท์เฉพาะทางและวิธีการ:

สถิติเป็นเครื่องมือพื้นฐานที่สำคัญในธุรกิจและการผลิตเช่นกัน ใช้เพื่อทำความเข้าใจความแปรปรวนของระบบการวัด กระบวนการควบคุม (เช่นในการควบคุมกระบวนการทางสถิติหรือ SPC) สำหรับการสรุปข้อมูล และเพื่อการตัดสินใจโดยใช้ข้อมูล ในบทบาทเหล่านี้ มันเป็นเครื่องมือสำคัญ และบางทีอาจเป็นเครื่องมือเดียวที่เชื่อถือได้ [ ต้องการการอ้างอิง ]

ดูเพิ่มเติม

ฐานรากและพื้นที่สำคัญของสถิติ

อ้างอิง

  1. ^ "สถิติ". อ็อกซ์ฟอร์ดอ้างอิง สำนักพิมพ์มหาวิทยาลัยอ็อกซ์ฟอร์ด. มกราคม 2551 ISBN 978-0-19-954145-4.
  2. โรมิจน์, แจน-วิลเลม (2014). "ปรัชญาสถิติ" . สารานุกรมปรัชญาสแตนฟอร์ด .
  3. ^ "พจนานุกรมเคมบริดจ์" .
  4. Dodge, Y. (2006) The Oxford Dictionary of Statistical Terms , สำนักพิมพ์มหาวิทยาลัยออกซ์ฟอร์ด ไอเอสบีเอ็น0-19-920613-9 
  5. ^ a b Lund Research Ltd. "สถิติเชิงพรรณนาและอนุมาน" . สถิติ. laerd.com สืบค้นเมื่อ2014-03-23 .
  6. ^ "อะไรคือความแตกต่างระหว่างข้อผิดพลาดในการทดสอบสมมติฐาน Type I และ Type II" . About.com การศึกษา สืบค้นเมื่อ2015-11-27 .
  7. ^ โมเสส, ลินคอล์น อี. (1986)คิดและอธิบายด้วยสถิติ , แอดดิสัน-เวสลีย์, ISBN 978-0-201-15619-5 pp. 1–3 
  8. เฮย์ส, วิลเลียม ลี, (1973) Statistics for the Social Sciences , Holt, Rinehart and Winston, p.xii, ISBN 978-0-03-077945-9 
  9. ^ มัวร์ เดวิด (1992). "การสอนสถิติเป็นวิชาที่น่านับถือ" . ในเอฟ. กอร์ดอน; เอส. กอร์ดอน (สหพันธ์). สถิติสำหรับศตวรรษที่ยี่สิบเอ็ด . วอชิงตัน ดีซี: สมาคมคณิตศาสตร์แห่งอเมริกา น.  14–25 . ISBN 978-0-88385-078-7.
  10. ^ โอกาส เบธ แอล. ; รอสมัน, อัลลัน เจ. (2005). "คำนำ" (PDF) . การตรวจสอบแนวคิด การประยุกต์ใช้ และวิธีการทางสถิติ สำนักพิมพ์ดักซ์เบอรี. ISBN  978-0-495-05064-3.
  11. ^ ลักษมีกันธรรม, ด.; Kannan, V. (2002). คู่มือ วิเคราะห์ สุ่ม และ การ ประยุกต์ ใช้ . นิวยอร์ก: M. Dekker ISBN 0824706609.
  12. เชอร์วิช, มาร์ค เจ. (1995). ทฤษฎีสถิติ (พิมพ์ครั้งที่ 2 ก.พ.) นิวยอร์ก: สปริงเกอร์ ISBN 0387945466.
  13. ↑ a b Broemeling , Lyle D. (1 พฤศจิกายน 2011) "บัญชีของการอนุมานทางสถิติเบื้องต้นในวิทยาการเข้ารหัสลับอาหรับ". นักสถิติชาวอเมริกัน . 65 (4): 255–257. ดอย : 10.1198/tas.2011.10191 . S2CID 123537702 . 
  14. วิลค็อกซ์ วอลเตอร์ (1938) "ผู้ก่อตั้งสถิติ" การทบทวนสถาบันสถิติระหว่างประเทศ 5(4): 321–328. JSTOR  1400906
  15. เจ. แฟรงคลิน, The Science of Conjecture: Evidence and Probability before Pascal, Johns Hopkins Univ Pr 2002
  16. ^ เฮเลน แมรี วอล์คเกอร์ (1975) ศึกษา ประวัติ วิธี ทาง สถิติ . อาร์โน เพรส. ISBN 9780405066283.
  17. กัลตัน, เอฟ (1877). "กฎทั่วไปของกรรมพันธุ์" . ธรรมชาติ . 15 (388): 492–553. Bibcode : 1877Natur..15..492. . ดอย : 10.1038/015492a0 .
  18. สติกเลอร์, เอสเอ็ม (1989). "บัญชีของฟรานซิส กัลตันเรื่องการประดิษฐ์สหสัมพันธ์" . วิทยาศาสตร์สถิติ . 4 (2): 73–79. ดอย : 10.1214/ss/1177012580 .
  19. ^ เพียร์สัน, เค. (1900). "ในเกณฑ์ที่ระบบการเบี่ยงเบนจากความน่าจะเป็นในกรณีของระบบตัวแปรที่สัมพันธ์กันนั้นสามารถเกิดขึ้นได้จากการสุ่มตัวอย่างแบบสุ่มอย่างสมเหตุสมผล " นิตยสารปรัชญา . ซีรีส์ 5. 50 (302): 157–175 ดอย : 10.1080/14786440009463897 .
  20. "คาร์ล เพียร์สัน (1857–1936)" . ภาควิชาสถิติศาสตร์ – มหาวิทยาลัยคอลเลจลอนดอน เก็บถาวรจากต้นฉบับเมื่อ 2008-09-25
  21. ^ ฟิชเชอร์|1971|loc=บทที่ II. หลักการทดลอง ภาพประกอบโดยการทดลองทางจิต-ฟิสิกส์ ตอนที่ 8 สมมติฐานว่าง
  22. อ้างจาก OED: 1935 RA Fisher, The Design of Experiments ii. 19, "เราอาจพูดถึงสมมติฐานนี้เป็น 'สมมติฐานว่าง' และสมมติฐานว่างไม่เคยได้รับการพิสูจน์หรือสร้าง แต่อาจพิสูจน์หักล้างได้ในระหว่างการทดลอง"
  23. ^ Box, JF (กุมภาพันธ์ 2523) "อาร์เอ ฟิชเชอร์กับการออกแบบการทดลอง พ.ศ. 2465-2469" นักสถิติชาวอเมริกัน . 34 (1): 1–7. ดอย : 10.2307/2682986 . จ สท. 2682986 . 
  24. เยทส์, เอฟ (มิถุนายน 2507) "เซอร์โรนัลด์ ฟิชเชอร์กับการออกแบบการทดลอง" ไบโอเมตริกซ์ 20 (2): 307–321. ดอย : 10.2307/2528399 . จ สท 2528399 . 
  25. สแตนลีย์, จูเลียน ซี. (1966). "อิทธิพลของ "การออกแบบการทดลอง" ของฟิชเชอร์ต่อการวิจัยทางการศึกษา 30 ปีต่อมา วารสารวิจัยการศึกษาอเมริกัน . 3 (3): 223–229. ดอย : 10.3102/00028312003003223 . จ สท. 1161806 . S2CID 145725524 .  
  26. อาเกรสตี อลัน; เดวิด บี. ฮิชค็อก (2005). "การอนุมานแบบเบย์สำหรับการวิเคราะห์ข้อมูลตามหมวดหมู่" (PDF ) วิธีการทางสถิติและ การประยุกต์ 14 (3): 298. ดอย : 10.1007/ s10260-005-0121 -y S2CID 18896230 .  
  27. เอ็ดเวิร์ดส์, AWF (1998). "การคัดเลือกโดยธรรมชาติและอัตราส่วนเพศ: แหล่งที่มาของฟิชเชอร์". นักธรรมชาติวิทยาชาวอเมริกัน . 151 (6): 564–569. ดอย : 10.1086/286141 . PMID 18811377 . S2CID 40540426 .  
  28. ^ ฟิชเชอร์ RA (1915) วิวัฒนาการของรสนิยมทางเพศ สุพันธุศาสตร์รีวิว (7) 184:192
  29. ฟิชเชอร์ อาร์.เอ. (1930)ทฤษฎีทางพันธุกรรมของการคัดเลือกโดยธรรมชาติ . ไอเอสบีเอ็น0-19-850440-3 
  30. Edwards, AWF (2000) มุมมอง: เกร็ดเล็กเกร็ดน้อย ประวัติศาสตร์ และข้อคิดเห็นเชิงวิจารณ์เกี่ยวกับพันธุศาสตร์ สมาคมพันธุศาสตร์แห่งอเมริกา (154) 1419:1426
  31. แอนเดอร์สสัน, มอลต์ (1994). การเลือกเพศ . สำนักพิมพ์มหาวิทยาลัยพรินซ์ตัน. ISBN 0-691-00057-3.
  32. Andersson, M. and Simmons, LW (2006) การเลือกเพศและการเลือกคู่ครอง แนวโน้ม นิเวศวิทยา และวิวัฒนาการ (21) 296:302
  33. ↑ Gayon , J. (2010) การคัดเลือกทางเพศ: อีกกระบวนการหนึ่งของดาร์วิน. Comptes Rendus Biology (333) 134:144
  34. เนย์แมน, เจ (1934). "ในสองแง่มุมที่แตกต่างกันของวิธีการแบบตัวแทน: วิธีการสุ่มตัวอย่างแบบแบ่งชั้นและวิธีการคัดเลือกแบบเจาะจง" วารสาร ราชสมาคม สถิติ . 97 (4): 557–625. ดอย : 10.2307/2342192 . จ สท. 2342192 . 
  35. ^ "วิทยาศาสตร์ในโลกที่ซับซ้อน – ข้อมูลขนาดใหญ่: โอกาสหรือภัยคุกคาม?" . สถาบันซานตาเฟ
  36. Freedman, DA (2005)แบบจำลองทางสถิติ: ทฤษฎีและการปฏิบัติ , สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์. ISBN 978-0-521-67105-7 
  37. แมคคาร์นีย์ อาร์, วอร์เนอร์ เจ, อิลิฟฟ์ เอส, ฟาน ฮาเซเลน อาร์, กริฟฟิน เอ็ม, ฟิชเชอร์ พี (2007) "ผลกระทบของฮอว์ธอร์น: การทดลองแบบสุ่มและควบคุม " BMC Med Res Methodol 7 (1): 30. ดอย : 10.1186/1471-2288-7-30 . ป.ป.ช. 1936999 . PMID 17608932 .  
  38. ^ รอธแมน เคนเน็ธ เจ; กรีนแลนด์, แซนเดอร์; แลช, ทิโมธี, สหพันธ์. (2551). "7". ระบาดวิทยาสมัยใหม่ (ฉบับที่ 3) ลิปพินคอตต์ วิลเลียมส์ แอนด์ วิลกินส์. หน้า 100 . ISBN 9780781755641.
  39. ^ Mosteller, F. ; ทูคีย์ เจดับบลิว (1977) การวิเคราะห์ข้อมูลและ การถดถอย บอสตัน: แอดดิสัน-เวสลีย์
  40. ^ Nelder, JA (1990). ความรู้ที่จำเป็นในการวิเคราะห์และตีความข้อมูลทางสถิติด้วยคอมพิวเตอร์ ในระบบผู้เชี่ยวชาญและปัญญาประดิษฐ์: ความต้องการข้อมูลเกี่ยวกับข้อมูล รายงานสมาคมห้องสมุด ลอนดอน วันที่ 23–27 มีนาคม
  41. ^ คริสแมน, นิโคลัส อาร์ (1998). "ทบทวนระดับการวัดใหม่สำหรับการทำแผนที่". การทำแผนที่และสารสนเทศภูมิศาสตร์ 25 (4): 231–242. ดอย : 10.1559/152304098782383043 .
  42. ^ van den Berg, G. (1991). การเลือกวิธีการวิเคราะห์ ไลเดน: DSWO Press
  43. ^ แฮนด์ ดีเจ (2004). ทฤษฎีการวัดและการปฏิบัติ: โลกผ่านการหาปริมาณ ลอนดอน: อาร์โนลด์.
  44. ^ มาน, เปรม เอส. (2538). สถิติเบื้องต้น (ฉบับที่ 2) ไวลีย์. ISBN 0-471-31009-3.
  45. Upton, G. , Cook, I. (2008)พจนานุกรมสถิติของอ็อกซ์ฟอร์ด , OUP. ไอ978-0-19-954145-4 . 
  46. ↑ a b Piazza Elio, Probabilità e Statistica, Esculapio 2007
  47. เอเวอริตต์, ไบรอัน (1998). พจนานุกรมสถิติเคมบริดจ์ เคมบริดจ์ สหราชอาณาจักร นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์ ISBN 0521593468.
  48. ^ "โคเฮน (1994) โลกกลม (p < .05)" . YourStatsGuru.com
  49. รูบิน โดนัลด์ บี.; Little, Roderick JA, การวิเคราะห์ทางสถิติที่มีข้อมูลที่ขาดหายไป, New York: Wiley 2002
  50. อิโออันนิดิส เจพีเอ (2005). "เหตุใดผลการวิจัยที่ตีพิมพ์ส่วนใหญ่จึงเป็นเท็จ" . ยาPLOS 2 (8): e124. ดอย : 10.1371/journal.pmed.0020124 . พี เอ็มซี 1182327 . PMID 16060722 .  
  51. a b c Huff, Darrell (1954) How to Lie with Statistics , WW Norton & Company, Inc. นิวยอร์ก ไอเอสบีเอ็น0-393-31072-8 
  52. วาร์น อาร์ ลาโซ; รามอส, ต.; Ritter, N. (2012). "วิธีการทางสถิติที่ใช้ในวารสารการศึกษาที่มีพรสวรรค์ พ.ศ. 2549-2553" เด็กที่ มีพรสวรรค์รายไตรมาส 56 (3): 134–149. ดอย : 10.1177/00169862124444122 . S2CID 144168910 . 
  53. อรรถเป็น เดรนแนน โรเบิร์ต ดี. (2008) "สถิติทางโบราณคดี". ใน Pearsall, Deborah M. (ed.) สารานุกรมโบราณคดี . Elsevier Inc. หน้า  2093 –2100 ISBN 978-0-12-373962-9.
  54. อรรถเป็น โคเฮน เจอโรม บี. (ธันวาคม 2481) "การใช้สถิติในทางที่ผิด". วารสารสมาคมสถิติอเมริกัน . จสท. 33 (204): 657–674. ดอย : 10.1080/01621459.19381.10502344 .
  55. ^ ฟรอยด์ เจ.อี. (1988). "สถิติเบื้องต้นสมัยใหม่". อ้างอิงเคร โด
  56. ^ ฮัฟฟ์ ดาร์เรล; เออร์วิง ไกส์ (1954) วิธีการโกหก ด้วยสถิติ นิวยอร์ก: นอร์ตัน. ความเชื่อถือได้ของตัวอย่างสามารถถูกทำลายได้โดย [อคติ]... ปล่อยให้ตัวเองเกิดความสงสัยในระดับหนึ่ง
  57. เนลเดอร์, จอห์น เอ. (1999). "จากสถิติสู่วิทยาศาสตร์สถิติ" . วารสารสมาคมสถิติ. ซีรีส์ D (นักสถิติ) . 48 (2): 257–269. ดอย : 10.1111/1467-9884.00187 . ISSN 0039-0526 . จ สท. 2681191 .  
  58. ^ Nikoletseas, MM (2014) "สถิติ: แนวคิดและตัวอย่าง" ISBN 978-1500815684 
  59. ^ แอนเดอร์สัน DR; สวีนีย์ ดีเจ; Williams, TA (1994) Introduction to Statistics: Concepts and Applications , หน้า 5–9. เวสต์กรุ๊ป. ไอ978-0-314-03309-3 
  60. ^ "วารสารสถิติธุรกิจและเศรษฐกิจ" . วารสารสถิติธุรกิจและเศรษฐกิจ . เทย์เลอร์ & ฟรานซิส. สืบค้นเมื่อ16 มีนาคม 2020 .
  61. ข Natalia Loaiza Velásquez , María Isabel González Lutz & Julián Monge-Nájera (2011) "สถิติใดที่นักชีววิทยาเขตร้อนควรเรียนรู้" (PDF) . Revista Biologia ทรอปิคอล. 59 : 983–992.
  62. เปคอซ, เอโรล (2009). คู่มือผู้จัดการสถิติ เอรอล เปกอซ. ISBN 9780979570438.
  63. ^ "จุดมุ่งหมายและขอบเขต" . วารสารสถิติธุรกิจและเศรษฐกิจ . เทย์เลอร์ & ฟรานซิส. สืบค้นเมื่อ16 มีนาคม 2020 .
  64. ^ "วารสารสถิติธุรกิจและเศรษฐกิจ" . วารสารสถิติธุรกิจและเศรษฐกิจ . เทย์เลอร์ & ฟรานซิส. สืบค้นเมื่อ16 มีนาคม 2020 .
  65. ^ มีข้อความมากมายซึ่งสะท้อนถึงขอบเขตและการเข้าถึงวินัยในโลกธุรกิจ:
    • Sharpe, N. (2014). สถิติธุรกิจ , เพียร์สัน. ISBN 978-0134705217 
    • Wegner, T. (2010). สถิติธุรกิจประยุกต์: วิธีการและแอปพลิเคชันบน Excel, Juta Academic ISBN 0702172863 
    หนังสือเรียนที่ เปิดอยู่ สอง เล่ม คือ:
  66. ^ ไคลน์, เกรย์เซ่น (2019). วิธีการทางสถิติแบบไม่ อิงพารามิเตอร์โดยใช้ R เอ็ดเทค ISBN 978-1-83947-325-8. OCLC  1132348139 .
  67. ปาลาซิโอส, เบอร์นาร์โด; โรซาริโอ, อัลฟอนโซ; วิลเฮลมัส, โมนิกา เอ็ม.; เซติน่า, แซนดร้า; เซนิต, โรแบร์โต้ (2019-10-30) "พอลลอคหลีกเลี่ยงความไม่แน่นอนของอุทกพลศาสตร์ในการวาดภาพด้วยเทคนิคการหยดของเขา " PLOSหนึ่ง 14 (10): e0223706. Bibcode : 2019PLoSO..1423706P . ดอย : 10.1371/journal.pone.0223706 . ISSN 1932-6203 . พี เอ็มซี 6821064 . PMID 31665191 .   

อ่านเพิ่มเติม

ลิงค์ภายนอก