ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยและสูงสุด ประชากรและวิธีการสุ่มตัวอย่าง
ทฤษฎีสถิติ: บันทึกการบรรยาย Burkhanova Inessa Viktorovna
3. ข้อผิดพลาดในการสุ่มตัวอย่าง
3. ข้อผิดพลาดในการสุ่มตัวอย่าง
แต่ละหน่วยในการสังเกตตัวอย่างจะต้องมีโอกาสเท่ากันกับหน่วยอื่น ๆ ที่จะเลือก - นี่คือพื้นฐานของกลุ่มตัวอย่างแบบสุ่ม
การสุ่มตัวอย่างที่เหมาะสม คือ การเลือกหน่วยจากจำนวนประชากรทั้งหมดโดยการจับสลากหรือวิธีอื่นที่คล้ายคลึงกัน
หลักการของการสุ่มคือการที่การรวมหรือการยกเว้นรายการจากตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยอื่นใดนอกจากความบังเอิญ
แชร์ตัวอย่างคืออัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไป:
การเลือกสุ่มที่เหมาะสมในรูปแบบบริสุทธิ์นั้นเป็นการเลือกดั้งเดิมในบรรดาการเลือกประเภทอื่นๆ ทั้งหมด โดยมีและใช้หลักการพื้นฐานของการสังเกตทางสถิติแบบเลือกสรร
ตัวบ่งชี้ทั่วไปสองประเภทหลักที่ใช้ในวิธีการสุ่มตัวอย่างคือค่าเฉลี่ยของคุณลักษณะเชิงปริมาณและค่าสัมพัทธ์ของคุณลักษณะทางเลือก
เศษส่วนตัวอย่าง (w) หรือความเฉพาะเจาะจงถูกกำหนดโดยอัตราส่วนของจำนวนหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา ม.ถึง จำนวนทั้งหมดหน่วยของประชากรตัวอย่าง (n):
เพื่อระบุลักษณะความน่าเชื่อถือของตัวบ่งชี้ตัวอย่าง จะต้องแยกความแตกต่างระหว่างข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยและสูงสุด
ข้อผิดพลาดในการสุ่มตัวอย่างหรือที่เรียกว่าข้อผิดพลาดในการเป็นตัวแทนคือความแตกต่างระหว่างตัวอย่างที่สอดคล้องกันและคุณลักษณะทั่วไป:
?x =|x – x|;
?w =|x – พี|.
เท่านั้น การสังเกตตัวอย่างข้อผิดพลาดในการสุ่มตัวอย่างโดยธรรมชาติ
ค่าเฉลี่ยตัวอย่างและสัดส่วนตัวอย่าง– เหล่านี้เป็นตัวแปรสุ่มที่ใช้ค่าที่แตกต่างกันขึ้นอยู่กับหน่วยของประชากรทางสถิติที่กำลังศึกษาซึ่งรวมอยู่ในตัวอย่าง. ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างจึงเป็นตัวแปรสุ่มและอาจรับค่าที่ต่างกันได้เช่นกัน ดังนั้นจึงกำหนดค่าเฉลี่ยของข้อผิดพลาดที่เป็นไปได้ - ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย
ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะพิจารณาจากขนาดตัวอย่าง ยิ่งตัวเลขมากขึ้น สิ่งอื่นๆ จะเท่ากัน ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะน้อยลง ด้วยการครอบคลุมจำนวนหน่วยประชากรทั่วไปที่เพิ่มขึ้นด้วยการสำรวจตัวอย่าง เราจึงสามารถระบุลักษณะของประชากรทั่วไปทั้งหมดได้แม่นยำยิ่งขึ้น
ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยขึ้นอยู่กับระดับของความแปรผันของคุณลักษณะที่กำลังศึกษา ในทางกลับกัน ระดับของความแปรผันจะมีลักษณะเฉพาะด้วยการกระจายตัว 2 หรือ ก(ล – ญ)– สำหรับสัญญาณทางเลือก ยิ่งความแปรผันของลักษณะและการกระจายตัวน้อยลงเท่าไรก็ยิ่งน้อยลงเท่านั้น ข้อผิดพลาดโดยเฉลี่ยตัวอย่างและในทางกลับกัน
ในกรณีที่สุ่มตัวอย่างซ้ำ ข้อผิดพลาดโดยเฉลี่ยจะถูกคำนวณตามทฤษฎีโดยใช้สูตรต่อไปนี้:
1) สำหรับลักษณะเชิงปริมาณโดยเฉลี่ย:
ที่ไหน? 2 – ค่าเฉลี่ยของการกระจายตัวของคุณลักษณะเชิงปริมาณ
2) สำหรับการแบ่งปัน (คุณลักษณะทางเลือก):
แล้วความแปรปรวนของลักษณะในประชากรเป็นเท่าไหร่? 2 ยังไม่ทราบแน่ชัด ในทางปฏิบัติ ใช้ค่าการกระจายตัว S 2 ที่คำนวณสำหรับประชากรตัวอย่างตามกฎหมาย จำนวนมากตามที่ประชากรตัวอย่างซึ่งมีขนาดตัวอย่างใหญ่เพียงพอ สามารถสร้างลักษณะของประชากรทั่วไปได้อย่างแม่นยำ
สูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับการสุ่มตัวอย่างใหม่มีดังต่อไปนี้ สำหรับค่าเฉลี่ยของคุณลักษณะเชิงปริมาณ: ความแปรปรวนทั่วไปจะแสดงผ่านความแปรปรวนแบบเลือกตามความสัมพันธ์ต่อไปนี้:
โดยที่ S 2 คือค่าการกระจายตัว
การสุ่มตัวอย่างทางกล– เป็นการเลือกหน่วยเป็นประชากรตัวอย่างจากประชากรทั่วไปโดยแบ่งตามเกณฑ์ที่เป็นกลางออกเป็นกลุ่มเท่าๆ กัน ดำเนินการในลักษณะที่เลือกเพียงหนึ่งหน่วยสำหรับตัวอย่างจากแต่ละกลุ่มดังกล่าว
ในการสุ่มตัวอย่างเชิงกล หน่วยของประชากรทางสถิติที่กำลังศึกษาจะถูกจัดเรียงเบื้องต้นตามลำดับที่แน่นอน หลังจากนั้นจึงเลือกหน่วยตามจำนวนที่กำหนดในช่วงเวลาหนึ่ง ในกรณีนี้ ขนาดของช่วงเวลาในประชากรจะเท่ากับค่าผกผันของสัดส่วนตัวอย่าง
เนื่องจากมีประชากรจำนวนมากเพียงพอ การเลือกทางกลจึงใกล้เคียงกับการสุ่มตัวอย่างเองในแง่ของความถูกต้องแม่นยำของผลลัพธ์ ดังนั้น เพื่อกำหนดข้อผิดพลาดโดยเฉลี่ยของการสุ่มตัวอย่างทางกล จึงมีการใช้สูตรสำหรับการสุ่มตัวอย่างด้วยตนเองแบบไม่ทำซ้ำ
ในการเลือกหน่วยจากประชากรที่ต่างกันจะใช้สิ่งที่เรียกว่าตัวอย่างทั่วไปซึ่งจะใช้เมื่อหน่วยทั้งหมดของประชากรทั่วไปสามารถแบ่งออกเป็นกลุ่มที่มีคุณภาพเหมือนกันหลายกลุ่มและคล้ายคลึงกันตามลักษณะที่ตัวบ่งชี้ที่กำลังศึกษาอยู่
จากนั้น จากแต่ละกลุ่มทั่วไป การเลือกหน่วยต่างๆ ในกลุ่มตัวอย่างจะดำเนินการโดยใช้ตัวอย่างแบบสุ่มหรือตัวอย่างเชิงกลล้วนๆ
การสุ่มตัวอย่างมักใช้เมื่อศึกษาประชากรทางสถิติที่ซับซ้อน
การสุ่มตัวอย่างโดยทั่วไปจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น การพิมพ์ประชากรทั่วไปทำให้มั่นใจได้ถึงความเป็นตัวแทนของกลุ่มตัวอย่างดังกล่าว ซึ่งเป็นการเป็นตัวแทนของกลุ่มประเภทแต่ละกลุ่มในกลุ่มนั้น ซึ่งทำให้สามารถแยกอิทธิพลของการกระจายตัวระหว่างกลุ่มต่อข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยได้ ดังนั้น เมื่อพิจารณาค่าความผิดพลาดโดยเฉลี่ยของกลุ่มตัวอย่างทั่วไป ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มจะทำหน้าที่เป็นตัวบ่งชี้ความแปรผัน
การสุ่มตัวอย่างแบบอนุกรมเกี่ยวข้องกับการสุ่มเลือกจากประชากรทั่วไปของกลุ่มที่เท่ากัน เพื่อให้ทุกหน่วยในกลุ่มดังกล่าวสังเกตโดยไม่มีข้อยกเว้น
เนื่องจากภายในกลุ่ม (อนุกรม) มีการตรวจสอบทุกหน่วยโดยไม่มีข้อยกเว้น ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย (เมื่อเลือกอนุกรมที่เท่ากัน) ขึ้นอยู่กับการกระจายระหว่างกลุ่ม (อนุกรม) เท่านั้น
จากหนังสืองบประมาณส่วนบุคคล เงินอยู่ภายใต้การควบคุม ผู้เขียน มาคารอฟ เซอร์เกย์ วลาดิมิโรวิชข้อผิดพลาดของผู้อยู่อาศัย คุณสามารถจัดการกับข้อผิดพลาดได้หลายวิธี: คุณสามารถกลัวที่จะทำผิดพลาดและกังวลเกี่ยวกับแต่ละข้อผิดพลาด คุณสามารถชื่นชมยินดีกับความผิดพลาดและวิกฤตการณ์ของคุณในฐานะตัวชี้บนเส้นทางสู่ความสำเร็จและชัยชนะส่วนตัว สิ่งเดียวที่เกี่ยวกับข้อผิดพลาดอยู่เสมอคือคุณต้องจ่ายเงินเพื่อความผิดพลาดเหล่านั้น
จากหนังสือคู่มือการตรวจสอบภายใน ความเสี่ยงและกระบวนการทางธุรกิจ ผู้เขียน Kryshkin Olegการสุ่มตัวอย่าง ขั้นตอนการสุ่มตัวอย่างถือเป็นขั้นตอนสำคัญของโครงการตรวจสอบภายใน โดยมีการอธิบายรายละเอียดไว้ในแหล่งต่างๆ ในหัวข้อการตรวจสอบ อย่างไรก็ตาม คำอธิบายดังกล่าวมีลักษณะทางวิชาการหลายประการ ฉันขอแนะนำให้มุ่งเน้นไปที่สิ่งเหล่านั้น
จากหนังสือ The Psychology of Investments [วิธีหยุดทำเรื่องโง่ ๆ ด้วยเงินของคุณ] โดยริชาร์ดส คาร์ลข้อผิดพลาดในการลงทุนคือข้อผิดพลาดของนักลงทุน ตอนนี้ฉันมั่นใจมากขึ้นกว่าเดิมว่าข้อผิดพลาดในการลงทุนทั้งหมดเป็นข้อผิดพลาดของนักลงทุนจริงๆ ต่างจากนักลงทุน การลงทุนเป็นทางเลือก ตรงนี้เกี่ยวกับเรื่องนี้
ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา29. การกำหนดขนาดตัวอย่างที่ต้องการ หลักการทางวิทยาศาสตร์ประการหนึ่งในทฤษฎีของวิธีการสุ่มตัวอย่างคือ การตรวจสอบให้แน่ใจว่ามีหน่วยที่เลือกในจำนวนที่เพียงพอ ข้อผิดพลาดในการสุ่มตัวอย่างมาตรฐานที่ลดลงมักสัมพันธ์กับการเพิ่มขนาดตัวอย่างเสมอ การคำนวณ
จากหนังสือ ทฤษฎีทั่วไปสถิติ ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา30. วิธีการเลือกและประเภทของการชักตัวอย่าง การสุ่มตัวอย่างตามจริง ตามทฤษฎีของวิธีการสุ่มตัวอย่าง วิธีการเลือกและประเภทของการสุ่มตัวอย่างต่างๆ ได้รับการพัฒนาขึ้นเพื่อให้มั่นใจถึงความเป็นตัวแทน วิธีการคัดเลือกหมายถึงขั้นตอนการคัดเลือกหน่วยจากประชากรทั่วไป
จากหนังสือทฤษฎีสถิติทั่วไป ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา31. การสุ่มตัวอย่างทางกลและการสุ่มตัวอย่างทั่วไป ในการสุ่มตัวอย่างทางกลล้วนๆ อันดับแรกควรนำเสนอประชากรทั่วไปทั้งหมดของหน่วยในรูปแบบของรายการหน่วยคัดเลือก ซึ่งรวบรวมตามลำดับบางอย่างที่เป็นกลางโดยสัมพันธ์กับลักษณะที่กำลังศึกษา จากนั้นรายการ
จากหนังสือทฤษฎีสถิติทั่วไป ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา32. การสุ่มตัวอย่างแบบอนุกรมและแบบรวม การสุ่มตัวอย่างแบบอนุกรม (คลัสเตอร์) เป็นรูปแบบหนึ่งของการก่อตัวของประชากรตัวอย่างเมื่อไม่ใช่หน่วยที่จะสำรวจ แต่กลุ่มของหน่วย (อนุกรม, รัง) จะถูกเลือกโดยการสุ่ม ภายในซีรีส์ที่เลือก (รัง)
จากหนังสือทฤษฎีสถิติทั่วไป ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา33. การสุ่มตัวอย่างแบบหลายขั้นตอน หลายเฟส และแบบแทรกซึม ลักษณะเฉพาะของการสุ่มตัวอย่างแบบหลายขั้นตอนคือ ประชากรตัวอย่างจะค่อยๆ ก่อตัวขึ้นตามขั้นตอนการคัดเลือก ในระยะแรกให้ใช้วิธีการและประเภทของการเลือกที่กำหนดไว้ล่วงหน้า
ผู้เขียน โคนิค นีน่า วลาดีมีรอฟนา3. การกำหนดขนาดตัวอย่างที่ต้องการ หลักการทางวิทยาศาสตร์ประการหนึ่งในทฤษฎีการสุ่มตัวอย่างคือ การตรวจสอบให้แน่ใจว่ามีจำนวนหน่วยที่เลือกเพียงพอ ตามทฤษฎี ความจำเป็นในการปฏิบัติตามหลักการนี้แสดงไว้ในบทพิสูจน์ทฤษฎีบทขีดจำกัด
จากหนังสือทฤษฎีสถิติทั่วไป: บันทึกการบรรยาย ผู้เขียน โคนิค นีน่า วลาดีมีรอฟนา4. วิธีการเลือกและประเภทของการสุ่มตัวอย่าง ตามทฤษฎีของวิธีการสุ่มตัวอย่างนั้นได้มีการพัฒนาวิธีการเลือกและประเภทของการสุ่มตัวอย่างที่หลากหลายเพื่อให้มั่นใจถึงความเป็นตัวแทน วิธีการคัดเลือกหมายถึงขั้นตอนการคัดเลือกหน่วยจากประชากรทั่วไป มีสองวิธีในการเลือก: ซ้ำ
จากหนังสือทฤษฎีสถิติ ผู้เขียน บูร์ฮาโนวา อิเนสซา วิคโตรอฟนา36. ข้อผิดพลาดในการสุ่มตัวอย่าง การสุ่มตัวอย่างที่เหมาะสมคือการเลือกหน่วยจากประชากรทั้งหมดโดยการจับฉลากหรือวิธีการอื่นที่คล้ายคลึงกัน หลักการของการสุ่มก็คือ การรวมหรือแยกวัตถุออกจากตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยใดๆ
จากหนังสือ Business Correspondence: คู่มือการฝึกอบรม ผู้เขียน เคอร์ซาโนวา มาเรีย วลาดิมีรอฟนาข้อผิดพลาดด้านคำศัพท์ 1. การใช้คำและคำศัพท์ไม่ถูกต้อง ข้อผิดพลาดจำนวนมากใน จดหมายธุรกิจหมายถึงคำศัพท์ การรู้หนังสือไม่เพียงพอไม่เพียงแต่นำไปสู่เรื่องไร้สาระที่น่าสงสัยเท่านั้น แต่ยังนำไปสู่คำศัพท์เฉพาะทางและศัพท์เฉพาะทางวิชาชีพด้วย
จากหนังสือ ยุคใหม่- ความกังวลเก่าๆ : เศรษฐกิจการเมือง ผู้เขียน ยาซิน เยฟเกนีย์ กริกอรีวิช5 ข้อผิดพลาดของเรา เรายืนยัน: แนวทางการปฏิรูปตลาดที่เลือกนั้นถูกต้อง และพวกเขาไม่ได้ล้มเหลวเลย พวกเขาแค่สะดุดอีกครั้ง แต่มีข้อผิดพลาดและการละเว้น สิ่งเหล่านี้เป็นความผิดพลาดของเราและความผิดพลาดของผู้นำประเทศซึ่งเราไม่สามารถป้องกันได้ ข้อผิดพลาด - ในหลาย ๆ ด้าน
โดย Kurtis Faceความสำคัญของขนาดตัวอย่าง ดังที่ได้กล่าวไปแล้ว ผู้คนมักจะให้ความสนใจมากเกินไปกับปรากฏการณ์ที่เกิดขึ้นซึ่งเกิดขึ้นไม่บ่อยนัก แม้ว่าจากมุมมองทางสถิติแล้ว เป็นไปไม่ได้ที่จะดึงข้อมูลจำนวนมากจากบางกรณีได้ นี่คือเหตุผลหลัก
จากหนังสือ วิถีแห่งเต่า จากมือสมัครเล่นไปจนถึงเทรดเดอร์ระดับตำนาน โดย Kurtis Faceตัวอย่างตัวแทน ความเป็นตัวแทนของการทดสอบของเราเพื่อวัตถุประสงค์ในการทำนายอนาคตถูกกำหนดโดยปัจจัยสองประการ: – จำนวนตลาด: การทดสอบที่ดำเนินการในตลาดที่แตกต่างกันมักจะรวมถึงตลาดที่มี องศาที่แตกต่างกันประเภทความผันผวน
จากหนังสือ วิถีแห่งเต่า จากมือสมัครเล่นไปจนถึงเทรดเดอร์ระดับตำนาน โดย Kurtis Faceขนาดตัวอย่าง แนวคิดเรื่องขนาดตัวอย่างนั้นเรียบง่าย: เพื่อที่จะได้ข้อสรุปที่ถูกต้องทางสถิติ คุณจำเป็นต้องมีตัวอย่างที่มีขนาดใหญ่เพียงพอ ยิ่งตัวอย่างมีขนาดเล็กเท่าไร ข้อสรุปก็จะยิ่งหยาบมากขึ้นเท่านั้น ยิ่งตัวอย่างมีขนาดใหญ่ คุณภาพของข้อสรุปก็จะยิ่งดีขึ้นเท่านั้น ไม่มี
เป็นค่าความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างและประชากรทั่วไปที่ไม่เกิน ±6 (เดลต้า)
ขึ้นอยู่กับ ทฤษฎีบทของ Chebyshev P. L. ค่าความผิดพลาดโดยเฉลี่ยด้วยการสุ่มเลือกซ้ำจะคำนวณโดยใช้สูตร (สำหรับคุณลักษณะเชิงปริมาณเฉลี่ย):
โดยที่ตัวเศษคือความแปรปรวนของคุณลักษณะ x ในประชากรตัวอย่าง
n คือขนาดของประชากรตัวอย่าง
สำหรับคุณลักษณะทางเลือก ให้ใช้สูตรสำหรับค่าความคลาดเคลื่อนในการสุ่มตัวอย่างเฉลี่ยสำหรับสัดส่วน โดยทฤษฎีบทของเจ. เบอร์นูลลีคำนวณโดยสูตร:
โดยที่ p(1-p) คือการกระจายตัวของส่วนแบ่งของลักษณะเฉพาะในประชากรทั่วไป
n - ขนาดตัวอย่าง
เนื่องจากไม่ทราบความแปรปรวนของคุณลักษณะในประชากรทั่วไปอย่างแม่นยำ ในทางปฏิบัติจึงใช้ค่าความแปรปรวน ซึ่งคำนวณสำหรับประชากรตัวอย่างตาม กฎของจำนวนมาก- ตามกฎหมายนี้ ประชากรตัวอย่างที่มีขนาดตัวอย่างขนาดใหญ่สามารถจำลองลักษณะของประชากรทั่วไปได้อย่างแม่นยำ
ดังนั้นสูตรการคำนวณ ข้อผิดพลาดโดยเฉลี่ยสำหรับการสุ่มตัวอย่างใหม่ จะมีลักษณะเช่นนี้:
1. สำหรับลักษณะเชิงปริมาณโดยเฉลี่ย:
โดยที่ S^2 คือความแปรปรวนของคุณลักษณะ x ในประชากรตัวอย่าง
n - ขนาดตัวอย่าง
โดยที่ w (1 - w) คือการกระจายตัวของสัดส่วนของลักษณะเฉพาะที่กำลังศึกษาในกลุ่มประชากรตัวอย่าง
ในทฤษฎีความน่าจะเป็นแสดงให้เห็นว่ามันถูกแสดงผ่านตัวอย่างตามสูตร:
ในกรณี ตัวอย่างเล็กๆเมื่อปริมาตรน้อยกว่า 30 จำเป็นต้องคำนึงถึงค่าสัมประสิทธิ์ n/(n-1) จากนั้นคำนวณข้อผิดพลาดโดยเฉลี่ยของกลุ่มตัวอย่างขนาดเล็กโดยใช้สูตร:
เนื่องจากในกระบวนการสุ่มตัวอย่างแบบไม่ทำซ้ำ จำนวนหน่วยในประชากรทั่วไปจะลดลง ดังนั้นในสูตรข้างต้นสำหรับคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย นิพจน์รากจะต้องคูณด้วย 1- (n/N)
สูตรการคำนวณสำหรับการสุ่มตัวอย่างประเภทนี้จะมีลักษณะดังนี้:
1. สำหรับลักษณะเชิงปริมาณโดยเฉลี่ย:
โดยที่ N คือปริมาตรของประชากรทั่วไป n - ขนาดตัวอย่าง
2. สำหรับการแบ่งปัน (คุณลักษณะทางเลือก):
โดยที่ 1- (n/N) คือสัดส่วนของหน่วยในประชากรทั่วไปที่ไม่รวมอยู่ในกลุ่มตัวอย่าง
เนื่องจาก n จะน้อยกว่า N เสมอ ดังนั้นปัจจัยเพิ่มเติม 1 - (n/N) จึงจะน้อยกว่า 1 เสมอ ซึ่งหมายความว่าข้อผิดพลาดโดยเฉลี่ยของการเลือกซ้ำจะน้อยกว่าการเลือกซ้ำเสมอ เมื่อสัดส่วนของหน่วยในประชากรทั่วไปที่ไม่รวมอยู่ในกลุ่มตัวอย่างมีนัยสำคัญ ค่า 1 - (n/N) จะใกล้เคียงกับ 1 จากนั้นจึงคำนวณค่าคลาดเคลื่อนโดยเฉลี่ยโดยใช้สูตรทั่วไป
ข้อผิดพลาดโดยเฉลี่ยขึ้นอยู่กับปัจจัยต่อไปนี้:
1. เมื่อใช้หลักการของการเลือกแบบสุ่ม ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะถูกกำหนด ประการแรก ตามขนาดตัวอย่าง: ยิ่งตัวเลขมาก ค่าก็จะยิ่งน้อยลง ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย- ประชากรทั่วไปจะมีลักษณะเฉพาะที่แม่นยำยิ่งขึ้นเมื่อมีหน่วยของประชากรนี้ครอบคลุมมากขึ้นโดยการสังเกตตัวอย่าง
2. ข้อผิดพลาดโดยเฉลี่ยยังขึ้นอยู่กับระดับความแปรผันของคุณลักษณะด้วย ระดับความแปรปรวนมีลักษณะเฉพาะคือ ยิ่งความแปรผันของคุณลักษณะ (การกระจายตัว) น้อยลง ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลงเท่านั้น ด้วยความแปรปรวนเป็นศูนย์ (แอตทริบิวต์ไม่แปรผัน) ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะเป็นศูนย์ ดังนั้น หน่วยใดๆ ในประชากรจะกำหนดลักษณะของประชากรทั้งหมดตามคุณลักษณะนี้
ประชากรทางสถิติ- ชุดของหน่วยที่มีลักษณะเฉพาะของมวล ลักษณะทั่วไป ความสม่ำเสมอในเชิงคุณภาพ และการมีอยู่ของการเปลี่ยนแปลง
ประชากรทางสถิติประกอบด้วยวัตถุที่มีอยู่อย่างมีนัยสำคัญ (พนักงาน องค์กร ประเทศ ภูมิภาค) เป็นวัตถุ
หน่วยของประชากร— แต่ละหน่วยเฉพาะของประชากรทางสถิติ
ประชากรทางสถิติเดียวกันสามารถมีลักษณะเป็นเนื้อเดียวกันได้ในลักษณะหนึ่งและต่างกันในลักษณะอื่นได้
ความสม่ำเสมอเชิงคุณภาพ- ความคล้ายคลึงกันของทุกหน่วยของประชากรในบางพื้นฐานและความแตกต่างจากหน่วยอื่น ๆ ทั้งหมด
ในประชากรทางสถิติ ความแตกต่างระหว่างหน่วยประชากรหนึ่งกับอีกหน่วยหนึ่งมักมีลักษณะเป็นเชิงปริมาณ การเปลี่ยนแปลงเชิงปริมาณในค่าลักษณะเฉพาะ หน่วยที่แตกต่างกันมวลรวมเรียกว่าการแปรผัน
การเปลี่ยนแปลงของลักษณะ- การเปลี่ยนแปลงเชิงปริมาณในลักษณะ (สำหรับลักษณะเชิงปริมาณ) ระหว่างการเปลี่ยนจากหน่วยประชากรหนึ่งไปยังอีกหน่วยหนึ่ง
เข้าสู่ระบบ- นี่คือทรัพย์สิน คุณลักษณะเฉพาะหรือลักษณะอื่นของหน่วย วัตถุ และปรากฏการณ์ที่สามารถสังเกตหรือวัดได้ สัญญาณแบ่งออกเป็นเชิงปริมาณและเชิงคุณภาพ ความหลากหลายและความแปรปรวนของมูลค่าของลักษณะเฉพาะในแต่ละหน่วยของประชากรเรียกว่า การเปลี่ยนแปลง.
ลักษณะเฉพาะ (เชิงคุณภาพ) ไม่สามารถแสดงเป็นตัวเลขได้ (องค์ประกอบของประชากรตามเพศ) ลักษณะเชิงปริมาณมีการแสดงออกเป็นตัวเลข (องค์ประกอบประชากรตามอายุ)
ตัวบ่งชี้- นี่เป็นลักษณะทั่วไปเชิงปริมาณและคุณภาพของทรัพย์สินใดๆ ของหน่วยหรือมวลรวมโดยรวมภายใต้เงื่อนไขเฉพาะของเวลาและสถานที่
ดัชนีชี้วัดคือชุดตัวชี้วัดที่สะท้อนปรากฏการณ์ที่กำลังศึกษาอย่างครอบคลุม
ตัวอย่างเช่น มีการศึกษาเงินเดือน:- เข้าสู่ระบบ - ค่าจ้าง
- ประชากรทางสถิติ-พนักงานทุกคน
- หน่วยประชากรคือพนักงานแต่ละคน
- ความสม่ำเสมอเชิงคุณภาพ - ค่าจ้างสะสม
- การเปลี่ยนแปลงของเครื่องหมาย - ชุดตัวเลข
ประชากรและกลุ่มตัวอย่างจากนั้น
พื้นฐานคือชุดของข้อมูลที่ได้รับจากการวัดคุณลักษณะตั้งแต่หนึ่งรายการขึ้นไป ชุดของวัตถุที่สังเกตได้อย่างแท้จริง ซึ่งแสดงทางสถิติด้วยการสังเกตตัวแปรสุ่มจำนวนหนึ่งคือ การสุ่มตัวอย่างและที่มีอยู่ตามสมมุติฐาน (การคาดเดา) - ประชากรทั่วไป- ประชากรอาจมีจำกัด (จำนวนการสังเกต N = ค่าคงที่) หรืออนันต์ ( ยังไม่มีข้อความ = ∞) และตัวอย่างจากประชากรจะเป็นผลมาจากการสังเกตในจำนวนที่จำกัดเสมอ เรียกว่าจำนวนการสังเกตที่ก่อตัวเป็นตัวอย่าง ขนาดตัวอย่าง- หากขนาดตัวอย่างใหญ่พอ ( n → ∞) พิจารณาตัวอย่างแล้ว ใหญ่มิฉะนั้นจะเรียกว่าการสุ่มตัวอย่าง ปริมาณจำกัด- โดยจะพิจารณาตัวอย่าง เล็กหากเมื่อทำการวัดตัวแปรสุ่มหนึ่งมิติขนาดตัวอย่างจะต้องไม่เกิน 30 ( n<= 30 ) และเมื่อทำการวัดหลายรายการพร้อมกัน ( เค) คุณลักษณะในปริภูมิความสัมพันธ์หลายมิติ nถึง เคไม่เกิน 10 (ไม่ระบุ< 10) - แบบฟอร์มตัวอย่าง ซีรีย์การเปลี่ยนแปลงถ้ามีสมาชิกอยู่ สถิติลำดับคือค่าตัวอย่างของตัวแปรสุ่ม เอ็กซ์ถูกเรียงลำดับจากน้อยไปมาก (จัดอันดับ) ค่าของคุณลักษณะจะถูกเรียกว่า ตัวเลือก.
ตัวอย่าง- ชุดวัตถุที่สุ่มเลือกมาเกือบจะเหมือนกัน - ธนาคารพาณิชย์ของเขตบริหารหนึ่งของมอสโก ถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทั้งหมดในเขตนี้ และเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทุกแห่งในมอสโก ตลอดจนตัวอย่างจากธนาคารพาณิชย์ของประเทศ เป็นต้น
วิธีการพื้นฐานในการจัดการเก็บตัวอย่าง
ความน่าเชื่อถือของข้อสรุปทางสถิติและการตีความผลลัพธ์ที่มีความหมายขึ้นอยู่กับ ความเป็นตัวแทนตัวอย่างเช่น ความสมบูรณ์และเพียงพอของการเป็นตัวแทนของคุณสมบัติของประชากรทั่วไปซึ่งสัมพันธ์กับตัวอย่างนี้สามารถถือว่าเป็นตัวแทนได้ การศึกษาคุณสมบัติทางสถิติของประชากรสามารถจัดได้สองวิธี: การใช้ อย่างต่อเนื่องและ ไม่ต่อเนื่อง การสังเกตอย่างต่อเนื่องจัดให้มีการตรวจสอบทั้งหมด หน่วยศึกษา จำนวนทั้งสิ้น, ก การสังเกตบางส่วน (เลือก)- เพียงบางส่วนเท่านั้น
มีห้าวิธีหลักในการจัดการการสังเกตตัวอย่าง:
1. สุ่มเลือกอย่างง่ายซึ่งวัตถุจะถูกสุ่มเลือกจากประชากรของวัตถุ (เช่น การใช้ตารางหรือตัวสร้างตัวเลขสุ่ม) โดยแต่ละตัวอย่างที่เป็นไปได้มีความน่าจะเป็นเท่ากัน ตัวอย่างดังกล่าวเรียกว่า สุ่มจริงๆ;
2. การเลือกอย่างง่ายโดยใช้ขั้นตอนปกติดำเนินการโดยใช้ส่วนประกอบทางกล (เช่น วันที่ วันในสัปดาห์ หมายเลขอพาร์ตเมนต์ ตัวอักษร ฯลฯ) และตัวอย่างที่ได้รับในลักษณะนี้เรียกว่า เครื่องกล;
3. แบ่งชั้นการคัดเลือกประกอบด้วยข้อเท็จจริงที่ว่าประชากรทั่วไปของปริมาตรถูกแบ่งออกเป็นประชากรย่อยหรือชั้น (ชั้น) ของปริมาตร ดังนั้น ชั้นเป็นวัตถุที่เป็นเนื้อเดียวกันในแง่ของลักษณะทางสถิติ (เช่น ประชากรแบ่งออกเป็นชั้นตามกลุ่มอายุหรือชนชั้นทางสังคม วิสาหกิจตามอุตสาหกรรม) ในกรณีนี้จะมีการเรียกตัวอย่าง แบ่งชั้น(มิฉะนั้น, แบ่งชั้น, โดยทั่วไป, แบ่งเขต);
4.วิธีการ อนุกรมการคัดเลือกถูกนำมาใช้เพื่อสร้าง อนุกรมหรือ ตัวอย่างรัง- สะดวกหากจำเป็นต้องสำรวจ "บล็อก" หรือชุดของวัตถุในคราวเดียว (เช่น ชุดสินค้า ผลิตภัณฑ์ของชุดใดชุดหนึ่ง หรือจำนวนประชากรของเขตการปกครองและอาณาเขตของประเทศ) การเลือกซีรี่ส์สามารถทำได้ทั้งแบบสุ่มหรือโดยกลไก ในกรณีนี้จะมีการตรวจสอบสินค้าบางชุดหรือหน่วยอาณาเขตทั้งหมด (อาคารที่อยู่อาศัยหรือบล็อก) โดยสมบูรณ์
5. รวมกันการเลือก (แบบขั้นบันได) สามารถรวมวิธีการเลือกได้หลายวิธีพร้อมกัน (เช่น แบบแบ่งชั้นและสุ่ม หรือสุ่มและเชิงกล) ตัวอย่างดังกล่าวเรียกว่า รวมกัน.
ประเภทของการเลือก
โดย จิตใจการคัดเลือกรายบุคคล กลุ่ม และแบบรวมมีความโดดเด่น ที่ การเลือกรายบุคคลแต่ละหน่วยของประชากรทั่วไปจะถูกเลือกให้เป็นประชากรตัวอย่างด้วย การเลือกกลุ่ม- กลุ่มหน่วยที่เป็นเนื้อเดียวกัน (อนุกรม) ในเชิงคุณภาพ และ การเลือกแบบรวมเกี่ยวข้องกับการรวมประเภทที่หนึ่งและสองเข้าด้วยกัน
โดย วิธีการคัดเลือกมีความโดดเด่น ซ้ำและไม่ซ้ำซ้อนตัวอย่าง.
ทำซ้ำๆเรียกว่าการคัดเลือกโดยหน่วยที่รวมอยู่ในกลุ่มตัวอย่างจะไม่กลับคืนสู่ประชากรเดิมและไม่มีส่วนร่วมในการคัดเลือกต่อไป ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นจะลดลงในระหว่างกระบวนการคัดเลือก ที่ ซ้ำแล้วซ้ำเล่าการเลือก จับได้ในกลุ่มตัวอย่าง หน่วยหนึ่งหลังจากการลงทะเบียนจะถูกส่งกลับไปยังประชากรทั่วไป และด้วยเหตุนี้จึงยังคงมีโอกาสที่เท่าเทียมกันพร้อมกับหน่วยอื่น ๆ ที่จะใช้ในขั้นตอนการคัดเลือกเพิ่มเติม ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นยังคงไม่เปลี่ยนแปลง (วิธีนี้ไม่ค่อยมีการใช้ในการวิจัยทางเศรษฐกิจและสังคม) แต่ด้วยความใหญ่โต ยังไม่มีข้อความ (ยังไม่มี → ∞)สูตรสำหรับ ทำซ้ำได้การคัดเลือกเข้าใกล้ผู้ที่ ซ้ำแล้วซ้ำเล่าการเลือกและอันหลังมักใช้บ่อยกว่า ( N = ค่าคงที่).
ลักษณะพื้นฐานของพารามิเตอร์ของประชากรทั่วไปและประชากรตัวอย่าง
ข้อสรุปทางสถิติของการศึกษานี้ขึ้นอยู่กับการแจกแจงของตัวแปรสุ่มและค่าที่สังเกตได้ (x 1, x 2, ..., xn)เรียกว่าการรับรู้ตัวแปรสุ่ม เอ็กซ์(n คือขนาดตัวอย่าง) การแจกแจงของตัวแปรสุ่มในประชากรทั่วไปมีลักษณะทางทฤษฎีและเป็นอุดมคติ และมีลักษณะคล้ายคลึงกับตัวอย่าง เชิงประจักษ์การกระจาย. การแจกแจงทางทฤษฎีบางอย่างมีการระบุไว้ในเชิงวิเคราะห์ เช่น ของพวกเขา พารามิเตอร์กำหนดค่าของฟังก์ชันการแจกแจงในแต่ละจุดในปริภูมิของค่าที่เป็นไปได้ของตัวแปรสุ่ม สำหรับตัวอย่าง ฟังก์ชันการกระจายจึงเป็นเรื่องยากและบางครั้งก็ไม่สามารถระบุได้ พารามิเตอร์ถูกประมาณจากข้อมูลเชิงประจักษ์ จากนั้นจึงแทนที่เป็นนิพจน์เชิงวิเคราะห์ที่อธิบายการกระจายตัวทางทฤษฎี ในกรณีนี้ สมมติฐาน (หรือ สมมติฐาน) เกี่ยวกับประเภทของการแจกแจงอาจมีความถูกต้องทางสถิติหรือผิดพลาดก็ได้ แต่ไม่ว่าในกรณีใด การกระจายตัวเชิงประจักษ์ที่สร้างขึ้นใหม่จากตัวอย่างจะแสดงลักษณะเฉพาะของจริงโดยคร่าวๆ เท่านั้น พารามิเตอร์การกระจายที่สำคัญที่สุดคือ ความคาดหวังทางคณิตศาสตร์และความแปรปรวน
โดยธรรมชาติแล้วจะมีการแจกแจง อย่างต่อเนื่องและ ไม่ต่อเนื่อง- การกระจายตัวต่อเนื่องที่รู้จักกันดีที่สุดคือ ปกติ- ตัวอย่างของพารามิเตอร์ที่คล้ายคลึงกันได้แก่: ค่าเฉลี่ยและความแปรปรวนเชิงประจักษ์ ในบรรดางานวิจัยที่ไม่ต่อเนื่องในการวิจัยทางเศรษฐกิจและสังคม มีการใช้บ่อยที่สุด ทางเลือก (ขั้ว)การกระจาย. พารามิเตอร์ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้จะแสดงค่าสัมพัทธ์ (หรือ แบ่งปัน) หน่วยของประชากรที่มีลักษณะที่กำลังศึกษา (ระบุด้วยตัวอักษร) สัดส่วนของประชากรที่ไม่มีลักษณะนี้จะแสดงด้วยตัวอักษร คิว (คิว = 1 - พี)- ความแปรปรวนของการแจกแจงแบบทางเลือกยังมีการเปรียบเทียบเชิงประจักษ์ด้วย
ขึ้นอยู่กับประเภทของการแจกแจงและวิธีการเลือกหน่วยประชากร ลักษณะของพารามิเตอร์การแจกแจงจะถูกคำนวณแตกต่างกัน หลักสำหรับการแจกแจงทางทฤษฎีและเชิงประจักษ์แสดงไว้ในตาราง 9.1.
ตัวอย่างเศษส่วน k nอัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไปเรียกว่า:
kn = ไม่มี/ไม่มี.
ตัวอย่างเศษส่วน wคืออัตราส่วนของหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา xถึงขนาดตัวอย่าง n:
w = n n / n.
ตัวอย่าง.ในชุดสินค้าที่มีจำนวน 1,000 หน่วย โดยมีตัวอย่าง 5% แบ่งปันตัวอย่าง k nมูลค่าสัมบูรณ์คือ 50 หน่วย (เอ็น = น*0.05); หากพบสินค้าชำรุด 2 ชิ้นในตัวอย่างนี้แสดงว่า อัตราข้อบกพร่องตัวอย่าง wจะเป็น 0.04 (w = 2/50 = 0.04 หรือ 4%)
เนื่องจากประชากรกลุ่มตัวอย่างแตกต่างจากประชากรทั่วไปจึงมี ข้อผิดพลาดในการสุ่มตัวอย่าง.
ตารางที่ 9.1 พารามิเตอร์หลักของประชากรทั่วไปและประชากรตัวอย่างข้อผิดพลาดในการสุ่มตัวอย่าง
ไม่ว่าในกรณีใด (ต่อเนื่องและเลือก) อาจเกิดข้อผิดพลาดสองประเภท: การลงทะเบียนและการเป็นตัวแทน ข้อผิดพลาด การลงทะเบียนอาจมี สุ่มและ อย่างเป็นระบบอักขระ. สุ่มข้อผิดพลาดประกอบด้วยสาเหตุที่ควบคุมไม่ได้หลายประการ โดยไม่ได้ตั้งใจและมักจะเกิดความสมดุลระหว่างกัน (เช่น การเปลี่ยนแปลงประสิทธิภาพของอุปกรณ์เนื่องจากความผันผวนของอุณหภูมิในห้อง)
อย่างเป็นระบบข้อผิดพลาดมีอคติเนื่องจากละเมิดกฎในการเลือกวัตถุสำหรับตัวอย่าง (เช่น ความเบี่ยงเบนในการวัดเมื่อเปลี่ยนการตั้งค่าของอุปกรณ์วัด)
ตัวอย่าง.เพื่อประเมินสถานการณ์ทางสังคมของประชากรในเมือง มีการวางแผนที่จะสำรวจ 25% ของครอบครัว หากการเลือกอพาร์ทเมนต์ที่สี่ทุกแห่งขึ้นอยู่กับจำนวนก็อาจมีความเสี่ยงในการเลือกอพาร์ทเมนท์ทั้งหมดที่มีประเภทเดียวเท่านั้น (เช่นอพาร์ทเมนต์แบบหนึ่งห้อง) ซึ่งจะทำให้เกิดข้อผิดพลาดอย่างเป็นระบบและบิดเบือนผลลัพธ์ การเลือกหมายเลขอพาร์ทเมนต์ตามล็อตจะดีกว่าเนื่องจากข้อผิดพลาดจะเป็นแบบสุ่ม
ข้อผิดพลาดในการเป็นตัวแทนมีอยู่ในการสังเกตตัวอย่างเท่านั้น ไม่สามารถหลีกเลี่ยงได้ และเกิดขึ้นเนื่องจากการที่ประชากรตัวอย่างไม่ได้แพร่พันธุ์ประชากรทั่วไปได้อย่างสมบูรณ์ ค่าของตัวบ่งชี้ที่ได้จากตัวอย่างแตกต่างจากตัวบ่งชี้ของค่าเดียวกันในประชากรทั่วไป (หรือได้จากการสังเกตอย่างต่อเนื่อง)
อคติในการสุ่มตัวอย่างคือความแตกต่างระหว่างค่าพารามิเตอร์ในประชากรและค่าตัวอย่าง สำหรับค่าเฉลี่ยของคุณลักษณะเชิงปริมาณจะเท่ากับ: และสำหรับส่วนแบ่ง (คุณลักษณะทางเลือก) -
ข้อผิดพลาดในการสุ่มตัวอย่างมีอยู่ในการสังเกตตัวอย่างเท่านั้น ยิ่งข้อผิดพลาดเหล่านี้มากเท่าใด การกระจายเชิงประจักษ์ก็จะยิ่งแตกต่างจากการกระจายทางทฤษฎีมากขึ้นเท่านั้น พารามิเตอร์ของการแจกแจงเชิงประจักษ์เป็นตัวแปรสุ่ม ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างก็เป็นตัวแปรสุ่มเช่นกัน พวกเขาสามารถใช้ค่าที่แตกต่างกันสำหรับตัวอย่างที่แตกต่างกัน ดังนั้นจึงเป็นเรื่องปกติที่จะคำนวณ ข้อผิดพลาดโดยเฉลี่ย.
ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยคือปริมาณที่แสดงค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่างจากค่าคาดหวังทางคณิตศาสตร์ ค่านี้ขึ้นอยู่กับหลักการของการเลือกแบบสุ่ม ขึ้นอยู่กับขนาดตัวอย่างและระดับความแปรผันของคุณลักษณะเป็นหลัก: ยิ่งความแปรผันของคุณลักษณะมากหรือน้อย (และด้วยเหตุนี้ค่า) ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลง . ความสัมพันธ์ระหว่างความแปรปรวนของประชากรทั่วไปและประชากรตัวอย่างแสดงโดยสูตร:
เหล่านั้น. เมื่อใหญ่พอเราก็สรุปได้ว่า ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยแสดงให้เห็นความเบี่ยงเบนที่เป็นไปได้ของพารามิเตอร์ประชากรตัวอย่างจากพารามิเตอร์ประชากรทั่วไป ในตาราง ตารางที่ 9.2 แสดงนิพจน์สำหรับการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับวิธีการต่างๆ ในการจัดการสังเกตการณ์
ตารางที่ 9.2 ค่าคลาดเคลื่อนเฉลี่ย (m) ของค่าเฉลี่ยตัวอย่างและสัดส่วนสำหรับตัวอย่างประเภทต่างๆโดยที่ค่าเฉลี่ยของความแปรปรวนตัวอย่างภายในกลุ่มสำหรับแอตทริบิวต์ต่อเนื่อง
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มของสัดส่วน
— จำนวนซีรีส์ที่เลือก — จำนวนซีรีส์ทั้งหมด
,
ค่าเฉลี่ยของซีรีย์นั้นอยู่ที่ไหน
- ค่าเฉลี่ยโดยรวมของประชากรตัวอย่างทั้งหมดสำหรับลักษณะเฉพาะต่อเนื่อง
,
ส่วนแบ่งของคุณลักษณะในซีรีส์ th อยู่ที่ไหน
— ส่วนแบ่งรวมของลักษณะเฉพาะในประชากรตัวอย่างทั้งหมด
อย่างไรก็ตาม ขนาดของข้อผิดพลาดโดยเฉลี่ยสามารถตัดสินได้ด้วยความน่าจะเป็น P (P ≤ 1) เท่านั้น Lyapunov A.M. พิสูจน์ว่าการกระจายตัวของค่าเฉลี่ยตัวอย่าง และการเบี่ยงเบนไปจากค่าเฉลี่ยทั่วไปในจำนวนที่มากพอสมควร เป็นไปตามกฎการกระจายแบบปกติ โดยมีเงื่อนไขว่าประชากรทั่วไปมีค่าเฉลี่ยจำกัดและมีความแปรปรวนจำกัด
ในทางคณิตศาสตร์ ข้อความสำหรับค่าเฉลี่ยนี้แสดงเป็น:
และสำหรับการแบ่งใช้ นิพจน์ (1) จะอยู่ในรูปแบบ:
ที่ไหน - มี ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อยซึ่งเป็นผลคูณของข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย , และค่าสัมประสิทธิ์หลายหลากคือแบบทดสอบของนักเรียน ("ค่าสัมประสิทธิ์ความมั่นใจ") ที่เสนอโดย W.S. Gosset (นามแฝง "นักเรียน"); ค่าสำหรับขนาดตัวอย่างที่แตกต่างกันจะถูกเก็บไว้ในตารางพิเศษ
ค่าของฟังก์ชัน Ф(t) สำหรับค่าบางค่าของ t เท่ากับ:ดังนั้นนิพจน์ (3) จึงสามารถอ่านได้ดังนี้: ด้วยความน่าจะเป็น พี = 0.683 (68.3%)อาจเป็นที่ถกเถียงกันอยู่ว่าความแตกต่างระหว่างตัวอย่างและค่าเฉลี่ยทั่วไปจะไม่เกินหนึ่งค่าของข้อผิดพลาดโดยเฉลี่ย ม.(t=1)ด้วยความน่าจะเป็น พี = 0.954 (95.4%)- ว่าจะไม่เกินค่าของข้อผิดพลาดเฉลี่ยสองครั้ง ม. (เสื้อ = 2) ,ด้วยความน่าจะเป็น พี = 0.997 (99.7%)- จะไม่เกินสามค่า ม. (เสื้อ = 3) .ดังนั้นความน่าจะเป็นที่ความแตกต่างนี้จะเกินสามเท่าของข้อผิดพลาดโดยเฉลี่ยจึงถูกกำหนดโดย ระดับข้อผิดพลาดและไม่มีจำนวนอีกต่อไป 0,3% .
ในตาราง 9.3 แสดงสูตรคำนวณค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุด
ตารางที่ 9.3 ความคลาดเคลื่อนส่วนเพิ่ม (D) ของตัวอย่างสำหรับค่าเฉลี่ยและสัดส่วน (p) สำหรับการสังเกตตัวอย่างประเภทต่างๆลักษณะทั่วไปของผลลัพธ์ตัวอย่างต่อประชากร
เป้าหมายสูงสุดของการสังเกตตัวอย่างคือการจำแนกลักษณะของประชากรทั่วไป ด้วยขนาดตัวอย่างที่น้อย การประมาณค่าเชิงประจักษ์ของพารามิเตอร์ ( และ ) อาจเบี่ยงเบนไปจากค่าที่แท้จริง ( และ ) อย่างมีนัยสำคัญ ดังนั้นจึงจำเป็นต้องสร้างขอบเขตที่ค่าจริง ( และ ) อยู่สำหรับค่าตัวอย่างของพารามิเตอร์ ( และ )
ช่วงความเชื่อมั่นของพารามิเตอร์ใด ๆ θ ของประชากรทั่วไปคือช่วงสุ่มของค่าของพารามิเตอร์นี้ซึ่งมีความน่าจะเป็นใกล้กับ 1 ( ความน่าเชื่อถือ) มีค่าจริงของพารามิเตอร์นี้
ข้อผิดพลาดเล็กน้อยตัวอย่าง Δ ช่วยให้คุณกำหนดค่าที่ จำกัด ของลักษณะของประชากรทั่วไปและค่าของพวกเขา ช่วงความมั่นใจซึ่งเท่ากัน:
ขีดจำกัดล่าง ช่วงความมั่นใจได้จากการลบ ข้อผิดพลาดสูงสุดจากค่าเฉลี่ยตัวอย่าง (ส่วนแบ่ง) และค่าบนโดยบวกเข้าไป
ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยจะใช้ค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุด และสำหรับระดับความเชื่อมั่นที่กำหนดจะถูกกำหนดโดยสูตร:
ซึ่งหมายความว่าด้วยความน่าจะเป็นที่กำหนด รซึ่งเรียกว่าระดับความเชื่อมั่นและถูกกำหนดโดยค่าโดยไม่ซ้ำกัน ทีอาจเป็นที่ถกเถียงกันอยู่ว่ามูลค่าที่แท้จริงของค่าเฉลี่ยอยู่ในช่วงตั้งแต่ และมูลค่าที่แท้จริงของหุ้นอยู่ในช่วงตั้งแต่
เมื่อคำนวณช่วงความเชื่อมั่นสำหรับระดับความเชื่อมั่นมาตรฐานสามระดับ P = 95%, P = 99% และ P = 99.9%ค่าจะถูกเลือกโดย การสมัครขึ้นอยู่กับจำนวนองศาอิสระ หากขนาดตัวอย่างใหญ่พอ ค่าที่สอดคล้องกับความน่าจะเป็นเหล่านี้ ทีเท่าเทียมกัน: 1,96, 2,58 และ 3,29 - ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มทำให้สามารถกำหนดค่าที่ จำกัด ของลักษณะของประชากรและช่วงความเชื่อมั่น:
การขยายผลการสังเกตตัวอย่างไปยังประชากรทั่วไปในการวิจัยทางเศรษฐกิจและสังคมมีลักษณะเฉพาะของตนเอง เนื่องจากต้องมีการนำเสนอประเภทและกลุ่มทั้งหมดอย่างสมบูรณ์ พื้นฐานสำหรับความเป็นไปได้ของการกระจายดังกล่าวคือการคำนวณ ข้อผิดพลาดที่เกี่ยวข้อง:
ที่ไหน Δ % - ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดสัมพัทธ์ -
มีสองวิธีหลักในการขยายการสังเกตตัวอย่างไปยังประชากร: วิธีการคำนวณใหม่และค่าสัมประสิทธิ์โดยตรง.
เอสเซ้นส์ การแปลงโดยตรงประกอบด้วยการคูณค่าเฉลี่ยตัวอย่าง!!\overline(x) ด้วยขนาดของประชากร
ตัวอย่าง- ให้ประมาณจำนวนเด็กวัยหัดเดินโดยเฉลี่ยในเมืองด้วยวิธีสุ่มตัวอย่างและจำนวนเป็นหนึ่งคน หากมีครอบครัวเล็ก 1,000 ครอบครัวในเมือง จำนวนสถานที่ที่ต้องการในสถานรับเลี้ยงเด็กเทศบาลจะได้มาโดยการคูณค่าเฉลี่ยนี้ด้วยขนาดของประชากรทั่วไป N = 1,000 เช่น จะมีที่นั่ง 1,200 ที่นั่ง
วิธีการต่อรองขอแนะนำให้ใช้ในกรณีที่ดำเนินการสังเกตแบบเลือกเพื่อชี้แจงข้อมูลของการสังเกตอย่างต่อเนื่อง
ใช้สูตรต่อไปนี้:
โดยที่ตัวแปรทั้งหมดคือขนาดประชากร:
ขนาดตัวอย่างที่ต้องการ
ตารางที่ 9.4 ขนาดตัวอย่างที่ต้องการ (n) สำหรับองค์กรสังเกตการณ์ตัวอย่างประเภทต่างๆเมื่อวางแผนการสังเกตตัวอย่างด้วยค่าที่กำหนดไว้ล่วงหน้าของข้อผิดพลาดในการสุ่มตัวอย่างที่อนุญาต จำเป็นต้องประมาณค่าที่จำเป็นอย่างถูกต้อง ขนาดตัวอย่าง- ปริมาตรนี้สามารถกำหนดได้บนพื้นฐานของข้อผิดพลาดที่อนุญาตในระหว่างการสังเกตตัวอย่าง โดยขึ้นอยู่กับความน่าจะเป็นที่กำหนดซึ่งรับประกันค่าที่อนุญาตของระดับข้อผิดพลาด (โดยคำนึงถึงวิธีการจัดระเบียบการสังเกต) สูตรสำหรับกำหนดขนาดตัวอย่างที่ต้องการ n สามารถรับได้โดยตรงจากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ดังนั้นจากการแสดงออกของข้อผิดพลาดเล็กน้อย:
ขนาดตัวอย่างจะถูกกำหนดโดยตรง n:
สูตรนี้แสดงว่าเมื่อข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดลดลง Δ ขนาดตัวอย่างที่ต้องการจะเพิ่มขึ้นอย่างมาก ซึ่งเป็นสัดส่วนกับความแปรปรวนและกำลังสองของการทดสอบของนักเรียน
สำหรับวิธีการเฉพาะในการจัดการสังเกตการณ์ ขนาดตัวอย่างที่ต้องการจะคำนวณตามสูตรที่ให้ไว้ในตาราง 9.4.
ตัวอย่างการคำนวณเชิงปฏิบัติ
ตัวอย่างที่ 1 การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะเชิงปริมาณต่อเนื่อง
เพื่อประเมินความรวดเร็วในการชำระหนี้กับเจ้าหนี้ ธนาคารจึงสุ่มตัวอย่างเอกสารการชำระเงิน 10 ฉบับ ค่าของพวกเขาเท่ากัน (เป็นวัน): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.
จำเป็นด้วยความน่าจะเป็น พ = 0.954กำหนดข้อผิดพลาดเล็กน้อย Δ ค่าเฉลี่ยตัวอย่างและขีดจำกัดความเชื่อมั่นของเวลาในการคำนวณเฉลี่ย
สารละลาย.ค่าเฉลี่ยคำนวณโดยใช้สูตรจากตาราง 9.1 สำหรับประชากรตัวอย่าง
ความแปรปรวนคำนวณโดยใช้สูตรจากตาราง 9.1.
ค่าคลาดเคลื่อนกำลังสองเฉลี่ยของวัน
ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตร:
เหล่านั้น. ค่าเฉลี่ยคือ x ± m = 12.0 ± 2.3 วัน.
ความน่าเชื่อถือของค่าเฉลี่ยก็คือ
เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างซ้ำ เนื่องจากไม่ทราบขนาดประชากร และสำหรับ พ = 0.954ระดับความมั่นใจ
ดังนั้น ค่าเฉลี่ยคือ `x ± D = `x ± 2m = 12.0 ± 4.6 กล่าวคือ มูลค่าที่แท้จริงอยู่ในช่วง 7.4 ถึง 16.6 วัน
การใช้โต๊ะนักเรียน แอปพลิเคชันช่วยให้เราสรุปได้ว่าสำหรับ n = 10 - 1 = 9 องศาอิสระ ค่าที่ได้รับมีความน่าเชื่อถือโดยมีระดับนัยสำคัญเท่ากับ 0.001 ปอนด์ เช่น ค่าเฉลี่ยผลลัพธ์จะแตกต่างอย่างมากจาก 0
ตัวอย่างที่ 2 การประมาณค่าความน่าจะเป็น (ส่วนแบ่งทั่วไป) น.
ในระหว่างวิธีการสุ่มตัวอย่างเชิงกลเพื่อสำรวจสถานะทางสังคมของ 1,000 ครอบครัว พบว่าสัดส่วนของครอบครัวที่มีรายได้น้อยคือ ก = 0.3 (30%)(ตัวอย่างคือ 2% , เช่น. ไม่มี/ไม่มี = 0.02- จำเป็นด้วยระดับความมั่นใจ พี = 0.997กำหนดตัวบ่งชี้ รครอบครัวผู้มีรายได้น้อยทั่วทั้งภูมิภาค
สารละลาย.ขึ้นอยู่กับค่าฟังก์ชันที่นำเสนอ เอฟ(ที)ค้นหาระดับความมั่นใจที่กำหนด พ = 0.997ความหมาย เสื้อ = 3(ดูสูตร 3) ความคลาดเคลื่อนเล็กน้อยของเศษส่วน วกำหนดโดยสูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างแบบไม่ทำซ้ำ (การสุ่มตัวอย่างเชิงกลจะไม่ทำซ้ำเสมอ):
ข้อผิดพลาดในการสุ่มตัวอย่างสัมพัทธ์สูงสุดใน % จะเป็น:
ความน่าจะเป็น (ส่วนแบ่งทั่วไป) ของครอบครัวที่มีรายได้น้อยในภูมิภาคจะเป็น р=w±Δwและขีดจำกัดความเชื่อมั่น p คำนวณจากอสมการสองเท่า:
w — Δ w ≤ p ≤ w — Δ w, เช่น. มูลค่าที่แท้จริงของ p อยู่ภายใน:
0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.
ดังนั้นด้วยความน่าจะเป็นที่ 0.997 จึงระบุได้ว่าส่วนแบ่งของครอบครัวที่มีรายได้น้อยในทุกครอบครัวในภูมิภาคมีตั้งแต่ 28.6% ถึง 31.4%
ตัวอย่างที่ 3การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะที่ไม่ต่อเนื่องที่ระบุโดยชุดช่วง
ในตาราง 9.5. มีการระบุการกระจายแอปพลิเคชันสำหรับการผลิตคำสั่งซื้อตามเวลาที่องค์กรดำเนินการ
ตารางที่ 9.5 การกระจายการสังเกตตามเวลาที่ปรากฏสารละลาย. เวลาเฉลี่ยในการดำเนินการตามคำสั่งซื้อให้เสร็จสมบูรณ์คำนวณโดยใช้สูตร:
ระยะเวลาเฉลี่ยจะเป็น:
= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 เดือน
เราจะได้คำตอบเดียวกันหากเราใช้ข้อมูลบน p i จากคอลัมน์สุดท้ายของตาราง 9.5 โดยใช้สูตร:
โปรดทราบว่าจุดกึ่งกลางของช่วงเวลาสำหรับการไล่สีครั้งสุดท้ายนั้นพบได้โดยการเสริมด้วยความกว้างของช่วงเวลาของการไล่ระดับก่อนหน้าอย่างเทียมเท่ากับ 60 - 36 = 24 เดือน
ความแปรปรวนคำนวณโดยใช้สูตร
ที่ไหน x ฉัน- ช่วงกลางของอนุกรมช่วงเวลา
ดังนั้น!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) และค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ
ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตรรายเดือนเช่น ค่าเฉลี่ยคือ!!\overline(x) ± m = 23.1 ± 13.4
เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการคัดเลือกซ้ำ เนื่องจากไม่ทราบขนาดประชากร สำหรับระดับความเชื่อมั่น 0.954:
ดังนั้นค่าเฉลี่ยคือ:
เหล่านั้น. มูลค่าที่แท้จริงของมันอยู่ในช่วงตั้งแต่ 0 ถึง 50 เดือน
ตัวอย่างที่ 4เพื่อกำหนดความเร็วของการชำระหนี้กับเจ้าหนี้ของบริษัท N = 500 บริษัท ในธนาคารพาณิชย์ จำเป็นต้องทำการศึกษาตัวอย่างโดยใช้วิธีการสุ่มแบบไม่ซ้ำกัน จงหาขนาดตัวอย่างที่ต้องการ n โดยความน่าจะเป็น P = 0.954 ค่าคลาดเคลื่อนของค่าเฉลี่ยตัวอย่างจะไม่เกิน 3 วัน หากค่าประมาณการทดลองพบว่าค่าเบี่ยงเบนมาตรฐาน s คือ 10 วัน
สารละลาย- เพื่อกำหนดจำนวนการศึกษาที่จำเป็น n เราจะใช้สูตรสำหรับการเลือกแบบไม่ซ้ำกันจากตาราง 9.4:
ในนั้นค่า t ถูกกำหนดจากระดับความเชื่อมั่นที่ P = 0.954 มีค่าเท่ากับ 2 ค่ากำลังสองเฉลี่ยคือ s = 10 ขนาดประชากรคือ N = 500 และค่าคลาดเคลื่อนสูงสุดของค่าเฉลี่ยคือ Δ x = 3 เมื่อแทนค่าเหล่านี้ลงในสูตรเราจะได้:
เหล่านั้น. ก็เพียงพอที่จะรวบรวมตัวอย่าง 41 องค์กรเพื่อประเมินพารามิเตอร์ที่ต้องการ - ความเร็วของการชำระหนี้กับเจ้าหนี้
ทำไมต้องนำเสนอนี้? ประการแรก “ข้อผิดพลาดค่าเฉลี่ยกำลังสองตัวอย่าง/มาตรฐาน” เป็นชื่อที่ยาวและซับซ้อน ซึ่งมักจะถูกตัดทอนในปัญหาให้เป็นข้อผิดพลาด “ค่าเฉลี่ย” หรือ “มาตรฐาน” ความจริงที่ว่าพวกมันเป็นหนึ่งเดียวกันถือเป็นการค้นพบที่แท้จริงสำหรับฉันในคราวเดียว ข้อผิดพลาดอันฉาวโฉ่นี้มาในรูปแบบที่แตกต่างกันและมักจะเขียนแตกต่างกันซึ่งทำให้เกิดความสับสนมาก ปรากฎว่าสิ่งนี้เกิดขึ้นในหลาย ๆ ที่ แต่รูปลักษณ์ของมันเปลี่ยนไปอยู่ตลอดเวลา ด้วยเหตุนี้ เราจึงอัดสูตรจำนวนมากเมื่อเราทำได้โดยใช้เพียงหนึ่งหรือสองสูตร
มีการกำหนดไว้อย่างไร? ทันทีที่พวกเขาไม่ได้เยาะเย้ยผู้หญิงที่โชคร้าย! นี่คือการสะกดของข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยในการบรรยายและตำราเรียน พวกเขาเยาะเย้ยข้อผิดพลาดเศษส่วนในลักษณะเดียวกันหรือลืมไปเลยเกี่ยวกับการมีอยู่ของมันและเขียนสูตรลงในทันทีซึ่งทำให้นักเรียนที่โชคร้ายสับสนอย่างมาก ที่นี่ฉันจะเขียนแทนด้วย "ε" เพราะนี่คือการสรรเสริญพระเจ้าเป็นจดหมายที่หายากและไม่สามารถสับสนกับช่วงเวลาหรือค่าเบี่ยงเบนมาตรฐานแบบเลือกสรรได้
จริงๆ แล้ว สูตร (รากของความแปรปรวนด้วยจำนวนองค์ประกอบในตัวอย่าง หรือค่าเบี่ยงเบนมาตรฐานหารด้วยรากของปริมาตรตัวอย่าง) นี่คือสูตรพื้นฐาน รากฐาน พื้นฐานของฐานราก แค่เรียนรู้มันก็พอแล้วลงมือทำ! ยังไง? อ่านต่อ!
พันธุ์และที่มา 1. สำหรับการแบ่งปัน หุ้นมีการกระจายถือว่าผิดปกติ ถ้าส่วนแบ่งของคุณลักษณะที่กำลังศึกษาถูกถือเป็น p และส่วนแบ่งของ "อย่างอื่น" ถือเป็น q ความแปรปรวนจะเท่ากับ p*q หรือ p*(1 p) นี่คือที่มาของสูตร:
พันธุ์และแหล่งที่มา (2) 2. ฉันจะหาระบบส่วนเบี่ยงเบนมาตรฐานทั่วไปได้จากที่ไหน? σ ที่จริงคือค่าเบี่ยงเบนมาตรฐานทั่วไปที่มันจะให้คุณในโจทย์รูป มีทางออก - ความแปรปรวนตัวอย่าง S 2 ซึ่งอย่างที่ทุกคนรู้นั้นมีอคติ ดังนั้นเราจึงประเมินสิ่งทั่วไปดังนี้: (เพื่อที่คุณจะได้ไม่ต้องคิดเรื่องการย้าย) และแทนที่มัน หรือจะทำได้ทันที แต่มีเคล็ดลับเช่นนี้ ถ้า n>30 ความแตกต่างระหว่าง S และ σ นั้นน้อยมาก © ดังนั้นคุณจึงสามารถโกงและเขียนได้ง่ายขึ้น:
พันธุ์และแหล่งที่มา (3) “วงเล็บและเอนกิอื่นๆ มาจากไหน? - - » มี 2 วิธีในการสุ่มตัวอย่าง จำได้ไหม? - ซ้ำและไม่ซ้ำซ้อน ดังนั้น สูตรก่อนหน้านี้ทั้งหมดเหมาะสำหรับการสุ่มตัวอย่างซ้ำๆ หรือเมื่อตัวอย่าง n ที่สัมพันธ์กับประชากร N มีขนาดเล็กมากจนสามารถละเลยอัตราส่วน n/N ได้ ในกรณีที่มีความสำคัญโดยตรงที่ตัวอย่างจะต้องไม่เกิดซ้ำ หรือเมื่อปัญหาระบุอย่างชัดเจนว่ามีกี่หน่วยในประชากร ก็จำเป็นต้องใช้ตัวอย่างนั้น