ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยและสูงสุด ประชากรและวิธีการสุ่มตัวอย่าง

ทฤษฎีสถิติ: บันทึกการบรรยาย Burkhanova Inessa Viktorovna

3. ข้อผิดพลาดในการสุ่มตัวอย่าง

แต่ละหน่วยในการสังเกตตัวอย่างจะต้องมีโอกาสเท่ากันกับหน่วยอื่น ๆ ที่จะเลือก - นี่คือพื้นฐานของกลุ่มตัวอย่างแบบสุ่ม

การสุ่มตัวอย่างที่เหมาะสม คือ การเลือกหน่วยจากจำนวนประชากรทั้งหมดโดยการจับสลากหรือวิธีอื่นที่คล้ายคลึงกัน

หลักการของการสุ่มคือการที่การรวมหรือการยกเว้นรายการจากตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยอื่นใดนอกจากความบังเอิญ

แชร์ตัวอย่างคืออัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไป:

การเลือกสุ่มที่เหมาะสมในรูปแบบบริสุทธิ์นั้นเป็นการเลือกดั้งเดิมในบรรดาการเลือกประเภทอื่นๆ ทั้งหมด โดยมีและใช้หลักการพื้นฐานของการสังเกตทางสถิติแบบเลือกสรร

ตัวบ่งชี้ทั่วไปสองประเภทหลักที่ใช้ในวิธีการสุ่มตัวอย่างคือค่าเฉลี่ยของคุณลักษณะเชิงปริมาณและค่าสัมพัทธ์ของคุณลักษณะทางเลือก

เศษส่วนตัวอย่าง (w) หรือความเฉพาะเจาะจงถูกกำหนดโดยอัตราส่วนของจำนวนหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา ม.ถึง จำนวนทั้งหมดหน่วยของประชากรตัวอย่าง (n):

เพื่อระบุลักษณะความน่าเชื่อถือของตัวบ่งชี้ตัวอย่าง จะต้องแยกความแตกต่างระหว่างข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยและสูงสุด

ข้อผิดพลาดในการสุ่มตัวอย่างหรือที่เรียกว่าข้อผิดพลาดในการเป็นตัวแทนคือความแตกต่างระหว่างตัวอย่างที่สอดคล้องกันและคุณลักษณะทั่วไป:

?x =|x – x|;

?w =|x – พี|.

เท่านั้น การสังเกตตัวอย่างข้อผิดพลาดในการสุ่มตัวอย่างโดยธรรมชาติ

ค่าเฉลี่ยตัวอย่างและสัดส่วนตัวอย่าง– เหล่านี้เป็นตัวแปรสุ่มที่ใช้ค่าที่แตกต่างกันขึ้นอยู่กับหน่วยของประชากรทางสถิติที่กำลังศึกษาซึ่งรวมอยู่ในตัวอย่าง. ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างจึงเป็นตัวแปรสุ่มและอาจรับค่าที่ต่างกันได้เช่นกัน ดังนั้นจึงกำหนดค่าเฉลี่ยของข้อผิดพลาดที่เป็นไปได้ - ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะพิจารณาจากขนาดตัวอย่าง ยิ่งตัวเลขมากขึ้น สิ่งอื่นๆ จะเท่ากัน ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะน้อยลง ด้วยการครอบคลุมจำนวนหน่วยประชากรทั่วไปที่เพิ่มขึ้นด้วยการสำรวจตัวอย่าง เราจึงสามารถระบุลักษณะของประชากรทั่วไปทั้งหมดได้แม่นยำยิ่งขึ้น

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยขึ้นอยู่กับระดับของความแปรผันของคุณลักษณะที่กำลังศึกษา ในทางกลับกัน ระดับของความแปรผันจะมีลักษณะเฉพาะด้วยการกระจายตัว 2 หรือ ก(ล – ญ)– สำหรับสัญญาณทางเลือก ยิ่งความแปรผันของลักษณะและการกระจายตัวน้อยลงเท่าไรก็ยิ่งน้อยลงเท่านั้น ข้อผิดพลาดโดยเฉลี่ยตัวอย่างและในทางกลับกัน

ในกรณีที่สุ่มตัวอย่างซ้ำ ข้อผิดพลาดโดยเฉลี่ยจะถูกคำนวณตามทฤษฎีโดยใช้สูตรต่อไปนี้:

1) สำหรับลักษณะเชิงปริมาณโดยเฉลี่ย:

ที่ไหน? 2 – ค่าเฉลี่ยของการกระจายตัวของคุณลักษณะเชิงปริมาณ

2) สำหรับการแบ่งปัน (คุณลักษณะทางเลือก):

แล้วความแปรปรวนของลักษณะในประชากรเป็นเท่าไหร่? 2 ยังไม่ทราบแน่ชัด ในทางปฏิบัติ ใช้ค่าการกระจายตัว S 2 ที่คำนวณสำหรับประชากรตัวอย่างตามกฎหมาย จำนวนมากตามที่ประชากรตัวอย่างซึ่งมีขนาดตัวอย่างใหญ่เพียงพอ สามารถสร้างลักษณะของประชากรทั่วไปได้อย่างแม่นยำ

สูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับการสุ่มตัวอย่างใหม่มีดังต่อไปนี้ สำหรับค่าเฉลี่ยของคุณลักษณะเชิงปริมาณ: ความแปรปรวนทั่วไปจะแสดงผ่านความแปรปรวนแบบเลือกตามความสัมพันธ์ต่อไปนี้:

โดยที่ S 2 คือค่าการกระจายตัว

การสุ่มตัวอย่างทางกล– เป็นการเลือกหน่วยเป็นประชากรตัวอย่างจากประชากรทั่วไปโดยแบ่งตามเกณฑ์ที่เป็นกลางออกเป็นกลุ่มเท่าๆ กัน ดำเนินการในลักษณะที่เลือกเพียงหนึ่งหน่วยสำหรับตัวอย่างจากแต่ละกลุ่มดังกล่าว

ในการสุ่มตัวอย่างเชิงกล หน่วยของประชากรทางสถิติที่กำลังศึกษาจะถูกจัดเรียงเบื้องต้นตามลำดับที่แน่นอน หลังจากนั้นจึงเลือกหน่วยตามจำนวนที่กำหนดในช่วงเวลาหนึ่ง ในกรณีนี้ ขนาดของช่วงเวลาในประชากรจะเท่ากับค่าผกผันของสัดส่วนตัวอย่าง

เนื่องจากมีประชากรจำนวนมากเพียงพอ การเลือกทางกลจึงใกล้เคียงกับการสุ่มตัวอย่างเองในแง่ของความถูกต้องแม่นยำของผลลัพธ์ ดังนั้น เพื่อกำหนดข้อผิดพลาดโดยเฉลี่ยของการสุ่มตัวอย่างทางกล จึงมีการใช้สูตรสำหรับการสุ่มตัวอย่างด้วยตนเองแบบไม่ทำซ้ำ

ในการเลือกหน่วยจากประชากรที่ต่างกันจะใช้สิ่งที่เรียกว่าตัวอย่างทั่วไปซึ่งจะใช้เมื่อหน่วยทั้งหมดของประชากรทั่วไปสามารถแบ่งออกเป็นกลุ่มที่มีคุณภาพเหมือนกันหลายกลุ่มและคล้ายคลึงกันตามลักษณะที่ตัวบ่งชี้ที่กำลังศึกษาอยู่

จากนั้น จากแต่ละกลุ่มทั่วไป การเลือกหน่วยต่างๆ ในกลุ่มตัวอย่างจะดำเนินการโดยใช้ตัวอย่างแบบสุ่มหรือตัวอย่างเชิงกลล้วนๆ

การสุ่มตัวอย่างมักใช้เมื่อศึกษาประชากรทางสถิติที่ซับซ้อน

การสุ่มตัวอย่างโดยทั่วไปจะให้ผลลัพธ์ที่แม่นยำยิ่งขึ้น การพิมพ์ประชากรทั่วไปทำให้มั่นใจได้ถึงความเป็นตัวแทนของกลุ่มตัวอย่างดังกล่าว ซึ่งเป็นการเป็นตัวแทนของกลุ่มประเภทแต่ละกลุ่มในกลุ่มนั้น ซึ่งทำให้สามารถแยกอิทธิพลของการกระจายตัวระหว่างกลุ่มต่อข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยได้ ดังนั้น เมื่อพิจารณาค่าความผิดพลาดโดยเฉลี่ยของกลุ่มตัวอย่างทั่วไป ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มจะทำหน้าที่เป็นตัวบ่งชี้ความแปรผัน

การสุ่มตัวอย่างแบบอนุกรมเกี่ยวข้องกับการสุ่มเลือกจากประชากรทั่วไปของกลุ่มที่เท่ากัน เพื่อให้ทุกหน่วยในกลุ่มดังกล่าวสังเกตโดยไม่มีข้อยกเว้น

เนื่องจากภายในกลุ่ม (อนุกรม) มีการตรวจสอบทุกหน่วยโดยไม่มีข้อยกเว้น ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย (เมื่อเลือกอนุกรมที่เท่ากัน) ขึ้นอยู่กับการกระจายระหว่างกลุ่ม (อนุกรม) เท่านั้น

จากหนังสืองบประมาณส่วนบุคคล เงินอยู่ภายใต้การควบคุม ผู้เขียน มาคารอฟ เซอร์เกย์ วลาดิมิโรวิช

ข้อผิดพลาดของผู้อยู่อาศัย คุณสามารถจัดการกับข้อผิดพลาดได้หลายวิธี: คุณสามารถกลัวที่จะทำผิดพลาดและกังวลเกี่ยวกับแต่ละข้อผิดพลาด คุณสามารถชื่นชมยินดีกับความผิดพลาดและวิกฤตการณ์ของคุณในฐานะตัวชี้บนเส้นทางสู่ความสำเร็จและชัยชนะส่วนตัว สิ่งเดียวที่เกี่ยวกับข้อผิดพลาดอยู่เสมอคือคุณต้องจ่ายเงินเพื่อความผิดพลาดเหล่านั้น

จากหนังสือคู่มือการตรวจสอบภายใน ความเสี่ยงและกระบวนการทางธุรกิจ ผู้เขียน Kryshkin Oleg

การสุ่มตัวอย่าง ขั้นตอนการสุ่มตัวอย่างถือเป็นขั้นตอนสำคัญของโครงการตรวจสอบภายใน โดยมีการอธิบายรายละเอียดไว้ในแหล่งต่างๆ ในหัวข้อการตรวจสอบ อย่างไรก็ตาม คำอธิบายดังกล่าวมีลักษณะทางวิชาการหลายประการ ฉันขอแนะนำให้มุ่งเน้นไปที่สิ่งเหล่านั้น

จากหนังสือ The Psychology of Investments [วิธีหยุดทำเรื่องโง่ ๆ ด้วยเงินของคุณ] โดยริชาร์ดส คาร์ล

ข้อผิดพลาดในการลงทุนคือข้อผิดพลาดของนักลงทุน ตอนนี้ฉันมั่นใจมากขึ้นกว่าเดิมว่าข้อผิดพลาดในการลงทุนทั้งหมดเป็นข้อผิดพลาดของนักลงทุนจริงๆ ต่างจากนักลงทุน การลงทุนเป็นทางเลือก ตรงนี้เกี่ยวกับเรื่องนี้

ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

29. การกำหนดขนาดตัวอย่างที่ต้องการ หลักการทางวิทยาศาสตร์ประการหนึ่งในทฤษฎีของวิธีการสุ่มตัวอย่างคือ การตรวจสอบให้แน่ใจว่ามีหน่วยที่เลือกในจำนวนที่เพียงพอ ข้อผิดพลาดในการสุ่มตัวอย่างมาตรฐานที่ลดลงมักสัมพันธ์กับการเพิ่มขนาดตัวอย่างเสมอ การคำนวณ

จากหนังสือ ทฤษฎีทั่วไปสถิติ ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

30. วิธีการเลือกและประเภทของการชักตัวอย่าง การสุ่มตัวอย่างตามจริง ตามทฤษฎีของวิธีการสุ่มตัวอย่าง วิธีการเลือกและประเภทของการสุ่มตัวอย่างต่างๆ ได้รับการพัฒนาขึ้นเพื่อให้มั่นใจถึงความเป็นตัวแทน วิธีการคัดเลือกหมายถึงขั้นตอนการคัดเลือกหน่วยจากประชากรทั่วไป

จากหนังสือทฤษฎีสถิติทั่วไป ผู้เขียน ชเชอร์บินา ลิดิยา วลาดิเมียร์รอฟนา

31. การสุ่มตัวอย่างทางกลและการสุ่มตัวอย่างทั่วไป ในการสุ่มตัวอย่างทางกลล้วนๆ อันดับแรกควรนำเสนอประชากรทั่วไปทั้งหมดของหน่วยในรูปแบบของรายการหน่วยคัดเลือก ซึ่งรวบรวมตามลำดับบางอย่างที่เป็นกลางโดยสัมพันธ์กับลักษณะที่กำลังศึกษา จากนั้นรายการ

32. การสุ่มตัวอย่างแบบอนุกรมและแบบรวม การสุ่มตัวอย่างแบบอนุกรม (คลัสเตอร์) เป็นรูปแบบหนึ่งของการก่อตัวของประชากรตัวอย่างเมื่อไม่ใช่หน่วยที่จะสำรวจ แต่กลุ่มของหน่วย (อนุกรม, รัง) จะถูกเลือกโดยการสุ่ม ภายในซีรีส์ที่เลือก (รัง)

33. การสุ่มตัวอย่างแบบหลายขั้นตอน หลายเฟส และแบบแทรกซึม ลักษณะเฉพาะของการสุ่มตัวอย่างแบบหลายขั้นตอนคือ ประชากรตัวอย่างจะค่อยๆ ก่อตัวขึ้นตามขั้นตอนการคัดเลือก ในระยะแรกให้ใช้วิธีการและประเภทของการเลือกที่กำหนดไว้ล่วงหน้า

ผู้เขียน โคนิค นีน่า วลาดีมีรอฟนา

3. การกำหนดขนาดตัวอย่างที่ต้องการ หลักการทางวิทยาศาสตร์ประการหนึ่งในทฤษฎีการสุ่มตัวอย่างคือ การตรวจสอบให้แน่ใจว่ามีจำนวนหน่วยที่เลือกเพียงพอ ตามทฤษฎี ความจำเป็นในการปฏิบัติตามหลักการนี้แสดงไว้ในบทพิสูจน์ทฤษฎีบทขีดจำกัด

จากหนังสือทฤษฎีสถิติทั่วไป: บันทึกการบรรยาย ผู้เขียน โคนิค นีน่า วลาดีมีรอฟนา

4. วิธีการเลือกและประเภทของการสุ่มตัวอย่าง ตามทฤษฎีของวิธีการสุ่มตัวอย่างนั้นได้มีการพัฒนาวิธีการเลือกและประเภทของการสุ่มตัวอย่างที่หลากหลายเพื่อให้มั่นใจถึงความเป็นตัวแทน วิธีการคัดเลือกหมายถึงขั้นตอนการคัดเลือกหน่วยจากประชากรทั่วไป มีสองวิธีในการเลือก: ซ้ำ

จากหนังสือทฤษฎีสถิติ ผู้เขียน บูร์ฮาโนวา อิเนสซา วิคโตรอฟนา

36. ข้อผิดพลาดในการสุ่มตัวอย่าง การสุ่มตัวอย่างที่เหมาะสมคือการเลือกหน่วยจากประชากรทั้งหมดโดยการจับฉลากหรือวิธีการอื่นที่คล้ายคลึงกัน หลักการของการสุ่มก็คือ การรวมหรือแยกวัตถุออกจากตัวอย่างไม่สามารถได้รับอิทธิพลจากปัจจัยใดๆ

จากหนังสือ Business Correspondence: คู่มือการฝึกอบรม ผู้เขียน เคอร์ซาโนวา มาเรีย วลาดิมีรอฟนา

ข้อผิดพลาดด้านคำศัพท์ 1. การใช้คำและคำศัพท์ไม่ถูกต้อง ข้อผิดพลาดจำนวนมากใน จดหมายธุรกิจหมายถึงคำศัพท์ การรู้หนังสือไม่เพียงพอไม่เพียงแต่นำไปสู่เรื่องไร้สาระที่น่าสงสัยเท่านั้น แต่ยังนำไปสู่คำศัพท์เฉพาะทางและศัพท์เฉพาะทางวิชาชีพด้วย

จากหนังสือ ยุคใหม่- ความกังวลเก่าๆ : เศรษฐกิจการเมือง ผู้เขียน ยาซิน เยฟเกนีย์ กริกอรีวิช

5 ข้อผิดพลาดของเรา เรายืนยัน: แนวทางการปฏิรูปตลาดที่เลือกนั้นถูกต้อง และพวกเขาไม่ได้ล้มเหลวเลย พวกเขาแค่สะดุดอีกครั้ง แต่มีข้อผิดพลาดและการละเว้น สิ่งเหล่านี้เป็นความผิดพลาดของเราและความผิดพลาดของผู้นำประเทศซึ่งเราไม่สามารถป้องกันได้ ข้อผิดพลาด - ในหลาย ๆ ด้าน

โดย Kurtis Face

ความสำคัญของขนาดตัวอย่าง ดังที่ได้กล่าวไปแล้ว ผู้คนมักจะให้ความสนใจมากเกินไปกับปรากฏการณ์ที่เกิดขึ้นซึ่งเกิดขึ้นไม่บ่อยนัก แม้ว่าจากมุมมองทางสถิติแล้ว เป็นไปไม่ได้ที่จะดึงข้อมูลจำนวนมากจากบางกรณีได้ นี่คือเหตุผลหลัก

จากหนังสือ วิถีแห่งเต่า จากมือสมัครเล่นไปจนถึงเทรดเดอร์ระดับตำนาน โดย Kurtis Face

ตัวอย่างตัวแทน ความเป็นตัวแทนของการทดสอบของเราเพื่อวัตถุประสงค์ในการทำนายอนาคตถูกกำหนดโดยปัจจัยสองประการ: – จำนวนตลาด: การทดสอบที่ดำเนินการในตลาดที่แตกต่างกันมักจะรวมถึงตลาดที่มี องศาที่แตกต่างกันประเภทความผันผวน

ขนาดตัวอย่าง แนวคิดเรื่องขนาดตัวอย่างนั้นเรียบง่าย: เพื่อที่จะได้ข้อสรุปที่ถูกต้องทางสถิติ คุณจำเป็นต้องมีตัวอย่างที่มีขนาดใหญ่เพียงพอ ยิ่งตัวอย่างมีขนาดเล็กเท่าไร ข้อสรุปก็จะยิ่งหยาบมากขึ้นเท่านั้น ยิ่งตัวอย่างมีขนาดใหญ่ คุณภาพของข้อสรุปก็จะยิ่งดีขึ้นเท่านั้น ไม่มี

เป็นค่าความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างและประชากรทั่วไปที่ไม่เกิน ±6 (เดลต้า)

ขึ้นอยู่กับ ทฤษฎีบทของ Chebyshev P. L. ค่าความผิดพลาดโดยเฉลี่ยด้วยการสุ่มเลือกซ้ำจะคำนวณโดยใช้สูตร (สำหรับคุณลักษณะเชิงปริมาณเฉลี่ย):

โดยที่ตัวเศษคือความแปรปรวนของคุณลักษณะ x ในประชากรตัวอย่าง
n คือขนาดของประชากรตัวอย่าง

สำหรับคุณลักษณะทางเลือก ให้ใช้สูตรสำหรับค่าความคลาดเคลื่อนในการสุ่มตัวอย่างเฉลี่ยสำหรับสัดส่วน โดยทฤษฎีบทของเจ. เบอร์นูลลีคำนวณโดยสูตร:

โดยที่ p(1-p) คือการกระจายตัวของส่วนแบ่งของลักษณะเฉพาะในประชากรทั่วไป
n - ขนาดตัวอย่าง

เนื่องจากไม่ทราบความแปรปรวนของคุณลักษณะในประชากรทั่วไปอย่างแม่นยำ ในทางปฏิบัติจึงใช้ค่าความแปรปรวน ซึ่งคำนวณสำหรับประชากรตัวอย่างตาม กฎของจำนวนมาก- ตามกฎหมายนี้ ประชากรตัวอย่างที่มีขนาดตัวอย่างขนาดใหญ่สามารถจำลองลักษณะของประชากรทั่วไปได้อย่างแม่นยำ

ดังนั้นสูตรการคำนวณ ข้อผิดพลาดโดยเฉลี่ยสำหรับการสุ่มตัวอย่างใหม่ จะมีลักษณะเช่นนี้:

1. สำหรับลักษณะเชิงปริมาณโดยเฉลี่ย:

โดยที่ S^2 คือความแปรปรวนของคุณลักษณะ x ในประชากรตัวอย่าง
n - ขนาดตัวอย่าง

โดยที่ w (1 - w) คือการกระจายตัวของสัดส่วนของลักษณะเฉพาะที่กำลังศึกษาในกลุ่มประชากรตัวอย่าง

ในทฤษฎีความน่าจะเป็นแสดงให้เห็นว่ามันถูกแสดงผ่านตัวอย่างตามสูตร:

ในกรณี ตัวอย่างเล็กๆเมื่อปริมาตรน้อยกว่า 30 จำเป็นต้องคำนึงถึงค่าสัมประสิทธิ์ n/(n-1) จากนั้นคำนวณข้อผิดพลาดโดยเฉลี่ยของกลุ่มตัวอย่างขนาดเล็กโดยใช้สูตร:

เนื่องจากในกระบวนการสุ่มตัวอย่างแบบไม่ทำซ้ำ จำนวนหน่วยในประชากรทั่วไปจะลดลง ดังนั้นในสูตรข้างต้นสำหรับคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย นิพจน์รากจะต้องคูณด้วย 1- (n/N)

สูตรการคำนวณสำหรับการสุ่มตัวอย่างประเภทนี้จะมีลักษณะดังนี้:

1. สำหรับลักษณะเชิงปริมาณโดยเฉลี่ย:

โดยที่ N คือปริมาตรของประชากรทั่วไป n - ขนาดตัวอย่าง

2. สำหรับการแบ่งปัน (คุณลักษณะทางเลือก):

โดยที่ 1- (n/N) คือสัดส่วนของหน่วยในประชากรทั่วไปที่ไม่รวมอยู่ในกลุ่มตัวอย่าง

เนื่องจาก n จะน้อยกว่า N เสมอ ดังนั้นปัจจัยเพิ่มเติม 1 - (n/N) จึงจะน้อยกว่า 1 เสมอ ซึ่งหมายความว่าข้อผิดพลาดโดยเฉลี่ยของการเลือกซ้ำจะน้อยกว่าการเลือกซ้ำเสมอ เมื่อสัดส่วนของหน่วยในประชากรทั่วไปที่ไม่รวมอยู่ในกลุ่มตัวอย่างมีนัยสำคัญ ค่า 1 - (n/N) จะใกล้เคียงกับ 1 จากนั้นจึงคำนวณค่าคลาดเคลื่อนโดยเฉลี่ยโดยใช้สูตรทั่วไป

ข้อผิดพลาดโดยเฉลี่ยขึ้นอยู่กับปัจจัยต่อไปนี้:

1. เมื่อใช้หลักการของการเลือกแบบสุ่ม ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะถูกกำหนด ประการแรก ตามขนาดตัวอย่าง: ยิ่งตัวเลขมาก ค่าก็จะยิ่งน้อยลง ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย- ประชากรทั่วไปจะมีลักษณะเฉพาะที่แม่นยำยิ่งขึ้นเมื่อมีหน่วยของประชากรนี้ครอบคลุมมากขึ้นโดยการสังเกตตัวอย่าง

2. ข้อผิดพลาดโดยเฉลี่ยยังขึ้นอยู่กับระดับความแปรผันของคุณลักษณะด้วย ระดับความแปรปรวนมีลักษณะเฉพาะคือ ยิ่งความแปรผันของคุณลักษณะ (การกระจายตัว) น้อยลง ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลงเท่านั้น ด้วยความแปรปรวนเป็นศูนย์ (แอตทริบิวต์ไม่แปรผัน) ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยจะเป็นศูนย์ ดังนั้น หน่วยใดๆ ในประชากรจะกำหนดลักษณะของประชากรทั้งหมดตามคุณลักษณะนี้

ประชากรทางสถิติ- ชุดของหน่วยที่มีลักษณะเฉพาะของมวล ลักษณะทั่วไป ความสม่ำเสมอในเชิงคุณภาพ และการมีอยู่ของการเปลี่ยนแปลง

ประชากรทางสถิติประกอบด้วยวัตถุที่มีอยู่อย่างมีนัยสำคัญ (พนักงาน องค์กร ประเทศ ภูมิภาค) เป็นวัตถุ

หน่วยของประชากร— แต่ละหน่วยเฉพาะของประชากรทางสถิติ

ประชากรทางสถิติเดียวกันสามารถมีลักษณะเป็นเนื้อเดียวกันได้ในลักษณะหนึ่งและต่างกันในลักษณะอื่นได้

ความสม่ำเสมอเชิงคุณภาพ- ความคล้ายคลึงกันของทุกหน่วยของประชากรในบางพื้นฐานและความแตกต่างจากหน่วยอื่น ๆ ทั้งหมด

ในประชากรทางสถิติ ความแตกต่างระหว่างหน่วยประชากรหนึ่งกับอีกหน่วยหนึ่งมักมีลักษณะเป็นเชิงปริมาณ การเปลี่ยนแปลงเชิงปริมาณในค่าลักษณะเฉพาะ หน่วยที่แตกต่างกันมวลรวมเรียกว่าการแปรผัน

การเปลี่ยนแปลงของลักษณะ- การเปลี่ยนแปลงเชิงปริมาณในลักษณะ (สำหรับลักษณะเชิงปริมาณ) ระหว่างการเปลี่ยนจากหน่วยประชากรหนึ่งไปยังอีกหน่วยหนึ่ง

เข้าสู่ระบบ- นี่คือทรัพย์สิน คุณลักษณะเฉพาะหรือลักษณะอื่นของหน่วย วัตถุ และปรากฏการณ์ที่สามารถสังเกตหรือวัดได้ สัญญาณแบ่งออกเป็นเชิงปริมาณและเชิงคุณภาพ ความหลากหลายและความแปรปรวนของมูลค่าของลักษณะเฉพาะในแต่ละหน่วยของประชากรเรียกว่า การเปลี่ยนแปลง.

ลักษณะเฉพาะ (เชิงคุณภาพ) ไม่สามารถแสดงเป็นตัวเลขได้ (องค์ประกอบของประชากรตามเพศ) ลักษณะเชิงปริมาณมีการแสดงออกเป็นตัวเลข (องค์ประกอบประชากรตามอายุ)

ตัวบ่งชี้- นี่เป็นลักษณะทั่วไปเชิงปริมาณและคุณภาพของทรัพย์สินใดๆ ของหน่วยหรือมวลรวมโดยรวมภายใต้เงื่อนไขเฉพาะของเวลาและสถานที่

ดัชนีชี้วัดคือชุดตัวชี้วัดที่สะท้อนปรากฏการณ์ที่กำลังศึกษาอย่างครอบคลุม

ตัวอย่างเช่น มีการศึกษาเงินเดือน:

เข้าสู่ระบบ - ค่าจ้าง
ประชากรทางสถิติ-พนักงานทุกคน
หน่วยประชากรคือพนักงานแต่ละคน
ความสม่ำเสมอเชิงคุณภาพ - ค่าจ้างสะสม
การเปลี่ยนแปลงของเครื่องหมาย - ชุดตัวเลข

ประชากรและกลุ่มตัวอย่างจากนั้น

พื้นฐานคือชุดของข้อมูลที่ได้รับจากการวัดคุณลักษณะตั้งแต่หนึ่งรายการขึ้นไป ชุดของวัตถุที่สังเกตได้อย่างแท้จริง ซึ่งแสดงทางสถิติด้วยการสังเกตตัวแปรสุ่มจำนวนหนึ่งคือ การสุ่มตัวอย่างและที่มีอยู่ตามสมมุติฐาน (การคาดเดา) - ประชากรทั่วไป- ประชากรอาจมีจำกัด (จำนวนการสังเกต N = ค่าคงที่) หรืออนันต์ ( ยังไม่มีข้อความ = ∞) และตัวอย่างจากประชากรจะเป็นผลมาจากการสังเกตในจำนวนที่จำกัดเสมอ เรียกว่าจำนวนการสังเกตที่ก่อตัวเป็นตัวอย่าง ขนาดตัวอย่าง- หากขนาดตัวอย่างใหญ่พอ ( n → ∞) พิจารณาตัวอย่างแล้ว ใหญ่มิฉะนั้นจะเรียกว่าการสุ่มตัวอย่าง ปริมาณจำกัด- โดยจะพิจารณาตัวอย่าง เล็กหากเมื่อทำการวัดตัวแปรสุ่มหนึ่งมิติขนาดตัวอย่างจะต้องไม่เกิน 30 ( n<= 30 ) และเมื่อทำการวัดหลายรายการพร้อมกัน ( เค) คุณลักษณะในปริภูมิความสัมพันธ์หลายมิติ nถึง เคไม่เกิน 10 (ไม่ระบุ< 10) - แบบฟอร์มตัวอย่าง ซีรีย์การเปลี่ยนแปลงถ้ามีสมาชิกอยู่ สถิติลำดับคือค่าตัวอย่างของตัวแปรสุ่ม เอ็กซ์ถูกเรียงลำดับจากน้อยไปมาก (จัดอันดับ) ค่าของคุณลักษณะจะถูกเรียกว่า ตัวเลือก.

ตัวอย่าง- ชุดวัตถุที่สุ่มเลือกมาเกือบจะเหมือนกัน - ธนาคารพาณิชย์ของเขตบริหารหนึ่งของมอสโก ถือได้ว่าเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทั้งหมดในเขตนี้ และเป็นตัวอย่างจากประชากรทั่วไปของธนาคารพาณิชย์ทุกแห่งในมอสโก ตลอดจนตัวอย่างจากธนาคารพาณิชย์ของประเทศ เป็นต้น

วิธีการพื้นฐานในการจัดการเก็บตัวอย่าง

ความน่าเชื่อถือของข้อสรุปทางสถิติและการตีความผลลัพธ์ที่มีความหมายขึ้นอยู่กับ ความเป็นตัวแทนตัวอย่างเช่น ความสมบูรณ์และเพียงพอของการเป็นตัวแทนของคุณสมบัติของประชากรทั่วไปซึ่งสัมพันธ์กับตัวอย่างนี้สามารถถือว่าเป็นตัวแทนได้ การศึกษาคุณสมบัติทางสถิติของประชากรสามารถจัดได้สองวิธี: การใช้ อย่างต่อเนื่องและ ไม่ต่อเนื่อง การสังเกตอย่างต่อเนื่องจัดให้มีการตรวจสอบทั้งหมด หน่วยศึกษา จำนวนทั้งสิ้น, ก การสังเกตบางส่วน (เลือก)- เพียงบางส่วนเท่านั้น

มีห้าวิธีหลักในการจัดการการสังเกตตัวอย่าง:

1. สุ่มเลือกอย่างง่ายซึ่งวัตถุจะถูกสุ่มเลือกจากประชากรของวัตถุ (เช่น การใช้ตารางหรือตัวสร้างตัวเลขสุ่ม) โดยแต่ละตัวอย่างที่เป็นไปได้มีความน่าจะเป็นเท่ากัน ตัวอย่างดังกล่าวเรียกว่า สุ่มจริงๆ;

2. การเลือกอย่างง่ายโดยใช้ขั้นตอนปกติดำเนินการโดยใช้ส่วนประกอบทางกล (เช่น วันที่ วันในสัปดาห์ หมายเลขอพาร์ตเมนต์ ตัวอักษร ฯลฯ) และตัวอย่างที่ได้รับในลักษณะนี้เรียกว่า เครื่องกล;

3. แบ่งชั้นการคัดเลือกประกอบด้วยข้อเท็จจริงที่ว่าประชากรทั่วไปของปริมาตรถูกแบ่งออกเป็นประชากรย่อยหรือชั้น (ชั้น) ของปริมาตร ดังนั้น ชั้นเป็นวัตถุที่เป็นเนื้อเดียวกันในแง่ของลักษณะทางสถิติ (เช่น ประชากรแบ่งออกเป็นชั้นตามกลุ่มอายุหรือชนชั้นทางสังคม วิสาหกิจตามอุตสาหกรรม) ในกรณีนี้จะมีการเรียกตัวอย่าง แบ่งชั้น(มิฉะนั้น, แบ่งชั้น, โดยทั่วไป, แบ่งเขต);

4.วิธีการ อนุกรมการคัดเลือกถูกนำมาใช้เพื่อสร้าง อนุกรมหรือ ตัวอย่างรัง- สะดวกหากจำเป็นต้องสำรวจ "บล็อก" หรือชุดของวัตถุในคราวเดียว (เช่น ชุดสินค้า ผลิตภัณฑ์ของชุดใดชุดหนึ่ง หรือจำนวนประชากรของเขตการปกครองและอาณาเขตของประเทศ) การเลือกซีรี่ส์สามารถทำได้ทั้งแบบสุ่มหรือโดยกลไก ในกรณีนี้จะมีการตรวจสอบสินค้าบางชุดหรือหน่วยอาณาเขตทั้งหมด (อาคารที่อยู่อาศัยหรือบล็อก) โดยสมบูรณ์

5. รวมกันการเลือก (แบบขั้นบันได) สามารถรวมวิธีการเลือกได้หลายวิธีพร้อมกัน (เช่น แบบแบ่งชั้นและสุ่ม หรือสุ่มและเชิงกล) ตัวอย่างดังกล่าวเรียกว่า รวมกัน.

ประเภทของการเลือก

โดย จิตใจการคัดเลือกรายบุคคล กลุ่ม และแบบรวมมีความโดดเด่น ที่ การเลือกรายบุคคลแต่ละหน่วยของประชากรทั่วไปจะถูกเลือกให้เป็นประชากรตัวอย่างด้วย การเลือกกลุ่ม- กลุ่มหน่วยที่เป็นเนื้อเดียวกัน (อนุกรม) ในเชิงคุณภาพ และ การเลือกแบบรวมเกี่ยวข้องกับการรวมประเภทที่หนึ่งและสองเข้าด้วยกัน

โดย วิธีการคัดเลือกมีความโดดเด่น ซ้ำและไม่ซ้ำซ้อนตัวอย่าง.

ทำซ้ำๆเรียกว่าการคัดเลือกโดยหน่วยที่รวมอยู่ในกลุ่มตัวอย่างจะไม่กลับคืนสู่ประชากรเดิมและไม่มีส่วนร่วมในการคัดเลือกต่อไป ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นจะลดลงในระหว่างกระบวนการคัดเลือก ที่ ซ้ำแล้วซ้ำเล่าการเลือก จับได้ในกลุ่มตัวอย่าง หน่วยหนึ่งหลังจากการลงทะเบียนจะถูกส่งกลับไปยังประชากรทั่วไป และด้วยเหตุนี้จึงยังคงมีโอกาสที่เท่าเทียมกันพร้อมกับหน่วยอื่น ๆ ที่จะใช้ในขั้นตอนการคัดเลือกเพิ่มเติม ในขณะที่จำนวนหน่วยของประชากรทั่วไป เอ็นยังคงไม่เปลี่ยนแปลง (วิธีนี้ไม่ค่อยมีการใช้ในการวิจัยทางเศรษฐกิจและสังคม) แต่ด้วยความใหญ่โต ยังไม่มีข้อความ (ยังไม่มี → ∞)สูตรสำหรับ ทำซ้ำได้การคัดเลือกเข้าใกล้ผู้ที่ ซ้ำแล้วซ้ำเล่าการเลือกและอันหลังมักใช้บ่อยกว่า ( N = ค่าคงที่).

ลักษณะพื้นฐานของพารามิเตอร์ของประชากรทั่วไปและประชากรตัวอย่าง

ข้อสรุปทางสถิติของการศึกษานี้ขึ้นอยู่กับการแจกแจงของตัวแปรสุ่มและค่าที่สังเกตได้ (x 1, x 2, ..., xn)เรียกว่าการรับรู้ตัวแปรสุ่ม เอ็กซ์(n คือขนาดตัวอย่าง) การแจกแจงของตัวแปรสุ่มในประชากรทั่วไปมีลักษณะทางทฤษฎีและเป็นอุดมคติ และมีลักษณะคล้ายคลึงกับตัวอย่าง เชิงประจักษ์การกระจาย. การแจกแจงทางทฤษฎีบางอย่างมีการระบุไว้ในเชิงวิเคราะห์ เช่น ของพวกเขา พารามิเตอร์กำหนดค่าของฟังก์ชันการแจกแจงในแต่ละจุดในปริภูมิของค่าที่เป็นไปได้ของตัวแปรสุ่ม สำหรับตัวอย่าง ฟังก์ชันการกระจายจึงเป็นเรื่องยากและบางครั้งก็ไม่สามารถระบุได้ พารามิเตอร์ถูกประมาณจากข้อมูลเชิงประจักษ์ จากนั้นจึงแทนที่เป็นนิพจน์เชิงวิเคราะห์ที่อธิบายการกระจายตัวทางทฤษฎี ในกรณีนี้ สมมติฐาน (หรือ สมมติฐาน) เกี่ยวกับประเภทของการแจกแจงอาจมีความถูกต้องทางสถิติหรือผิดพลาดก็ได้ แต่ไม่ว่าในกรณีใด การกระจายตัวเชิงประจักษ์ที่สร้างขึ้นใหม่จากตัวอย่างจะแสดงลักษณะเฉพาะของจริงโดยคร่าวๆ เท่านั้น พารามิเตอร์การกระจายที่สำคัญที่สุดคือ ความคาดหวังทางคณิตศาสตร์และความแปรปรวน

โดยธรรมชาติแล้วจะมีการแจกแจง อย่างต่อเนื่องและ ไม่ต่อเนื่อง- การกระจายตัวต่อเนื่องที่รู้จักกันดีที่สุดคือ ปกติ- ตัวอย่างของพารามิเตอร์ที่คล้ายคลึงกันได้แก่: ค่าเฉลี่ยและความแปรปรวนเชิงประจักษ์ ในบรรดางานวิจัยที่ไม่ต่อเนื่องในการวิจัยทางเศรษฐกิจและสังคม มีการใช้บ่อยที่สุด ทางเลือก (ขั้ว)การกระจาย. พารามิเตอร์ความคาดหวังทางคณิตศาสตร์ของการแจกแจงนี้จะแสดงค่าสัมพัทธ์ (หรือ แบ่งปัน) หน่วยของประชากรที่มีลักษณะที่กำลังศึกษา (ระบุด้วยตัวอักษร) สัดส่วนของประชากรที่ไม่มีลักษณะนี้จะแสดงด้วยตัวอักษร คิว (คิว = 1 - พี)- ความแปรปรวนของการแจกแจงแบบทางเลือกยังมีการเปรียบเทียบเชิงประจักษ์ด้วย

ขึ้นอยู่กับประเภทของการแจกแจงและวิธีการเลือกหน่วยประชากร ลักษณะของพารามิเตอร์การแจกแจงจะถูกคำนวณแตกต่างกัน หลักสำหรับการแจกแจงทางทฤษฎีและเชิงประจักษ์แสดงไว้ในตาราง 9.1.

ตัวอย่างเศษส่วน k nอัตราส่วนของจำนวนหน่วยในประชากรตัวอย่างต่อจำนวนหน่วยในประชากรทั่วไปเรียกว่า:

kn = ไม่มี/ไม่มี.

ตัวอย่างเศษส่วน wคืออัตราส่วนของหน่วยที่มีลักษณะเฉพาะที่กำลังศึกษา xถึงขนาดตัวอย่าง n:

w = n n / n.

ตัวอย่าง.ในชุดสินค้าที่มีจำนวน 1,000 หน่วย โดยมีตัวอย่าง 5% แบ่งปันตัวอย่าง k nมูลค่าสัมบูรณ์คือ 50 หน่วย (เอ็น = น*0.05); หากพบสินค้าชำรุด 2 ชิ้นในตัวอย่างนี้แสดงว่า อัตราข้อบกพร่องตัวอย่าง wจะเป็น 0.04 (w = 2/50 = 0.04 หรือ 4%)

เนื่องจากประชากรกลุ่มตัวอย่างแตกต่างจากประชากรทั่วไปจึงมี ข้อผิดพลาดในการสุ่มตัวอย่าง.

ตารางที่ 9.1 พารามิเตอร์หลักของประชากรทั่วไปและประชากรตัวอย่าง

ข้อผิดพลาดในการสุ่มตัวอย่าง

ไม่ว่าในกรณีใด (ต่อเนื่องและเลือก) อาจเกิดข้อผิดพลาดสองประเภท: การลงทะเบียนและการเป็นตัวแทน ข้อผิดพลาด การลงทะเบียนอาจมี สุ่มและ อย่างเป็นระบบอักขระ. สุ่มข้อผิดพลาดประกอบด้วยสาเหตุที่ควบคุมไม่ได้หลายประการ โดยไม่ได้ตั้งใจและมักจะเกิดความสมดุลระหว่างกัน (เช่น การเปลี่ยนแปลงประสิทธิภาพของอุปกรณ์เนื่องจากความผันผวนของอุณหภูมิในห้อง)

อย่างเป็นระบบข้อผิดพลาดมีอคติเนื่องจากละเมิดกฎในการเลือกวัตถุสำหรับตัวอย่าง (เช่น ความเบี่ยงเบนในการวัดเมื่อเปลี่ยนการตั้งค่าของอุปกรณ์วัด)

ตัวอย่าง.เพื่อประเมินสถานการณ์ทางสังคมของประชากรในเมือง มีการวางแผนที่จะสำรวจ 25% ของครอบครัว หากการเลือกอพาร์ทเมนต์ที่สี่ทุกแห่งขึ้นอยู่กับจำนวนก็อาจมีความเสี่ยงในการเลือกอพาร์ทเมนท์ทั้งหมดที่มีประเภทเดียวเท่านั้น (เช่นอพาร์ทเมนต์แบบหนึ่งห้อง) ซึ่งจะทำให้เกิดข้อผิดพลาดอย่างเป็นระบบและบิดเบือนผลลัพธ์ การเลือกหมายเลขอพาร์ทเมนต์ตามล็อตจะดีกว่าเนื่องจากข้อผิดพลาดจะเป็นแบบสุ่ม

ข้อผิดพลาดในการเป็นตัวแทนมีอยู่ในการสังเกตตัวอย่างเท่านั้น ไม่สามารถหลีกเลี่ยงได้ และเกิดขึ้นเนื่องจากการที่ประชากรตัวอย่างไม่ได้แพร่พันธุ์ประชากรทั่วไปได้อย่างสมบูรณ์ ค่าของตัวบ่งชี้ที่ได้จากตัวอย่างแตกต่างจากตัวบ่งชี้ของค่าเดียวกันในประชากรทั่วไป (หรือได้จากการสังเกตอย่างต่อเนื่อง)

อคติในการสุ่มตัวอย่างคือความแตกต่างระหว่างค่าพารามิเตอร์ในประชากรและค่าตัวอย่าง สำหรับค่าเฉลี่ยของคุณลักษณะเชิงปริมาณจะเท่ากับ: และสำหรับส่วนแบ่ง (คุณลักษณะทางเลือก) -

ข้อผิดพลาดในการสุ่มตัวอย่างมีอยู่ในการสังเกตตัวอย่างเท่านั้น ยิ่งข้อผิดพลาดเหล่านี้มากเท่าใด การกระจายเชิงประจักษ์ก็จะยิ่งแตกต่างจากการกระจายทางทฤษฎีมากขึ้นเท่านั้น พารามิเตอร์ของการแจกแจงเชิงประจักษ์เป็นตัวแปรสุ่ม ดังนั้น ข้อผิดพลาดในการสุ่มตัวอย่างก็เป็นตัวแปรสุ่มเช่นกัน พวกเขาสามารถใช้ค่าที่แตกต่างกันสำหรับตัวอย่างที่แตกต่างกัน ดังนั้นจึงเป็นเรื่องปกติที่จะคำนวณ ข้อผิดพลาดโดยเฉลี่ย.

ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยคือปริมาณที่แสดงค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยตัวอย่างจากค่าคาดหวังทางคณิตศาสตร์ ค่านี้ขึ้นอยู่กับหลักการของการเลือกแบบสุ่ม ขึ้นอยู่กับขนาดตัวอย่างและระดับความแปรผันของคุณลักษณะเป็นหลัก: ยิ่งความแปรผันของคุณลักษณะมากหรือน้อย (และด้วยเหตุนี้ค่า) ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยก็จะยิ่งน้อยลง . ความสัมพันธ์ระหว่างความแปรปรวนของประชากรทั่วไปและประชากรตัวอย่างแสดงโดยสูตร:

เหล่านั้น. เมื่อใหญ่พอเราก็สรุปได้ว่า ข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยแสดงให้เห็นความเบี่ยงเบนที่เป็นไปได้ของพารามิเตอร์ประชากรตัวอย่างจากพารามิเตอร์ประชากรทั่วไป ในตาราง ตารางที่ 9.2 แสดงนิพจน์สำหรับการคำนวณข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ยสำหรับวิธีการต่างๆ ในการจัดการสังเกตการณ์

ตารางที่ 9.2 ค่าคลาดเคลื่อนเฉลี่ย (m) ของค่าเฉลี่ยตัวอย่างและสัดส่วนสำหรับตัวอย่างประเภทต่างๆ

โดยที่ค่าเฉลี่ยของความแปรปรวนตัวอย่างภายในกลุ่มสำหรับแอตทริบิวต์ต่อเนื่อง

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่มของสัดส่วน

— จำนวนซีรีส์ที่เลือก — จำนวนซีรีส์ทั้งหมด

ค่าเฉลี่ยของซีรีย์นั้นอยู่ที่ไหน

- ค่าเฉลี่ยโดยรวมของประชากรตัวอย่างทั้งหมดสำหรับลักษณะเฉพาะต่อเนื่อง

ส่วนแบ่งของคุณลักษณะในซีรีส์ th อยู่ที่ไหน

— ส่วนแบ่งรวมของลักษณะเฉพาะในประชากรตัวอย่างทั้งหมด

อย่างไรก็ตาม ขนาดของข้อผิดพลาดโดยเฉลี่ยสามารถตัดสินได้ด้วยความน่าจะเป็น P (P ≤ 1) เท่านั้น Lyapunov A.M. พิสูจน์ว่าการกระจายตัวของค่าเฉลี่ยตัวอย่าง และการเบี่ยงเบนไปจากค่าเฉลี่ยทั่วไปในจำนวนที่มากพอสมควร เป็นไปตามกฎการกระจายแบบปกติ โดยมีเงื่อนไขว่าประชากรทั่วไปมีค่าเฉลี่ยจำกัดและมีความแปรปรวนจำกัด

ในทางคณิตศาสตร์ ข้อความสำหรับค่าเฉลี่ยนี้แสดงเป็น:

และสำหรับการแบ่งใช้ นิพจน์ (1) จะอยู่ในรูปแบบ:

ที่ไหน - มี ข้อผิดพลาดในการสุ่มตัวอย่างเล็กน้อยซึ่งเป็นผลคูณของข้อผิดพลาดในการสุ่มตัวอย่างโดยเฉลี่ย , และค่าสัมประสิทธิ์หลายหลากคือแบบทดสอบของนักเรียน ("ค่าสัมประสิทธิ์ความมั่นใจ") ที่เสนอโดย W.S. Gosset (นามแฝง "นักเรียน"); ค่าสำหรับขนาดตัวอย่างที่แตกต่างกันจะถูกเก็บไว้ในตารางพิเศษ

ค่าของฟังก์ชัน Ф(t) สำหรับค่าบางค่าของ t เท่ากับ:

ดังนั้นนิพจน์ (3) จึงสามารถอ่านได้ดังนี้: ด้วยความน่าจะเป็น พี = 0.683 (68.3%)อาจเป็นที่ถกเถียงกันอยู่ว่าความแตกต่างระหว่างตัวอย่างและค่าเฉลี่ยทั่วไปจะไม่เกินหนึ่งค่าของข้อผิดพลาดโดยเฉลี่ย ม.(t=1)ด้วยความน่าจะเป็น พี = 0.954 (95.4%)- ว่าจะไม่เกินค่าของข้อผิดพลาดเฉลี่ยสองครั้ง ม. (เสื้อ = 2) ,ด้วยความน่าจะเป็น พี = 0.997 (99.7%)- จะไม่เกินสามค่า ม. (เสื้อ = 3) .ดังนั้นความน่าจะเป็นที่ความแตกต่างนี้จะเกินสามเท่าของข้อผิดพลาดโดยเฉลี่ยจึงถูกกำหนดโดย ระดับข้อผิดพลาดและไม่มีจำนวนอีกต่อไป 0,3% .

ในตาราง 9.3 แสดงสูตรคำนวณค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุด

ตารางที่ 9.3 ความคลาดเคลื่อนส่วนเพิ่ม (D) ของตัวอย่างสำหรับค่าเฉลี่ยและสัดส่วน (p) สำหรับการสังเกตตัวอย่างประเภทต่างๆ

ลักษณะทั่วไปของผลลัพธ์ตัวอย่างต่อประชากร

เป้าหมายสูงสุดของการสังเกตตัวอย่างคือการจำแนกลักษณะของประชากรทั่วไป ด้วยขนาดตัวอย่างที่น้อย การประมาณค่าเชิงประจักษ์ของพารามิเตอร์ ( และ ) อาจเบี่ยงเบนไปจากค่าที่แท้จริง ( และ ) อย่างมีนัยสำคัญ ดังนั้นจึงจำเป็นต้องสร้างขอบเขตที่ค่าจริง ( และ ) อยู่สำหรับค่าตัวอย่างของพารามิเตอร์ ( และ )

ช่วงความเชื่อมั่นของพารามิเตอร์ใด ๆ θ ของประชากรทั่วไปคือช่วงสุ่มของค่าของพารามิเตอร์นี้ซึ่งมีความน่าจะเป็นใกล้กับ 1 ( ความน่าเชื่อถือ) มีค่าจริงของพารามิเตอร์นี้

ข้อผิดพลาดเล็กน้อยตัวอย่าง Δ ช่วยให้คุณกำหนดค่าที่ จำกัด ของลักษณะของประชากรทั่วไปและค่าของพวกเขา ช่วงความมั่นใจซึ่งเท่ากัน:

ขีดจำกัดล่าง ช่วงความมั่นใจได้จากการลบ ข้อผิดพลาดสูงสุดจากค่าเฉลี่ยตัวอย่าง (ส่วนแบ่ง) และค่าบนโดยบวกเข้าไป

ช่วงความเชื่อมั่นสำหรับค่าเฉลี่ยจะใช้ค่าความผิดพลาดในการสุ่มตัวอย่างสูงสุด และสำหรับระดับความเชื่อมั่นที่กำหนดจะถูกกำหนดโดยสูตร:

ซึ่งหมายความว่าด้วยความน่าจะเป็นที่กำหนด รซึ่งเรียกว่าระดับความเชื่อมั่นและถูกกำหนดโดยค่าโดยไม่ซ้ำกัน ทีอาจเป็นที่ถกเถียงกันอยู่ว่ามูลค่าที่แท้จริงของค่าเฉลี่ยอยู่ในช่วงตั้งแต่ และมูลค่าที่แท้จริงของหุ้นอยู่ในช่วงตั้งแต่

เมื่อคำนวณช่วงความเชื่อมั่นสำหรับระดับความเชื่อมั่นมาตรฐานสามระดับ P = 95%, P = 99% และ P = 99.9%ค่าจะถูกเลือกโดย การสมัครขึ้นอยู่กับจำนวนองศาอิสระ หากขนาดตัวอย่างใหญ่พอ ค่าที่สอดคล้องกับความน่าจะเป็นเหล่านี้ ทีเท่าเทียมกัน: 1,96, 2,58 และ 3,29 - ดังนั้นข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มทำให้สามารถกำหนดค่าที่ จำกัด ของลักษณะของประชากรและช่วงความเชื่อมั่น:

การขยายผลการสังเกตตัวอย่างไปยังประชากรทั่วไปในการวิจัยทางเศรษฐกิจและสังคมมีลักษณะเฉพาะของตนเอง เนื่องจากต้องมีการนำเสนอประเภทและกลุ่มทั้งหมดอย่างสมบูรณ์ พื้นฐานสำหรับความเป็นไปได้ของการกระจายดังกล่าวคือการคำนวณ ข้อผิดพลาดที่เกี่ยวข้อง:

ที่ไหน Δ % - ข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดสัมพัทธ์ -

มีสองวิธีหลักในการขยายการสังเกตตัวอย่างไปยังประชากร: วิธีการคำนวณใหม่และค่าสัมประสิทธิ์โดยตรง.

เอสเซ้นส์ การแปลงโดยตรงประกอบด้วยการคูณค่าเฉลี่ยตัวอย่าง!!\overline(x) ด้วยขนาดของประชากร

ตัวอย่าง- ให้ประมาณจำนวนเด็กวัยหัดเดินโดยเฉลี่ยในเมืองด้วยวิธีสุ่มตัวอย่างและจำนวนเป็นหนึ่งคน หากมีครอบครัวเล็ก 1,000 ครอบครัวในเมือง จำนวนสถานที่ที่ต้องการในสถานรับเลี้ยงเด็กเทศบาลจะได้มาโดยการคูณค่าเฉลี่ยนี้ด้วยขนาดของประชากรทั่วไป N = 1,000 เช่น จะมีที่นั่ง 1,200 ที่นั่ง

วิธีการต่อรองขอแนะนำให้ใช้ในกรณีที่ดำเนินการสังเกตแบบเลือกเพื่อชี้แจงข้อมูลของการสังเกตอย่างต่อเนื่อง

ใช้สูตรต่อไปนี้:

โดยที่ตัวแปรทั้งหมดคือขนาดประชากร:

ขนาดตัวอย่างที่ต้องการ

ตารางที่ 9.4 ขนาดตัวอย่างที่ต้องการ (n) สำหรับองค์กรสังเกตการณ์ตัวอย่างประเภทต่างๆ

เมื่อวางแผนการสังเกตตัวอย่างด้วยค่าที่กำหนดไว้ล่วงหน้าของข้อผิดพลาดในการสุ่มตัวอย่างที่อนุญาต จำเป็นต้องประมาณค่าที่จำเป็นอย่างถูกต้อง ขนาดตัวอย่าง- ปริมาตรนี้สามารถกำหนดได้บนพื้นฐานของข้อผิดพลาดที่อนุญาตในระหว่างการสังเกตตัวอย่าง โดยขึ้นอยู่กับความน่าจะเป็นที่กำหนดซึ่งรับประกันค่าที่อนุญาตของระดับข้อผิดพลาด (โดยคำนึงถึงวิธีการจัดระเบียบการสังเกต) สูตรสำหรับกำหนดขนาดตัวอย่างที่ต้องการ n สามารถรับได้โดยตรงจากสูตรสำหรับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ดังนั้นจากการแสดงออกของข้อผิดพลาดเล็กน้อย:

ขนาดตัวอย่างจะถูกกำหนดโดยตรง n:

สูตรนี้แสดงว่าเมื่อข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดลดลง Δ ขนาดตัวอย่างที่ต้องการจะเพิ่มขึ้นอย่างมาก ซึ่งเป็นสัดส่วนกับความแปรปรวนและกำลังสองของการทดสอบของนักเรียน

สำหรับวิธีการเฉพาะในการจัดการสังเกตการณ์ ขนาดตัวอย่างที่ต้องการจะคำนวณตามสูตรที่ให้ไว้ในตาราง 9.4.

ตัวอย่างการคำนวณเชิงปฏิบัติ

ตัวอย่างที่ 1 การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะเชิงปริมาณต่อเนื่อง

เพื่อประเมินความรวดเร็วในการชำระหนี้กับเจ้าหนี้ ธนาคารจึงสุ่มตัวอย่างเอกสารการชำระเงิน 10 ฉบับ ค่าของพวกเขาเท่ากัน (เป็นวัน): 10; 3; 15; 15; 22; 7; 8; 1; 19; 20.

จำเป็นด้วยความน่าจะเป็น พ = 0.954กำหนดข้อผิดพลาดเล็กน้อย Δ ค่าเฉลี่ยตัวอย่างและขีดจำกัดความเชื่อมั่นของเวลาในการคำนวณเฉลี่ย

สารละลาย.ค่าเฉลี่ยคำนวณโดยใช้สูตรจากตาราง 9.1 สำหรับประชากรตัวอย่าง

ความแปรปรวนคำนวณโดยใช้สูตรจากตาราง 9.1.

ค่าคลาดเคลื่อนกำลังสองเฉลี่ยของวัน

ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตร:

เหล่านั้น. ค่าเฉลี่ยคือ x ± m = 12.0 ± 2.3 วัน.

ความน่าเชื่อถือของค่าเฉลี่ยก็คือ

เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างซ้ำ เนื่องจากไม่ทราบขนาดประชากร และสำหรับ พ = 0.954ระดับความมั่นใจ

ดังนั้น ค่าเฉลี่ยคือ `x ± D = `x ± 2m = 12.0 ± 4.6 กล่าวคือ มูลค่าที่แท้จริงอยู่ในช่วง 7.4 ถึง 16.6 วัน

การใช้โต๊ะนักเรียน แอปพลิเคชันช่วยให้เราสรุปได้ว่าสำหรับ n = 10 - 1 = 9 องศาอิสระ ค่าที่ได้รับมีความน่าเชื่อถือโดยมีระดับนัยสำคัญเท่ากับ 0.001 ปอนด์ เช่น ค่าเฉลี่ยผลลัพธ์จะแตกต่างอย่างมากจาก 0

ตัวอย่างที่ 2 การประมาณค่าความน่าจะเป็น (ส่วนแบ่งทั่วไป) น.

ในระหว่างวิธีการสุ่มตัวอย่างเชิงกลเพื่อสำรวจสถานะทางสังคมของ 1,000 ครอบครัว พบว่าสัดส่วนของครอบครัวที่มีรายได้น้อยคือ ก = 0.3 (30%)(ตัวอย่างคือ 2% , เช่น. ไม่มี/ไม่มี = 0.02- จำเป็นด้วยระดับความมั่นใจ พี = 0.997กำหนดตัวบ่งชี้ รครอบครัวผู้มีรายได้น้อยทั่วทั้งภูมิภาค

สารละลาย.ขึ้นอยู่กับค่าฟังก์ชันที่นำเสนอ เอฟ(ที)ค้นหาระดับความมั่นใจที่กำหนด พ = 0.997ความหมาย เสื้อ = 3(ดูสูตร 3) ความคลาดเคลื่อนเล็กน้อยของเศษส่วน วกำหนดโดยสูตรจากตาราง 9.3 สำหรับการสุ่มตัวอย่างแบบไม่ทำซ้ำ (การสุ่มตัวอย่างเชิงกลจะไม่ทำซ้ำเสมอ):

ข้อผิดพลาดในการสุ่มตัวอย่างสัมพัทธ์สูงสุดใน % จะเป็น:

ความน่าจะเป็น (ส่วนแบ่งทั่วไป) ของครอบครัวที่มีรายได้น้อยในภูมิภาคจะเป็น р=w±Δwและขีดจำกัดความเชื่อมั่น p คำนวณจากอสมการสองเท่า:

w — Δ w ≤ p ≤ w — Δ w, เช่น. มูลค่าที่แท้จริงของ p อยู่ภายใน:

0,3 — 0,014 < p <0,3 + 0,014, а именно от 28,6% до 31,4%.

ดังนั้นด้วยความน่าจะเป็นที่ 0.997 จึงระบุได้ว่าส่วนแบ่งของครอบครัวที่มีรายได้น้อยในทุกครอบครัวในภูมิภาคมีตั้งแต่ 28.6% ถึง 31.4%

ตัวอย่างที่ 3การคำนวณค่าเฉลี่ยและช่วงความเชื่อมั่นสำหรับคุณลักษณะที่ไม่ต่อเนื่องที่ระบุโดยชุดช่วง

ในตาราง 9.5. มีการระบุการกระจายแอปพลิเคชันสำหรับการผลิตคำสั่งซื้อตามเวลาที่องค์กรดำเนินการ

ตารางที่ 9.5 การกระจายการสังเกตตามเวลาที่ปรากฏ

สารละลาย. เวลาเฉลี่ยในการดำเนินการตามคำสั่งซื้อให้เสร็จสมบูรณ์คำนวณโดยใช้สูตร:

ระยะเวลาเฉลี่ยจะเป็น:

= (3*20 + 9*80 + 24*60 + 48*20 + 72*20)/200 = 23.1 เดือน

เราจะได้คำตอบเดียวกันหากเราใช้ข้อมูลบน p i จากคอลัมน์สุดท้ายของตาราง 9.5 โดยใช้สูตร:

โปรดทราบว่าจุดกึ่งกลางของช่วงเวลาสำหรับการไล่สีครั้งสุดท้ายนั้นพบได้โดยการเสริมด้วยความกว้างของช่วงเวลาของการไล่ระดับก่อนหน้าอย่างเทียมเท่ากับ 60 - 36 = 24 เดือน

ความแปรปรวนคำนวณโดยใช้สูตร

ที่ไหน x ฉัน- ช่วงกลางของอนุกรมช่วงเวลา

ดังนั้น!!\sigma = \frac (20^2 + 14^2 + 1 + 25^2 + 49^2)(4) และค่าคลาดเคลื่อนกำลังสองเฉลี่ยคือ

ข้อผิดพลาดโดยเฉลี่ยคำนวณโดยใช้สูตรรายเดือนเช่น ค่าเฉลี่ยคือ!!\overline(x) ± m = 23.1 ± 13.4

เราคำนวณข้อผิดพลาดสูงสุดโดยใช้สูตรจากตาราง 9.3 สำหรับการคัดเลือกซ้ำ เนื่องจากไม่ทราบขนาดประชากร สำหรับระดับความเชื่อมั่น 0.954:

ดังนั้นค่าเฉลี่ยคือ:

เหล่านั้น. มูลค่าที่แท้จริงของมันอยู่ในช่วงตั้งแต่ 0 ถึง 50 เดือน

ตัวอย่างที่ 4เพื่อกำหนดความเร็วของการชำระหนี้กับเจ้าหนี้ของบริษัท N = 500 บริษัท ในธนาคารพาณิชย์ จำเป็นต้องทำการศึกษาตัวอย่างโดยใช้วิธีการสุ่มแบบไม่ซ้ำกัน จงหาขนาดตัวอย่างที่ต้องการ n โดยความน่าจะเป็น P = 0.954 ค่าคลาดเคลื่อนของค่าเฉลี่ยตัวอย่างจะไม่เกิน 3 วัน หากค่าประมาณการทดลองพบว่าค่าเบี่ยงเบนมาตรฐาน s คือ 10 วัน

สารละลาย- เพื่อกำหนดจำนวนการศึกษาที่จำเป็น n เราจะใช้สูตรสำหรับการเลือกแบบไม่ซ้ำกันจากตาราง 9.4:

ในนั้นค่า t ถูกกำหนดจากระดับความเชื่อมั่นที่ P = 0.954 มีค่าเท่ากับ 2 ค่ากำลังสองเฉลี่ยคือ s = 10 ขนาดประชากรคือ N = 500 และค่าคลาดเคลื่อนสูงสุดของค่าเฉลี่ยคือ Δ x = 3 เมื่อแทนค่าเหล่านี้ลงในสูตรเราจะได้:

เหล่านั้น. ก็เพียงพอที่จะรวบรวมตัวอย่าง 41 องค์กรเพื่อประเมินพารามิเตอร์ที่ต้องการ - ความเร็วของการชำระหนี้กับเจ้าหนี้

ทำไมต้องนำเสนอนี้? ประการแรก “ข้อผิดพลาดค่าเฉลี่ยกำลังสองตัวอย่าง/มาตรฐาน” เป็นชื่อที่ยาวและซับซ้อน ซึ่งมักจะถูกตัดทอนในปัญหาให้เป็นข้อผิดพลาด “ค่าเฉลี่ย” หรือ “มาตรฐาน” ความจริงที่ว่าพวกมันเป็นหนึ่งเดียวกันถือเป็นการค้นพบที่แท้จริงสำหรับฉันในคราวเดียว ข้อผิดพลาดอันฉาวโฉ่นี้มาในรูปแบบที่แตกต่างกันและมักจะเขียนแตกต่างกันซึ่งทำให้เกิดความสับสนมาก ปรากฎว่าสิ่งนี้เกิดขึ้นในหลาย ๆ ที่ แต่รูปลักษณ์ของมันเปลี่ยนไปอยู่ตลอดเวลา ด้วยเหตุนี้ เราจึงอัดสูตรจำนวนมากเมื่อเราทำได้โดยใช้เพียงหนึ่งหรือสองสูตร

มีการกำหนดไว้อย่างไร? ทันทีที่พวกเขาไม่ได้เยาะเย้ยผู้หญิงที่โชคร้าย! นี่คือการสะกดของข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยในการบรรยายและตำราเรียน พวกเขาเยาะเย้ยข้อผิดพลาดเศษส่วนในลักษณะเดียวกันหรือลืมไปเลยเกี่ยวกับการมีอยู่ของมันและเขียนสูตรลงในทันทีซึ่งทำให้นักเรียนที่โชคร้ายสับสนอย่างมาก ที่นี่ฉันจะเขียนแทนด้วย "ε" เพราะนี่คือการสรรเสริญพระเจ้าเป็นจดหมายที่หายากและไม่สามารถสับสนกับช่วงเวลาหรือค่าเบี่ยงเบนมาตรฐานแบบเลือกสรรได้

จริงๆ แล้ว สูตร (รากของความแปรปรวนด้วยจำนวนองค์ประกอบในตัวอย่าง หรือค่าเบี่ยงเบนมาตรฐานหารด้วยรากของปริมาตรตัวอย่าง) นี่คือสูตรพื้นฐาน รากฐาน พื้นฐานของฐานราก แค่เรียนรู้มันก็พอแล้วลงมือทำ! ยังไง? อ่านต่อ!

พันธุ์และที่มา 1. สำหรับการแบ่งปัน หุ้นมีการกระจายถือว่าผิดปกติ ถ้าส่วนแบ่งของคุณลักษณะที่กำลังศึกษาถูกถือเป็น p และส่วนแบ่งของ "อย่างอื่น" ถือเป็น q ความแปรปรวนจะเท่ากับ p*q หรือ p*(1 p) นี่คือที่มาของสูตร:

พันธุ์และแหล่งที่มา (2) 2. ฉันจะหาระบบส่วนเบี่ยงเบนมาตรฐานทั่วไปได้จากที่ไหน? σ ที่จริงคือค่าเบี่ยงเบนมาตรฐานทั่วไปที่มันจะให้คุณในโจทย์รูป มีทางออก - ความแปรปรวนตัวอย่าง S 2 ซึ่งอย่างที่ทุกคนรู้นั้นมีอคติ ดังนั้นเราจึงประเมินสิ่งทั่วไปดังนี้: (เพื่อที่คุณจะได้ไม่ต้องคิดเรื่องการย้าย) และแทนที่มัน หรือจะทำได้ทันที แต่มีเคล็ดลับเช่นนี้ ถ้า n>30 ความแตกต่างระหว่าง S และ σ นั้นน้อยมาก © ดังนั้นคุณจึงสามารถโกงและเขียนได้ง่ายขึ้น:

พันธุ์และแหล่งที่มา (3) “วงเล็บและเอนกิอื่นๆ มาจากไหน? - - » มี 2 วิธีในการสุ่มตัวอย่าง จำได้ไหม? - ซ้ำและไม่ซ้ำซ้อน ดังนั้น สูตรก่อนหน้านี้ทั้งหมดเหมาะสำหรับการสุ่มตัวอย่างซ้ำๆ หรือเมื่อตัวอย่าง n ที่สัมพันธ์กับประชากร N มีขนาดเล็กมากจนสามารถละเลยอัตราส่วน n/N ได้ ในกรณีที่มีความสำคัญโดยตรงที่ตัวอย่างจะต้องไม่เกิดซ้ำ หรือเมื่อปัญหาระบุอย่างชัดเจนว่ามีกี่หน่วยในประชากร ก็จำเป็นต้องใช้ตัวอย่างนั้น

กำลังโหลด...

แบ่งปันกับเพื่อนของคุณ:

เพิ่มบทความนี้ในรายการโปรดของคุณเพื่อไม่ให้พลาด!