สรุปและจัดกลุ่มข้อมูลทางสถิติ Open Library - ห้องสมุดเปิดของข้อมูลการศึกษา

การจัดกลุ่มรอง

ในทางปฏิบัติ บางครั้งคุณต้องใช้การจัดกลุ่มที่มีอยู่ ซึ่งอาจเทียบไม่ได้เนื่องจากขอบเขตช่วงไม่เท่ากัน หรือ ปริมาณต่างๆกลุ่มที่ได้รับการจัดสรร หากต้องการนำการจัดกลุ่มดังกล่าวมาอยู่ในรูปแบบที่เทียบเคียงได้ จะใช้วิธีการจัดกลุ่มรอง

การจัดกลุ่มรองประกอบด้วยการจัดตั้งกลุ่มใหม่บนพื้นฐานของการจัดกลุ่มที่ทำไว้ก่อนหน้านี้

ในการจัดกลุ่มรอง จะใช้สองวิธีในการสร้างกลุ่มใหม่:

§ วิธีแรกคือการเสริมความแข็งแกร่งให้กับช่วงเริ่มต้น นี่เป็นวิธีการจัดกลุ่มรองที่ง่ายและธรรมดาที่สุด
§ วิธีที่สองเรียกว่าวิธีการจัดกลุ่มใหม่แบบเศษส่วนและประกอบด้วยข้อเท็จจริงที่ว่าแต่ละกลุ่มมีการกำหนดสัดส่วนของหน่วยประชากรที่แน่นอนให้กับแต่ละกลุ่ม

ชุดการจัดจำหน่าย

การจัดกลุ่มสามารถสร้างขึ้นตามชุดการแจกจ่าย ในเวลาเดียวกัน การสร้างซีรีส์สามารถดำเนินการได้บนพื้นฐานของการจัดกลุ่ม การศึกษาปรากฏการณ์ทางสถิติอย่างครอบคลุมจะเกิดผลมากที่สุดหากอยู่บนพื้นฐานของระบบการจัดกลุ่ม ระบบการจัดกลุ่มคือชุดของการจัดกลุ่มทางสถิติที่เชื่อมโยงถึงกันมากที่สุด คุณสมบัติที่สำคัญสะท้อนอย่างรอบด้าน ด้านที่สำคัญที่สุดปรากฏการณ์

ใกล้กระจายการกระจายหน่วยประชากรออกเป็นกลุ่มตามลักษณะบางอย่างตามลำดับเรียกว่า

ประเภทของซีรีย์การจัดจำหน่าย:

- ที่มา;
- แปรผัน - ไม่ต่อเนื่องและช่วงเวลา

กล่าวอีกนัยหนึ่ง ชุดการแจกจ่ายเป็นผลจากการจัดกลุ่ม

ชุดคุณลักษณะถูกเข้าใจว่าเป็นชุดการแจกแจงตามคุณลักษณะที่ไม่มีการวัดเชิงปริมาณ ตัวอย่างเช่น ชุดแอตทริบิวต์สามารถรวบรวมตามแอตทริบิวต์ “ สถานะทางสังคม", "อาชีพ", "เพศ" ฯลฯ

ซีรีส์ใดๆ ที่นำเสนอในรูปแบบตารางประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าของคุณลักษณะที่กำลังศึกษา (แอตทริบิวต์หรือเชิงปริมาณ) คอลัมน์ที่สองบันทึกจำนวนหน่วยการสังเกตที่มีค่านี้ ดังนั้น การสร้างอนุกรมรูปแบบจึงขึ้นอยู่กับการกำหนดค่าของคุณลักษณะในแต่ละกลุ่มการจำแนกประเภท และการกำหนดจำนวนองค์ประกอบที่อยู่ในกลุ่มนี้

แต่ละค่าของคุณลักษณะในชุดการแจกแจงเรียกว่าตัวแปร

จำนวนองค์ประกอบในแต่ละกลุ่มการจำแนกประเภทหรือจำนวนองค์ประกอบรวมกับตัวเลือกที่กำหนดเรียกว่าความถี่ หรือกล่าวอีกนัยหนึ่ง จำนวนหน่วยการสังเกตที่มีอยู่ในแต่ละกลุ่ม มักจะเรียกว่าความถี่ของอนุกรมการแจกแจง

สัดส่วนของกลุ่มที่กำหนดในผลรวมเรียกว่าความถี่ ความถี่หรือโครงสร้าง แสดงสัดส่วนของประชากรในกลุ่มการจำแนกประเภทที่กำหนด

ความถี่คืออัตราส่วนของความถี่ต่อจำนวนองค์ประกอบทั้งหมดที่กำลังศึกษา ซึ่งก็คือปริมาตรของประชากร

เรามาแสดงความถี่ n หรือ f ความถี่ - p หรือ j

ตัวอย่างของซีรีส์ที่ไม่ต่อเนื่อง

การแสดงในกลุ่มนักศึกษาเศรษฐศาสตร์ จำนวน 15 คน ในวิชาใดวิชาหนึ่ง

การจัดกลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับวัตถุที่แตกต่างกัน หรือในทางกลับกัน สำหรับวัตถุหนึ่ง แต่มากกว่าสอง ช่วงเวลาที่แตกต่างกันเวลาอาจกลายเป็นสิ่งที่หาที่เปรียบมิได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกันหรือความแตกต่างในขอบเขตของช่วงเวลา

การจัดกลุ่มรองหรือการจัดกลุ่มใหม่ของข้อมูลที่จัดกลุ่มถูกนำมาใช้ ลักษณะที่ดีขึ้นปรากฏการณ์ที่กำลังศึกษา (ในกรณีที่การจัดกลุ่มเริ่มแรกไม่ได้ระบุลักษณะการกระจายตัวของหน่วยประชากรอย่างชัดเจน) หรือนำการจัดกลุ่มมาเป็นประเภทที่เทียบเคียงได้เพื่อการวิเคราะห์เปรียบเทียบ

การจัดกลุ่มรอง- นี่คือการดำเนินการเพื่อจัดตั้งกลุ่มใหม่บนพื้นฐานของการจัดกลุ่มที่ดำเนินการก่อนหน้านี้

มีสองวิธีในการสร้างกลุ่มใหม่ วิธีแรกที่ง่ายที่สุดและพบบ่อยที่สุดคือ การเปลี่ยนแปลง (โดยปกติจะเป็นการขยาย) ของช่วงเวลาเริ่มต้น วิธีที่สองเรียกว่า แบ่งปันการจัดกลุ่มใหม่ ประกอบด้วยการก่อตัวของกลุ่มใหม่บนพื้นฐานของการกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม ให้เราอธิบายเทคนิคการจัดกลุ่มรองด้วยตัวอย่าง (ตาราง 3.14)

ตารางที่ 3.14. การกระจายตัวของรัฐวิสาหกิจ ขายปลีกหนึ่งในเมืองของภูมิภาคมอสโกโดยจำนวนพนักงานเฉลี่ยต่อปีในปี 2554*

* ข้อมูลมีเงื่อนไข

เราจะจัดกลุ่มข้อมูลใหม่ โดยสร้างกลุ่มใหม่ในช่วงเวลาสูงสุด 5, 5-10, 10-20, 20-30, 30 คนขึ้นไป

ใหม่ครั้งแรก ทางกลุ่มจะประกอบไปด้วยวิสาหกิจการค้าปลีกกลุ่มแรกและเป็นส่วนหนึ่งของกลุ่มที่สองโดยสมบูรณ์ หากต้องการรวมกลุ่มไม่เกินห้าคน คุณจะต้องรับหนึ่งคนจากช่วงเวลาของกลุ่มที่สอง ขนาดของช่วงเวลาสำหรับกลุ่มนี้คือหกคน ดังนั้นจึงจำเป็นต้องเอา 1/6 ของมัน ส่วนที่คล้ายกันในกลุ่มแรกที่จัดตั้งขึ้นใหม่จะต้องนำมาจากจำนวนวิสาหกิจ ได้แก่ 20 -= 3 องค์กร 6

จากนั้นในกลุ่มวิสาหกิจการค้าปลีกกลุ่มแรกจะมี 16 + 3 = 19 หน่วย

กลุ่มใหม่ที่สองก่อตั้งขึ้นโดยวิสาหกิจการค้าปลีกของกลุ่มที่สองลบด้วยกลุ่มที่จัดเป็นกลุ่มแรกนั่นคือ 20 - 3 = 17 องค์กร กลุ่มที่สามที่ก่อตั้งขึ้นใหม่จะรวมถึงวิสาหกิจทั้งหมดของกลุ่มที่สามและเป็นส่วนหนึ่งของวิสาหกิจในกลุ่มที่สี่ ในการกำหนดส่วนนี้ของช่วงเวลา 18 30 (ความกว้างของช่วงเวลาคือ 12) คุณต้องเพิ่ม 2.0 ไปยังส่วนก่อนหน้า (เพื่อให้ขีดจำกัดบนของช่วงเวลาเท่ากับ 20 คน) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเป็น 2/12 = 1/6 กลุ่มนี้มี 74 วิสาหกิจ ซึ่งหมายความว่าเราต้องเลือก 74 (1/6) = 12 วิสาหกิจ กลุ่มที่สามใหม่จะรวม 44 + 12 = 56 องค์กร

กลุ่มที่สี่ที่จัดตั้งขึ้นใหม่จะรวม 74 - 12 = = 62 องค์กรที่เหลืออยู่จากกลุ่มที่สี่ก่อนหน้า ที่ห้าอีกครั้ง กลุ่มการศึกษาวิสาหกิจการค้าปลีกของกลุ่มก่อนหน้าที่ห้าและหกจะประกอบด้วย: 37 + 9 = 46 วิสาหกิจ

เป็นผลให้เราได้กลุ่มใหม่ (ตาราง 3.15)

ตารางที่ 3.15. การกระจายตัวของวิสาหกิจการค้าปลีกในเมืองใดเมืองหนึ่งของภูมิภาคมอสโกตามจำนวนพนักงานเฉลี่ยต่อปีในปี 2554 หลังจากการจัดกลุ่มข้อมูลใหม่*

* ข้อมูลมีเงื่อนไข

ตารางสถิติ: สาระสำคัญ องค์ประกอบ และการจำแนกประเภท

ตารางสถิติเป็นรูปแบบการนำเสนอเนื้อหาทางสถิติที่มีเหตุผล มองเห็นได้ และกะทัดรัดที่สุด รวมถึงผลลัพธ์ การจัดกลุ่มทางสถิติ- อย่างไรก็ตาม ไม่ใช่ทุกตารางจะมีสถิติ ตารางสูตรคูณหรือแบบสอบถามเชิงสำรวจทางสังคมวิทยาอาจอยู่ในรูปแบบตาราง แต่ยังไม่ใช่ตารางทางสถิติ

ตารางสถิติเป็นตารางที่มีลักษณะเชิงตัวเลขสรุปของประชากรที่กำลังศึกษาตามลักษณะสำคัญหนึ่งหรือหลายลักษณะ เชื่อมโยงกันด้วยตรรกะของการวิเคราะห์ทางเศรษฐศาสตร์

องค์ประกอบหลักของตารางสถิติที่ประกอบเป็นโครงกระดูก (ฐาน) แสดงในแผนภาพ 3.1

แบบตารางเป็นรูปแบบการจัดเรียงข้อมูลตัวเลขโดยตัวเลขจะอยู่ที่จุดตัดของส่วนหัวที่กำหนดไว้อย่างชัดเจนตามแนวคอลัมน์แนวตั้งเรียกว่า นับ, และชื่อตามแถบแนวนอนที่สอดคล้องกัน - เส้น. ดังนั้น ภายนอกตารางจึงเป็นจุดตัดของกราฟและแถวที่ประกอบกันเป็นโครงกระดูกของตาราง

ตารางสถิติประกอบด้วยส่วนหัวสามประเภท: ทั่วไป ด้านบน และด้านข้าง ชื่อทั่วไป สะท้อนถึงเนื้อหาของตารางทั้งหมด (เกี่ยวข้องกับสถานที่และเวลา) ซึ่งอยู่เหนือเค้าโครงตารางตรงกลางและเป็นส่วนหัวภายนอก หัวเรื่องยอดนิยม กำหนดลักษณะเนื้อหาของกราฟ (ส่วนหัวของภาคแสดง) และ ด้านข้าง (หัวเรื่อง) - บรรทัด. ทำหน้าที่เป็นหัวข้อภายใน

กรอบโต๊ะที่เต็มไปด้วยส่วนหัวสร้างเค้าโครงตาราง หากคุณเขียนตัวเลขที่จุดตัดของกราฟและเส้น คุณจะได้ตารางสถิติที่สมบูรณ์ ชื่อตาราง (ชื่อทั่วไป)

โครงการ 3.1 โครงกระดูก (ฐาน) ของตารางสถิติ

สื่อดิจิทัลสามารถแสดงได้ในรูปแบบสัมบูรณ์ ( ทุนจดทะเบียน, ปริมาณของสินค้านวัตกรรม ฯลฯ ) ความสัมพันธ์ (GDP ต่อหัว จำนวนคอมพิวเตอร์ส่วนบุคคลต่อคนงาน 100 คน เป็นต้น) และมูลค่าเฉลี่ย (ราคาหุ้นเฉลี่ย ผลผลิตนมเฉลี่ยต่อวัว ฯลฯ)

ตารางอาจมีหมายเหตุประกอบหากจำเป็น หัวข้อ วิธีการคำนวณตัวบ่งชี้บางตัว แหล่งข้อมูล ฯลฯ

ในแง่ของเนื้อหาเชิงตรรกะ ตารางนี้เป็น "ประโยคทางสถิติ" ซึ่งมีองค์ประกอบหลักคือหัวเรื่องและภาคแสดง

เรื่องวัตถุที่มีลักษณะเป็นตัวเลขเรียกว่า นี่อาจเป็นการรวมหนึ่งรายการขึ้นไป แต่ละหน่วยของการรวมตามลำดับรายการหรือจัดกลุ่มตามลักษณะบางอย่าง หน่วยอาณาเขต ฯลฯ โดยปกติแล้วหัวเรื่องของตารางจะระบุไว้ทางด้านซ้ายในชื่อของแถว

ภาคแสดงสร้างระบบตัวบ่งชี้ที่กำหนดลักษณะวัตถุประสงค์ของการศึกษาเช่น เรื่องของตาราง ภาคแสดงจะสร้างส่วนหัวบนสุดและประกอบขึ้นเป็นเนื้อหาของกราฟโดยมีการจัดเรียงตัวบ่งชี้ตามลำดับตรรกะจากซ้ายไปขวา

ตำแหน่งของเรื่องและภาคแสดงในบางกรณีสามารถสลับเพื่อให้สมบูรณ์ยิ่งขึ้น และ วิธีที่ดีที่สุดการอ่านและวิเคราะห์ข้อมูลเบื้องต้นเกี่ยวกับประชากรที่กำลังศึกษา

ตามโครงสร้างของเรื่องตารางสถิติที่เรียบง่ายและซับซ้อนนั้นขึ้นอยู่กับการจัดกลุ่มหน่วยในนั้น

เรียบง่าย เรียกว่าตารางสถิติ โดยหัวเรื่องจะให้รายการวัตถุหรือ หน่วยดินแดน- ตารางสถิติอย่างง่ายแบ่งออกเป็นแบบ monographic และแบบรายการ

ตารางโมโนแกรม ไม่ได้กำหนดลักษณะของหน่วยทั้งชุดของวัตถุที่กำลังศึกษา แต่มีเพียงหน่วยเดียวหรือกลุ่มที่ระบุตามลักษณะเฉพาะ (ตารางที่ 3 .16).

ตารางที่ 3.16. การว่าจ้างสิ่งอำนวยความสะดวกทางสังคมและวัฒนธรรมในหน่วยงานที่เป็นองค์ประกอบของสหพันธรัฐรัสเซียในปี 2552

ตารางรายการ เรียกว่าตารางที่มีหัวเรื่องประกอบด้วยรายการวัตถุหรือหน่วยของวัตถุที่กำลังศึกษา (ตารางที่ 3.17)

ตารางสถิติที่ซับซ้อน ตรงกันข้ามกับสิ่งธรรมดา ๆ พวกเขาทำให้สามารถระบุประเภททางเศรษฐกิจและสังคมของปรากฏการณ์ที่กำลังศึกษา โครงสร้างของพวกเขาตลอดจนความสัมพันธ์และการพึ่งพาซึ่งกันและกันระหว่างคุณลักษณะที่มีลักษณะเฉพาะ ปัญหาเหล่านี้สามารถแก้ไขได้อย่างสมบูรณ์ยิ่งขึ้นโดยใช้กลุ่มและโดยเฉพาะตารางรวม

กลุ่ม เรียกว่าตารางสถิติ ซึ่งมีการจัดกลุ่มหน่วยประชากรตามคุณลักษณะเชิงปริมาณหรือคุณลักษณะเดียว

ตารางกลุ่มประเภทที่ง่ายที่สุดคือแถวการแจกจ่าย ตารางกลุ่มอาจซับซ้อนกว่านี้หากภาคแสดงมีตัวบ่งชี้เพิ่มเติมจำนวนหนึ่งที่แสดงลักษณะกลุ่มของเรื่อง ตารางดังกล่าวมักใช้เพื่อเปรียบเทียบตัวบ่งชี้ทั่วไปตามกลุ่ม (ตารางที่ 3.18)

ตารางที่ 3.17. การรับการลงทุนจากต่างประเทศในเศรษฐกิจรัสเซียไปยังประเทศนักลงทุนหลักในปี 2552

กลุ่มประชากรแยกตามอายุปี	ทั้งหมด	รวมทั้ง
กลุ่มประชากรแยกตามอายุปี	ทั้งหมด	ผู้ชาย	ผู้หญิง

ดังนั้นตารางกลุ่มทำให้สามารถระบุและจำแนกประเภทของปรากฏการณ์ทางเศรษฐกิจและสังคมและโครงสร้างได้ขึ้นอยู่กับลักษณะเฉพาะเพียงประการเดียว

การรวมกัน เรียกว่าตารางสถิติซึ่งมีการจัดกลุ่มหน่วยประชากรพร้อมกันตามลักษณะสองอย่างขึ้นไป: แต่ละกลุ่มที่สร้างขึ้นตามลักษณะเดียวจะถูกแบ่งออกเป็นกลุ่มย่อยตามลักษณะอื่น ๆ เป็นต้น (ตารางที่ 3.19)

ตารางที่ 3.19. การจัดกลุ่มอพาร์ทเมนท์ที่สร้างเสร็จในอาคารพักอาศัยตามจำนวนห้องและขนาดเฉลี่ย

ตารางที่ 3.18. การกระจายจำนวนผู้มีงานทำในเศรษฐกิจรัสเซียตามกลุ่มอายุ ณ สิ้นเดือนพฤศจิกายน 2552 % ของทั้งหมด

หัวเรื่องในตารางคือกลุ่มของอพาร์ทเมนต์ที่สร้างขึ้นตามจำนวนห้องและขนาดเฉลี่ย

ตารางรวมช่วยให้คุณสามารถระบุลักษณะกลุ่มทั่วไปที่ระบุด้วยคุณลักษณะหลายประการและความสัมพันธ์ระหว่างกลุ่มเหล่านั้น ลำดับของการแบ่งหน่วยประชากรออกเป็นกลุ่มเนื้อเดียวกันตามลักษณะจะพิจารณาจากความสำคัญของหน่วยใดหน่วยหนึ่งในการรวมกันหรือตามลำดับที่ศึกษา

ภาคแสดงของตารางสถิติดังที่ได้กล่าวไปแล้วประกอบด้วยตัวบ่งชี้ที่เป็นลักษณะของวัตถุที่กำลังศึกษา

ขึ้นอยู่กับโครงสร้างของภาคแสดง ตารางสถิติที่เรียบง่ายและซับซ้อนมีความโดดเด่น

ที่ การพัฒนาภาคแสดงอย่างง่าย คุณสมบัติที่นำเสนอในนั้นจะไม่ตัดกันและรับค่าสุดท้ายโดยการรวมค่าสำหรับแต่ละคุณสมบัติแยกกันโดยแยกจากกัน ตัวอย่างของการพัฒนาเพรดิเคตอย่างง่ายคือตาราง 3.20.

ที่ การพัฒนาภาคแสดงที่ซับซ้อน มันกลับกลายเป็นว่าสมบูรณ์ยิ่งขึ้นและ ลักษณะโดยละเอียดวัตถุ. ในกรณีนี้ สัญญาณทั้งสองของภาคแสดง (ตามเพศและอายุ) มีความเกี่ยวข้องกันอย่างใกล้ชิด คุณสามารถวิเคราะห์องค์ประกอบก่อนได้ รัฐดูมาตามฝ่าย

ตารางที่ 3.20.

ตามกลุ่มอายุ จากนั้นแต่ละราย กลุ่มอายุแบ่งออกเป็นสองกลุ่มย่อยตามเพศ กล่าวอีกนัยหนึ่ง ด้วยการพัฒนาที่ซับซ้อนของภาคแสดง ปรากฏการณ์หรือวัตถุสามารถถูกกำหนดลักษณะโดยการผสมผสานคุณสมบัติที่แตกต่างกันที่ก่อตัวขึ้น

ในทุกกรณี เมื่อสร้างตารางสถิติ ผู้วิจัยควรได้รับคำแนะนำจากอัตราส่วนที่เหมาะสมของตัวบ่งชี้ภาคแสดง

กฎพื้นฐานสำหรับการสร้างและวิเคราะห์ตารางทางสถิติ

ตารางสถิติเป็นวิธีการนำเสนอแบบเห็นภาพและกะทัดรัด ข้อมูลดิจิทัลจะต้องมีความถูกต้องทางสถิติ มีเทคนิคพื้นฐานต่อไปนี้ที่กำหนดเทคนิคในการสร้างตารางสถิติ

1. จะต้องนำเสนอเนื้อหาดิจิทัลในลักษณะที่เมื่อวิเคราะห์ตาราง สาระสำคัญของปรากฏการณ์จะถูกเปิดเผยโดยการอ่านบรรทัดจากซ้ายไปขวาและจากบนลงล่าง
2. ชื่อตารางและชื่อของคอลัมน์และแถวจะต้องมีความชัดเจน กระชับ และแสดงถึงความครบถ้วนสมบูรณ์ที่เข้ากับเนื้อหาของข้อความโดยธรรมชาติ ชื่อของตารางควรสะท้อนถึงวัตถุ ป้าย เวลา และสถานที่จัดงาน
3. ข้อมูลที่อยู่ในคอลัมน์ (คอลัมน์) ของตารางจะลงท้ายด้วยบรรทัดสรุป
4. หากชื่อของแต่ละคอลัมน์ซ้ำกัน มีคำศัพท์ซ้ำ หรือมีโหลดความหมายเดียว จะต้องกำหนดส่วนหัวแบบรวม
5. มีประโยชน์ในการนับจำนวนคอลัมน์และบรรทัด คอลัมน์ทางด้านซ้ายซึ่งเต็มไปด้วยชื่อของบรรทัด มักจะถูกกำหนดด้วยตัวพิมพ์ใหญ่ของตัวอักษร (A), (B) ฯลฯ และคอลัมน์ที่ตามมาทั้งหมด - ตามตัวเลขจากน้อยไปหามาก
6. ขอแนะนำให้วางข้อมูลที่เกี่ยวข้องกันซึ่งระบุลักษณะหนึ่งของปรากฏการณ์ที่กำลังวิเคราะห์ในคอลัมน์ที่อยู่ติดกัน
7. คอลัมน์และเส้นจะต้องมีหน่วยการวัดที่สอดคล้องกับตัวชี้วัดที่ตั้งไว้ในหัวเรื่องและภาคแสดง ในกรณีนี้จะใช้ตัวย่อที่ยอมรับโดยทั่วไปของหน่วยการวัด (rub., kWh ฯลฯ )
8. ควรปัดเศษตัวเลขทุกครั้งที่เป็นไปได้ ตัวเลขภายในคอลัมน์หรือบรรทัดเดียวกันควรปัดเศษด้วยความแม่นยำเท่ากัน
9. หากจำเป็น ข้อมูลเพิ่มเติม(คำอธิบายในตาราง) อาจให้หมายเหตุก็ได้

การปฏิบัติตามกฎที่กำหนดสำหรับการสร้างและการออกแบบตารางสถิติทำให้เป็นวิธีการหลักในการนำเสนอประมวลผลและสรุปข้อมูลทางสถิติเกี่ยวกับสถานะและการพัฒนาปรากฏการณ์ทางเศรษฐกิจและสังคมที่วิเคราะห์แล้ว

การวิเคราะห์ตารางสถิติดำเนินการในสองทิศทาง: โครงสร้างและเนื้อหา

การวิเคราะห์โครงสร้าง เกี่ยวข้องกับการวิเคราะห์โครงสร้างของตารางและการกำหนดลักษณะ:

จำนวนทั้งสิ้นและหน่วยการสังเกตที่ก่อตัวขึ้น
เครื่องหมายและการรวมกันที่ก่อให้เกิดหัวเรื่องและภาคแสดงของตาราง
ประเภทโต๊ะ;
งานที่จะแก้ไข

การวิเคราะห์แต่ละกลุ่มของวิชาตามลักษณะที่สอดคล้องกันของภาคแสดง
การระบุความสัมพันธ์และสัดส่วนระหว่างกลุ่มปรากฏการณ์ตามลักษณะ
การวิเคราะห์เปรียบเทียบและการกำหนดข้อสรุป การสร้างรูปแบบ และการกำหนดปริมาณสำรองเพื่อการพัฒนาวัตถุที่กำลังศึกษา

การวิเคราะห์ลักษณะเฉพาะบุคคลและกลุ่มจะต้องเริ่มต้นด้วยการศึกษาค่าสัมบูรณ์จากนั้น - ค่าสัมพัทธ์ที่เกี่ยวข้องกับค่าเหล่านั้น

หากวัตถุประสงค์การวิจัยต้องการสิ่งนี้ การวิเคราะห์ตารางสามารถเสริมด้วยค่าสัมพัทธ์และค่าเฉลี่ยที่คำนวณได้ กราฟ ไดอะแกรม ฯลฯ

การวิเคราะห์ตารางเหล่านี้ดำเนินการสำหรับแต่ละลักษณะแยกกัน จากนั้นจึงรวมลักษณะเชิงตรรกะและเศรษฐกิจเข้าด้วยกัน

การปฏิบัติตามกฎและความสม่ำเสมอในการทำงานกับตารางสถิติจะช่วยให้ผู้วิจัยสามารถดำเนินการวิเคราะห์ทางเศรษฐศาสตร์และสถิติเชิงวิทยาศาสตร์ที่ครอบคลุมของวัตถุและกระบวนการที่กำลังศึกษาอยู่

คำถามที่ 10 การจัดกลุ่มรอง วิธีการนำไปใช้

การจัดกลุ่ม - นี่คือการแบ่งประชากรทางสถิติที่ศึกษาออกเป็นส่วนๆ ตามลักษณะการจัดกลุ่มตั้งแต่หนึ่งลักษณะขึ้นไป การจัดกลุ่มอย่างถูกต้องส่วนใหญ่รับประกันความน่าเชื่อถือของการศึกษาทางสถิติทั้งหมด

การจัดกลุ่มเบื้องต้น จัดทำขึ้นบนพื้นฐานของการเรียงลำดับแหล่งข้อมูลหลัก

การจัดกลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับภูมิภาคที่แตกต่างกัน หรือในทางกลับกัน สำหรับภูมิภาคเดียวกัน แต่ในช่วงเวลาที่แตกต่างกันสองช่วง อาจกลายเป็นสิ่งที่หาที่เปรียบมิได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกัน หรือขอบเขตที่ไม่เท่ากันของ ช่วงเวลา ในกรณีนี้ จำเป็นต้องจัดกลุ่มข้อมูลใหม่โดยใช้การจัดกลุ่มรอง

การจัดกลุ่มรอง - การดำเนินการจัดตั้งกลุ่มใหม่โดยยึดตามการจัดกลุ่มที่ดำเนินการก่อนหน้านี้

มีสองวิธีในการสร้างกลุ่มใหม่

1. วิธีที่ง่ายและธรรมดาที่สุดคือการเปลี่ยน (โดยปกติจะขยาย) ช่วงเวลาเริ่มต้น

2. ดีออกจากกลุ่มใหม่- วิธีการประกอบด้วยการก่อตัวของกลุ่มใหม่โดยกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม

ตัวอย่าง.จำเป็นต้องจัดกลุ่มข้อมูลใหม่โดยสร้างกลุ่มใหม่โดยมีช่วงเวลาสูงสุด 500, 500 - 1,000, 1,000 - 2,000, 2,000 - 3,000, มากกว่า 3,000 รูเบิล ตามข้อมูลการกระจายสัญญาของบริษัทรับเหมาก่อสร้างตามกำไร

โต๊ะ. การกระจายสัญญาของบริษัทรับเหมาก่อสร้างตามผลกำไร¹

กลุ่มใหม่กลุ่มแรกจะรวมสัญญากลุ่มที่ 1 ทั้งหมดและเป็นส่วนหนึ่งของกลุ่มที่ 2 หากต้องการสร้างกลุ่มมากถึง 500,000 รูเบิล คุณต้องรับ 100,000 รูเบิลจากช่วงเวลาของกลุ่มที่ 2 ขนาดของช่วงเวลาของกลุ่มนี้คือ 600,000 รูเบิล ดังนั้นจึงจำเป็นต้องใช้ 1/6 ของมัน (100: 600) ส่วนที่คล้ายกันในกลุ่มใหม่ที่ตั้งขึ้นใหม่จะต้องนำมาจากจำนวนสัญญา ได้แก่ 20 1/6 - 3 สัญญา จากนั้นในกลุ่มที่ 1 จะมี 16 + 3 = 19 สัญญา กลุ่มใหม่ที่สองถูกสร้างขึ้นโดยสัญญาของกลุ่มที่ 2 ลบด้วยสัญญาที่กำหนดให้กับกลุ่มที่ 1 นั่นคือ 20 - 3 = 17 หน่วย กลุ่มที่สามที่จัดตั้งขึ้นใหม่จะรวมสัญญาทั้งหมดของกลุ่มที่ 3 และเป็นส่วนหนึ่งของสัญญาของกลุ่มที่ 4 ในการกำหนดส่วนนี้จากช่วงเวลา 1800 -3000 (ความกว้างของช่วงเวลาคือ 1,200,000 รูเบิล) คุณต้องเพิ่ม 200,000 รูเบิลไปยังส่วนก่อนหน้า (เพื่อให้ขีด จำกัด บนของช่วงเวลาเท่ากับ 2,000 รูเบิล) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเวลาเป็น 200:1200 เช่น 1/6 กลุ่มนี้มี 74 สัญญา ซึ่งหมายความว่าคุณต้องรับ 74 ¦ (1: 6) = 12 หน่วย กลุ่มใหม่ที่สามจะรวม: 44 N-12 - 56 สัญญา กลุ่มที่สี่ที่ตั้งขึ้นใหม่จะประกอบด้วย: 74 - 12 =62 สัญญาที่เหลืออยู่จากกลุ่มที่ 4 ก่อนหน้า กลุ่มที่ห้าที่ตั้งขึ้นใหม่จะประกอบด้วยสัญญาจากกลุ่มก่อนหน้าที่ 5 และ 6: 37 + 9 = 46 สัญญา เทคนิคการจัดกลุ่มใหม่แสดงอยู่ในตาราง

นอกจากการจัดกลุ่มหลักแล้ว การจัดกลุ่มรองยังถูกนำมาใช้กันอย่างแพร่หลายในสถิติ วี การจัดกลุ่มรองเรียกการก่อตัวของกลุ่มใหม่ตามการจัดกลุ่มที่ดำเนินการก่อนหน้านี้

การจัดกลุ่มรองใช้ในการแก้ปัญหาต่าง ๆ ที่สำคัญที่สุดคือ: 1) การก่อตัวตามการจัดกลุ่มตามลักษณะเชิงปริมาณของกลุ่ม (ประเภทที่เป็นเนื้อเดียวกันในเชิงคุณภาพ); 2) นำสองกลุ่ม (หรือมากกว่า) ที่มีช่วงเวลาต่างกันมาเป็นรูปแบบเดียวเพื่อวัตถุประสงค์ในการเปรียบเทียบและการวิเคราะห์ 3) การก่อตัวของกลุ่มใหญ่ซึ่งลักษณะของการกระจายปรากฏชัดเจนยิ่งขึ้น

สาระสำคัญของเทคนิคนี้คือเพื่อให้ได้ข้อมูลที่เปรียบเทียบได้สำหรับกลุ่มต่างๆ ซึ่ง: ความแข็งแกร่งเชิงตัวเลขกลุ่ม (พร้อมเปอร์เซ็นต์) ได้รับการแก้ไขในระดับเดียวกันสำหรับทุกกลุ่ม มีการติดตั้งในห้องน้ำกลุ่มทั้งหมดด้วย จำนวนเท่ากันกลุ่มและเนื้อหาเดียวกันของตารางกลุ่ม ไม่ใช่ตัวบ่งชี้ที่แน่นอนโดยกลุ่มที่ต้องถูกเปรียบเทียบและเปรียบเทียบ แต่เป็นค่าสัมพัทธ์และเปอร์เซ็นต์

การจัดกลุ่มรองมีสองวิธี: 1) โดยการเปลี่ยนช่วงของการจัดกลุ่มหลัก (โดยปกติโดยการขยายช่วง) และ 2) โดยการกำหนดส่วนหนึ่งของหน่วยประชากรให้กับแต่ละกลุ่ม (การจัดกลุ่มใหม่บางส่วน) เมื่อใช้วิธีการจัดกลุ่มทุติยภูมิเหล่านี้ มักจะถือว่าการกระจายตัวของคุณลักษณะภายในช่วงเวลาจะสม่ำเสมอ

การใช้การจัดกลุ่มรองเพื่อนำสองกลุ่มที่มีช่วงเวลาต่างกันมาอยู่ในรูปแบบเดียวเพื่อวัตถุประสงค์ในการเปรียบเทียบจะแสดงตัวอย่างด้วยตัวอย่างต่อไปนี้ ในการดำเนินการนี้ เราใช้ข้อมูลจากการจัดกลุ่มหลักของสองภูมิภาคตามจำนวนคนงานปศุสัตว์ (ตาราง 3.7)

ตารางที่ 3.7. การจัดกลุ่มฟาร์มใน 2 อำเภอตามจำนวนคนงานปศุสัตว์

เขต 1		เขตที่ 2
กลุ่มฟาร์มโดย		กลุ่มฟาร์มโดย
	ในที่สุด	จำนวนพนักงานคน	ในที่สุด

ข้อมูลโดยตรงเกี่ยวกับการจัดกลุ่มของทั้งสองอำเภอไม่สามารถเปรียบเทียบได้ เนื่องจากฟาร์มจะกระจายออกเป็นกลุ่มตามช่วงเวลาที่แตกต่างกัน: 20 คน ในภูมิภาค 1 และ 30 คน ในภูมิภาค II จำนวนกลุ่มที่จัดสรรก็ไม่เท่ากัน

เพื่อนำทั้งสองกลุ่มมาอยู่ในรูปแบบที่เปรียบเทียบกันได้ เราจะดำเนินการจัดกลุ่มรอง เพื่อจุดประสงค์นี้ เราจึงจัดกลุ่มเนื้อหาใหม่ออกเป็นกลุ่มที่เหมือนกันสำหรับทั้งสองภูมิภาค: เรามาแบ่งกลุ่มกัน 40 คน (ตารางที่ 3.8)

เนื่องจากมีความเป็นไปได้ที่จะดำเนินการจัดกลุ่มฟาร์มรองในภูมิภาคโดยเพียงแค่ขยายช่วงเวลา (มีความบังเอิญที่ช่วงล่างและช่วงบนในสองกลุ่ม) เราจึงใช้วิธีนี้ในการแก้ปัญหา

ให้เราอธิบายลำดับการคำนวณ ฟาร์มกลุ่มแรกที่มีพนักงานมากถึง 160 คน จะรวมถึงฟาร์มของกลุ่ม I และ II

ตารางที่ 3.8. การจัดกลุ่มฟาร์มรองในสองอำเภอตามจำนวนคนงานปศุสัตว์

ในที่สุดส่วนแบ่งของฟาร์มในกลุ่มเหล่านี้จะอยู่ที่ 16% (4+12) ฟาร์มกลุ่มที่สองที่มีพนักงาน 160 ถึง 200 คน จะรวมถึงฟาร์มของกลุ่ม III และ IV ความถ่วงจำเพาะรวมจะเป็น 45% (18+27) การคำนวณจะดำเนินการในลักษณะเดียวกันเมื่อสร้างกลุ่มที่เหลือ

เรากำลังจัดกลุ่มฟาร์มของภูมิภาค II ใหม่ เนื่องจากการขยายช่วงระยะเวลาสำหรับฟาร์มในภูมิภาค II ไม่เหมาะสมและไม่สามารถแก้ปัญหาได้ เราจึงใช้วิธีการจัดกลุ่มข้อมูลการจัดกลุ่มหลักใหม่บางส่วน

กลุ่มฟาร์มกลุ่มแรกที่สร้างขึ้นใหม่ในภูมิภาค II ซึ่งมีจำนวนคนงานปศุสัตว์มากถึง 160 คนจะรวมฟาร์มของกลุ่มหลักที่มีช่วงเวลาเดียวกันโดยสมบูรณ์ ส่วนแบ่งของฟาร์มในกลุ่มนี้คือ 8%

ในกลุ่มฟาร์มที่สองของกลุ่มรองมีจำนวนคนงานตั้งแต่ 160 ถึง 200 คน ฟาร์มของกลุ่ม II (16%) และส่วนหนึ่งของฟาร์มของกลุ่ม III จะถูกรวมทั้งหมด ในการกำหนดส่วนของฟาร์มที่ต้องนำมาจากกลุ่ม III จำเป็นต้องแบ่งออกเป็นกลุ่มย่อยโดยมีจำนวนคนงาน 190 - 200, 200 - 210, 210 - 220 คน ตัวชี้วัดส่วนแบ่งของฟาร์มในกลุ่มย่อยเหล่านี้จะถูกกำหนดตามสัดส่วนการแบ่งช่วงเวลา ขนาดช่วงเวลาที่เรากำลังพิจารณาคือ 30 คน และแบ่งออกเป็นสามส่วนเท่าๆ กัน เพื่อให้ได้ช่วงที่ต้องการ 160 - 200 คน ถึงมูลค่าของช่วงเวลาของกลุ่ม II (160 - 190 คน) ควรเพิ่มหนึ่งในสามของมูลค่าของช่วงเวลาของกลุ่ม III (190 - 220 คน) และส่วนเดียวกันของฟาร์มของกลุ่มนี้

ดังนั้น กลุ่มฟาร์มที่สร้างขึ้นใหม่อีกกลุ่มหนึ่งจะรวม 16% ของฟาร์มของกลุ่มที่สองและหนึ่งในสามของกลุ่ม III - 10% (1/3-30) ซึ่งจะเท่ากับ 26% ของจำนวนฟาร์มทั้งหมด ในภูมิภาค II

ฟาร์มกลุ่มที่ 3 ของกลุ่มรอง (200 - 240 คน) จะรวมส่วนหนึ่งของฟาร์มของกลุ่มที่ 3 (190 - 220 คน) ซึ่งยังคงอยู่ - 20% (% -30) และสองในสามของฟาร์มของ กลุ่ม IV (220 - 250 คน) - 14% (%-21) นั่นคือ 34% ของจำนวนฟาร์มทั้งหมดในภูมิภาค II

การคำนวณที่คล้ายกันจะดำเนินการเมื่อสร้างกลุ่มฟาร์มที่สร้างขึ้นใหม่ที่เหลือ: 240 - 280 คนและมากกว่า 280 คน เหมือนอยู่ในโต๊ะ 3.7 พร้อมด้วยข้อมูลเกี่ยวกับส่วนแบ่งของฟาร์มตามกลุ่ม ให้ข้อมูลเกี่ยวกับตัวเลข จากนั้นการคำนวณในกลุ่มที่สร้างขึ้นใหม่จะดำเนินการในสัดส่วนเดียวกันกับ ความถ่วงจำเพาะฟาร์ม

หลังจากการจัดกลุ่มรอง วัสดุหลักจะสามารถเปรียบเทียบได้ เนื่องจากทั้งสองภูมิภาคใช้กลุ่มเดียวกันตามจำนวนคนงาน จากข้อมูลในตาราง ตาราง 3.8 แสดงให้เห็นว่าการกระจายตัวของฟาร์มตามจำนวนคนงานปศุสัตว์ในทั้งสองภูมิภาคมีความแตกต่างกันอย่างมีนัยสำคัญ: ในภูมิภาค 1 ฟาร์มที่มีคนงานปศุสัตว์มากถึง 200 คนมีอำนาจเหนือกว่า (61% ของจำนวนฟาร์มทั้งหมด) ในภูมิภาค II - ฟาร์มที่มีคนงานปศุสัตว์ - มากกว่า 200 คน (66% ของจำนวนฟาร์มทั้งหมด)

การส่งผลงานที่ดีของคุณไปยังฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง

นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง

โพสต์เมื่อ http://www.allbest.ru/

สถาบันมอสโกตั้งชื่อตาม ส.ยู. วิตต์

คณะเศรษฐศาสตร์

ทดสอบ

งานเสร็จแล้ว:

นักศึกษาชั้นปีที่ 1

การเรียนรู้ทางไกล

Vislyaeva M.N.

มอสโก

เมื่อดำเนินการ งานควบคุมคุณต้องทำการจัดเรียงใหม่เพื่อไม่ให้ ตัวอย่างที่ซับซ้อน(เลือกตัวอย่างด้วยตัวคุณเอง) และอธิบายว่าการคำนวณใหม่ดังกล่าวถูกต้องอย่างไรและภายใต้เงื่อนไขใด เมื่อใช้โปรแกรมคอมพิวเตอร์และตัวอย่างที่ซับซ้อนมากขึ้น ให้ระบุถึงผลกระทบและคุณสมบัติของการใช้งานไอทีด้วย

ในการตอบกลับเป็นลายลักษณ์อักษรของคุณต่องาน คุณต้อง:

1. อธิบายความเชื่อมโยงระหว่างสูตรบวกความแปรปรวนกับความสัมพันธ์สหสัมพันธ์ อธิบายความหมายทางสถิติ

2. เปรียบเทียบความแปรผันของการแจกแจงสองแบบด้วยค่าเฉลี่ยที่ต่างกัน อธิบายเงื่อนไขของการเปรียบเทียบได้เมื่อค่าเฉลี่ยแตกต่างกัน

3. ให้คำอธิบายที่สมบูรณ์ที่สุดเกี่ยวกับความหมายของข้อผิดพลาดส่วนเพิ่ม เชื่อมโยงกับแนวคิดเรื่องตัวแทนของกลุ่มตัวอย่างและปริมาตรที่ต้องการ

4. อธิบายความสัมพันธ์ระหว่างการประมาณค่าพารามิเตอร์ที่ไม่รู้จักโดยใช้ OLS และการตรวจสอบนัยสำคัญของผลลัพธ์ที่ได้รับโดยใช้เกณฑ์ในการทดสอบสมมติฐานทางสถิติ

การจัดกลุ่มสถิติที่จัดกลุ่มไว้ก่อนหน้านี้ใหม่เรียกว่าการจัดกลุ่มรอง วิธีการนี้ใช้ในกรณีที่ลักษณะของการกระจายตัวของประชากรที่กำลังศึกษาไม่ชัดเจนอันเป็นผลมาจากการจัดกลุ่มครั้งแรก

ในกรณีนี้ ช่วงเวลาจะขยายหรือลดลง การจัดกลุ่มรองยังใช้เพื่อนำการจัดกลุ่มตามช่วงเวลาที่ต่างกันมาเป็นรูปแบบที่เปรียบเทียบได้เพื่อจุดประสงค์ในการเปรียบเทียบ ลองดูเทคนิคการจัดกลุ่มรองโดยใช้ตัวอย่าง

ขยายช่วงเวลาตามข้อมูลในตารางที่ 1:

ตารางที่ 1

	จำนวนร้านค้า

การจัดกลุ่มข้างต้นยังไม่ชัดเจนเพียงพอ เนื่องจากไม่ได้แสดงรูปแบบการเปลี่ยนแปลงมูลค่าการซื้อขายตามกลุ่มที่ชัดเจนและเข้มงวด

ให้เรากระชับแถวการแจกแจงโดยแบ่งเป็นหกกลุ่ม กลุ่มใหม่จะถูกสร้างขึ้นโดยการรวมกลุ่มเดิม (ตารางที่ 2)

ตารางที่ 2

กลุ่มร้านค้าตามขนาดมูลค่าการซื้อขายสำหรับไตรมาสที่สี่ พันรูเบิล	จำนวนร้านค้า	มูลค่าการซื้อขายในไตรมาสที่สี่พันรูเบิล	มูลค่าการซื้อขายเฉลี่ยต่อร้าน พันรูเบิล

เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งร้านค้ามีขนาดใหญ่เท่าใด ระดับการหมุนเวียนก็จะยิ่งสูงขึ้นเท่านั้น

1. จากการจัดกลุ่มเชิงวิเคราะห์ ความสัมพันธ์สามารถวัดได้โดยใช้ความสัมพันธ์เชิงประจักษ์ ตัวบ่งชี้นี้แสดงไว้ อักษรกรีกซี (นี่) ขึ้นอยู่กับกฎการสลายตัวของความแปรปรวน ซึ่งความแปรปรวนรวม s2 เท่ากับผลรวมของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม

การกระจายตัวของคุณลักษณะที่มีประสิทธิผลภายในกลุ่มที่มีความคงที่สัมพัทธ์ของคุณลักษณะของปัจจัยนั้นเกิดขึ้นเนื่องจากปัจจัยอื่นๆ ความแปรปรวนนี้เรียกว่าค่าคงเหลือ ถูกกำหนดโดยสูตร:

โดยที่ y ij คือค่าของคุณลักษณะ y สำหรับ หน่วยที่ iในกลุ่ม j;

J คือค่าเฉลี่ยของลักษณะในกลุ่มที่ j

nj - หมายเลข หน่วย jthกลุ่ม;

j = 1, 2, 3, ... เช่น

ความแปรปรวนภายในกลุ่มที่คำนวณสำหรับแต่ละกลุ่มจะรวมกันเข้ากับค่าเฉลี่ยความแปรปรวนภายในกลุ่ม:

ความแปรปรวนระหว่างกลุ่มเป็นผลมาจากปัจจัยที่กำลังศึกษา (และปัจจัยที่เกี่ยวข้อง) ดังนั้นจึงเรียกว่าความแปรปรวนของปัจจัย มันถูกกำหนดโดยสูตร

กฎสำหรับการบวกผลต่างสามารถเขียนได้:

อัตราส่วนสหสัมพันธ์เชิงประจักษ์วัดความแปรปรวนโดยรวมในคุณลักษณะผลลัพธ์ที่เกิดจากปัจจัยที่กำลังศึกษา ดังนั้นจึงคำนวณเป็นอัตราส่วนของความแปรปรวนของปัจจัยต่อความแปรปรวนรวมของคุณลักษณะผลลัพธ์:

ตัวบ่งชี้นี้รับค่าในช่วง: ยิ่งใกล้ 1 การเชื่อมต่อยิ่งใกล้มากขึ้น และในทางกลับกัน

ตารางที่ 3. ข้อมูลเริ่มต้น

ตารางที่ 4. แผ่นงาน

มูลค่าการซื้อขายเฉลี่ย = ?X*f / f= 17370/51 = 340.58 พันรูเบิล

ความแปรปรวนคือ:

G2 =? f*(X-Xav) 2 / ? ฉ = 38682.36/51 = 758.48

ส่วนเบี่ยงเบนมาตรฐาน:

ค่าสัมประสิทธิ์ของการแปรผันคือ:

วี = G / Xavg = 27.54/758.48 = 0.081; 8.1%

ค่าสัมประสิทธิ์การเปลี่ยนแปลงน้อยกว่า 33% ดังนั้นประชากรจึงเป็นเนื้อเดียวกัน

ตารางที่ 5. ข้อมูลเริ่มต้น

1) เวลาเฉลี่ยที่ใช้ในการเดินทางไปยังสถานที่ทำงานของคนงาน = X av =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41.8 นาที

2) การคำนวณผลต่าง

ความแปรปรวนคือ:

G2 =? ส่วนเบี่ยงเบนฉ:

3) ค่าสัมประสิทธิ์*(X-Xaver) 2 / ? ฉ = 43160.8/420 = 102.8

การแปรผันกำลังสองเฉลี่ยเท่ากับ:

วี = G / Xavg = 10.14/41.8 = 0.24; 24%

ค่าสัมประสิทธิ์ของการแปรผันน้อยกว่า 33% ดังนั้นประชากรที่พิจารณาว่าเป็นเนื้อเดียวกันและค่าเฉลี่ยของความแปรปรวนนั้นค่อนข้างปกติ

ประชากรตัวอย่างสามารถเกิดขึ้นได้จากลักษณะเชิงปริมาณของค่าทางสถิติ เช่นเดียวกับลักษณะทางเลือกหรือลักษณะเฉพาะ ในกรณีแรก ลักษณะทั่วไปของกลุ่มตัวอย่างคือค่าเฉลี่ยของกลุ่มตัวอย่าง ซึ่งแสดงด้วยสัญลักษณ์ และในกรณีที่สอง สัดส่วนของตัวอย่างจะแสดงด้วยสัญลักษณ์ w ในประชากรทั่วไป ตามลำดับ: ค่าเฉลี่ยทั่วไป และส่วนแบ่งทั่วไปของ p

ความแตกต่าง -- และ W -- p เรียกว่าข้อผิดพลาดในการสุ่มตัวอย่าง ซึ่งแบ่งออกเป็นข้อผิดพลาดในการลงทะเบียนและข้อผิดพลาดในการเป็นตัวแทน ส่วนแรกของข้อผิดพลาดในการสุ่มตัวอย่างเกิดขึ้นเนื่องจากข้อมูลที่ไม่ถูกต้องหรือไม่ถูกต้องเนื่องจากขาดความเข้าใจในสาระสำคัญของปัญหาการไม่เอาใจใส่ของนายทะเบียนเมื่อกรอกแบบสอบถามแบบฟอร์ม ฯลฯ มันค่อนข้างง่ายที่จะตรวจจับและกำจัด ส่วนที่สองของข้อผิดพลาดเกิดขึ้นจากความล้มเหลวอย่างต่อเนื่องหรือเกิดขึ้นเองในการปฏิบัติตามหลักการเลือกแบบสุ่ม ตรวจจับและกำจัดได้ยาก มีขนาดใหญ่กว่าอันแรกมาก ดังนั้นจึงให้ความสำคัญกับมันเป็นหลัก

พิเศษเฉพาะ บทบาทที่สำคัญเพื่อเป็นเหตุผลและการประยุกต์ใช้ การสังเกตตัวอย่างกฎแห่งจำนวนมากมายเกิดขึ้น การใช้กฎจำนวนมากคือภายใต้เงื่อนไขบางประการและมีการสังเกตในปริมาณมากพอสมควร ลักษณะสรุปที่ได้รับจากการสังเกตตัวอย่างจะแตกต่างเล็กน้อยจากลักษณะที่สอดคล้องกันของหนังสือมอบอำนาจทั่วไป ด้วยเหตุนี้ จึงเป็นไปได้โดยการเพิ่มขนาดประชากรตัวอย่างเพื่อลดขีดจำกัด ข้อผิดพลาดที่เป็นไปได้เป็นตัวแทนให้พาพวกเขาไป ขนาดที่เล็กที่สุด- ในทางกลับกัน เมื่อทราบขีดจำกัดของข้อผิดพลาดในการเป็นตัวแทนแล้ว จึงสามารถกำหนดขนาดที่ต้องการของประชากรตัวอย่างได้

งานที่สำคัญและมีความรับผิดชอบที่สุดประการหนึ่งในการจัดระเบียบและดำเนินการสังเกตตัวอย่างคือการกำหนดขนาดที่ต้องการของประชากรตัวอย่าง เช่น ตัวเลขดังกล่าวจะทำให้ได้รับข้อมูลที่สะท้อนคุณสมบัติที่ศึกษาของประชากรทั่วไปได้อย่างถูกต้องเพียงพอ

ในกรณีนี้จะต้องคำนึงถึงสิ่งต่อไปนี้: 1) ควรได้รับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดด้วยความแม่นยำระดับใด 2) ความน่าจะเป็นที่จะรับประกันความถูกต้องตามเงื่อนไขของผลลัพธ์ของการสังเกตตัวอย่างควรเป็นอย่างไร 3) ระดับความผันผวนของคุณสมบัติที่ศึกษาในประชากรที่ศึกษา

ซึ่งหมายความว่าขนาดตัวอย่างที่ต้องการจะถูกตั้งค่าโดยขึ้นอยู่กับขนาดของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ค่าของสัมประสิทธิ์ความเชื่อมั่น (t) และขนาดของความแปรปรวน

วิธีการประมาณค่าพารามิเตอร์ การถดถอยเชิงเส้นซึ่งจะลดผลรวมของการเบี่ยงเบนกำลังสองของการสังเกตตัวแปรตามจากฟังก์ชันเชิงเส้นที่ต้องการให้เหลือน้อยที่สุด เรียกว่าวิธีกำลังสองน้อยที่สุด

สาระสำคัญของวิธีการนี้คือเกณฑ์สำหรับคุณภาพของโซลูชันที่พิจารณาคือผลรวมของข้อผิดพลาดกำลังสองซึ่งพวกเขาพยายามลดให้เหลือน้อยที่สุด หากต้องการใช้วิธีนี้จำเป็นต้องดำเนินการให้มากที่สุด จำนวนที่มากขึ้นการวัดตัวแปรสุ่มที่ไม่รู้จัก (ยิ่งมาก ความแม่นยำของโซลูชันก็จะยิ่งสูงขึ้น) และชุดของโซลูชันโดยประมาณบางชุดที่ต้องเลือกโซลูชันที่ดีที่สุด ถ้าชุดของโซลูชันถูกกำหนดเป็นพารามิเตอร์ เราจำเป็นต้องค้นหาค่าที่เหมาะสมที่สุดของพารามิเตอร์

LSM ใช้ในคณิตศาสตร์ โดยเฉพาะในทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ วิธีนี้ใช้กันอย่างแพร่หลายในการกรองปัญหาเมื่อจำเป็นต้องแยกสัญญาณที่เป็นประโยชน์ออกจากสัญญาณรบกวนที่ซ้อนทับอยู่ นอกจากนี้ยังใช้ในการวิเคราะห์ทางคณิตศาสตร์เพื่อเป็นตัวแทนโดยประมาณ ฟังก์ชันที่กำหนดฟังก์ชั่นที่เรียบง่ายยิ่งขึ้น การประยุกต์ใช้กำลังสองน้อยที่สุดอีกประการหนึ่งคือการแก้ระบบสมการที่ไม่ทราบจำนวนน้อยกว่าจำนวนสมการ

ขั้นตอนการทดสอบสมมติฐานทางสถิติ:

การกำหนดสมมติฐานหลัก H 0 และสมมติฐานที่แข่งขันกัน H 1 . สมมติฐานจะต้องถูกทำให้เป็นทางการอย่างชัดเจนในแง่คณิตศาสตร์

การกำหนดความน่าจะเป็น ข เรียกว่าระดับนัยสำคัญและสอดคล้องกับข้อผิดพลาดประเภทแรกซึ่งจะมีข้อสรุปเกี่ยวกับความจริงของสมมติฐานในอนาคต

การคำนวณเกณฑ์สถิติμเป็นดังนี้:

ค่าของมันขึ้นอยู่กับตัวอย่างดั้งเดิม

ขึ้นอยู่กับคุณค่าของมันเราสามารถสรุปเกี่ยวกับความจริงของสมมติฐาน H 0 ;

สถิตินั้นจะต้องเป็นไปตามกฎหมายการกระจายที่ทราบบางประการเพราะว่า q นั้นสุ่มมาจากความบังเอิญ

การก่อสร้างพื้นที่วิกฤต จากช่วงของค่า μ จะมีการระบุชุดย่อยของค่าดังกล่าวตามที่สามารถตัดสินความแตกต่างที่มีนัยสำคัญกับสมมติฐานได้ ขนาดของมันถูกเลือกในลักษณะที่พึงพอใจอย่างเท่าเทียมกัน ชุดนี้เรียกว่าบริเวณวิกฤต

บทสรุปเกี่ยวกับความจริงของสมมติฐาน ค่าตัวอย่างที่สังเกตได้จะถูกแทนที่ในสถิติ q และขึ้นอยู่กับว่าค่าเหล่านี้ตก (หรือไม่ตก) ในบริเวณวิกฤต จึงมีการตัดสินใจที่จะปฏิเสธ (หรือยอมรับ) สมมติฐานที่หยิบยกขึ้นมา H0

การแปรผันสหสัมพันธ์การกระจายตัว

โพสต์บน Allbest.ru

...

เอกสารที่คล้ายกัน

ตารางค่าตัวอย่างของตัวแปรสุ่มแบบไม่ต่อเนื่องในรูปแบบเรียงลำดับ ตารางช่วงเวลา ชุดสถิติความถี่สัมพัทธ์ การระบุฟังก์ชันการแจกแจงเชิงประจักษ์และการลงจุด รูปหลายเหลี่ยมและการแจกแจงตัวแปรสุ่ม

งานภาคปฏิบัติ เพิ่มเมื่อ 26/07/2555

ลักษณะเชิงตัวเลขสำหรับการแจกแจงทางสถิติ การสร้างอนุกรมการแปรผันตามช่วงเวลา รูปหลายเหลี่ยมความถี่ กราฟของฟังก์ชันการแจกแจงตัวอย่าง และการหาค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างด้วยสองวิธี

การนำเสนอเพิ่มเมื่อ 11/01/2013

ค่าเฉลี่ยของตัวบ่งชี้ (ค่าเฉลี่ยเลขคณิต) ตัวชี้วัดการเปลี่ยนแปลง - ช่วงของการแปรผัน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว ค่าสัมประสิทธิ์ของการแปรผัน สูงสุดและ ค่าต่ำสุดตัวบ่งชี้ทางสถิติ

ทดสอบเพิ่มเมื่อ 11/14/2551

แนวคิดเรื่องประชากรทั่วไป ความคาดหวังทางคณิตศาสตร์ และการกระจายตัว รับรองความสุ่มและความเป็นตัวแทนของกลุ่มตัวอย่างในการวางแผนทางสถิติ อนุกรมการแปรผันแบบไม่ต่อเนื่องและแบบช่วง การประมาณค่าจุดของพารามิเตอร์การกระจายตัวแบบคุณลักษณะ

บทคัดย่อเพิ่มเมื่อ 13/06/2554

สาระสำคัญของการวิจัยสุ่มตัวอย่าง วิธีการเลือกหน่วยในกลุ่มประชากรตัวอย่าง ค่าเฉลี่ยและความคลาดเคลื่อนส่วนเพิ่มสำหรับการวัดค่าเฉลี่ยและสัดส่วน การกำหนดขนาดตัวอย่างที่ต้องการสำหรับข้อมูลที่กำหนด ข้อผิดพลาดเล็กน้อยค่าเฉลี่ย

การนำเสนอเพิ่มเมื่อ 16/03/2014

รูปแบบ ประเภท และวิธีการสังเกตทางสถิติ ประเภทการจัดกลุ่ม ช่วงเวลา และความถี่ โครงสร้างของซีรีย์ไดนามิก ค่าสถิติสัมบูรณ์และค่าสัมพัทธ์ การนำเสนอตัวอย่างในรูปแบบชุดสถิติ การประมาณค่าจุดและช่วงเวลา

หลักสูตรการบรรยาย เพิ่มเมื่อ 29/11/2556

การสร้างอนุกรมความแปรผันตามช่วงเวลาตามตัวบ่งชี้ การคำนวณค่าเฉลี่ยเลขคณิต โหมด และค่ามัธยฐาน สัมพัทธ์และ ตัวชี้วัดที่แน่นอนรูปแบบต่างๆ การกำหนดลักษณะเชิงปริมาณของการแจกแจง การสร้างฟังก์ชันเชิงประจักษ์

งานหลักสูตรเพิ่มเมื่อวันที่ 11/01/2555

แผนภาพกระจายเป็นจุดบนระนาบซึ่งมีพิกัดสอดคล้องกับค่าของตัวแปรสุ่ม X และ Y ลำดับของโครงสร้างและวัตถุประสงค์ การหาค่าสัมประสิทธิ์และสร้างกราฟการประมาณเชิงเส้นและกราฟการประมาณกำลังสอง

งานหลักสูตร เพิ่มเมื่อ 05/03/2011

การสั่งตัวอย่างเบื้องต้นของเวลาถึงความล้มเหลว การทดสอบสมมติฐานทางสถิติของการโต้ตอบ การกระจายแบบเอ็กซ์โปเนนเชียลและการกระจายพันธุ์ไวบูล การประมาณค่าพารามิเตอร์การกระจายและตัวบ่งชี้ความน่าเชื่อถือ วิธีการและเทคนิคหลัก

งานหลักสูตรเพิ่มเมื่อ 22/01/2555

แนวคิดเรื่องอนุกรมความแปรผัน การกระจายตัวทางสถิติ ฟังก์ชันเชิงประจักษ์และคุณลักษณะหลักของความคาดหวังทางคณิตศาสตร์ของความแปรปรวนตัวอย่าง การประมาณจุดและช่วงเวลาของการแจกแจง ทฤษฎีสมมติฐานนั้นคล้ายคลึงกับทฤษฎีช่วงความเชื่อมั่น

กำลังโหลด...

แบ่งปันกับเพื่อนของคุณ:

เพิ่มบทความนี้ในรายการโปรดของคุณเพื่อไม่ให้พลาด!