สรุปและจัดกลุ่มข้อมูลทางสถิติ Open Library - ห้องสมุดเปิดของข้อมูลการศึกษา
การจัดกลุ่มรอง
ในทางปฏิบัติ บางครั้งคุณต้องใช้การจัดกลุ่มที่มีอยู่ ซึ่งอาจเทียบไม่ได้เนื่องจากขอบเขตช่วงไม่เท่ากัน หรือ ปริมาณต่างๆกลุ่มที่ได้รับการจัดสรร หากต้องการนำการจัดกลุ่มดังกล่าวมาอยู่ในรูปแบบที่เทียบเคียงได้ จะใช้วิธีการจัดกลุ่มรอง
การจัดกลุ่มรองประกอบด้วยการจัดตั้งกลุ่มใหม่บนพื้นฐานของการจัดกลุ่มที่ทำไว้ก่อนหน้านี้
ในการจัดกลุ่มรอง จะใช้สองวิธีในการสร้างกลุ่มใหม่:
- § วิธีแรกคือการเสริมความแข็งแกร่งให้กับช่วงเริ่มต้น นี่เป็นวิธีการจัดกลุ่มรองที่ง่ายและธรรมดาที่สุด
- § วิธีที่สองเรียกว่าวิธีการจัดกลุ่มใหม่แบบเศษส่วนและประกอบด้วยข้อเท็จจริงที่ว่าแต่ละกลุ่มมีการกำหนดสัดส่วนของหน่วยประชากรที่แน่นอนให้กับแต่ละกลุ่ม
ชุดการจัดจำหน่าย
การจัดกลุ่มสามารถสร้างขึ้นตามชุดการแจกจ่าย ในเวลาเดียวกัน การสร้างซีรีส์สามารถดำเนินการได้บนพื้นฐานของการจัดกลุ่ม การศึกษาปรากฏการณ์ทางสถิติอย่างครอบคลุมจะเกิดผลมากที่สุดหากอยู่บนพื้นฐานของระบบการจัดกลุ่ม ระบบการจัดกลุ่มคือชุดของการจัดกลุ่มทางสถิติที่เชื่อมโยงถึงกันมากที่สุด คุณสมบัติที่สำคัญสะท้อนอย่างรอบด้าน ด้านที่สำคัญที่สุดปรากฏการณ์
ใกล้กระจายการกระจายหน่วยประชากรออกเป็นกลุ่มตามลักษณะบางอย่างตามลำดับเรียกว่า
ประเภทของซีรีย์การจัดจำหน่าย:
- - ที่มา;
- - แปรผัน - ไม่ต่อเนื่องและช่วงเวลา
กล่าวอีกนัยหนึ่ง ชุดการแจกจ่ายเป็นผลจากการจัดกลุ่ม
ชุดคุณลักษณะถูกเข้าใจว่าเป็นชุดการแจกแจงตามคุณลักษณะที่ไม่มีการวัดเชิงปริมาณ ตัวอย่างเช่น ชุดแอตทริบิวต์สามารถรวบรวมตามแอตทริบิวต์ “ สถานะทางสังคม", "อาชีพ", "เพศ" ฯลฯ
ซีรีส์ใดๆ ที่นำเสนอในรูปแบบตารางประกอบด้วยสองคอลัมน์ คอลัมน์แรกระบุค่าของคุณลักษณะที่กำลังศึกษา (แอตทริบิวต์หรือเชิงปริมาณ) คอลัมน์ที่สองบันทึกจำนวนหน่วยการสังเกตที่มีค่านี้ ดังนั้น การสร้างอนุกรมรูปแบบจึงขึ้นอยู่กับการกำหนดค่าของคุณลักษณะในแต่ละกลุ่มการจำแนกประเภท และการกำหนดจำนวนองค์ประกอบที่อยู่ในกลุ่มนี้
แต่ละค่าของคุณลักษณะในชุดการแจกแจงเรียกว่าตัวแปร
จำนวนองค์ประกอบในแต่ละกลุ่มการจำแนกประเภทหรือจำนวนองค์ประกอบรวมกับตัวเลือกที่กำหนดเรียกว่าความถี่ หรือกล่าวอีกนัยหนึ่ง จำนวนหน่วยการสังเกตที่มีอยู่ในแต่ละกลุ่ม มักจะเรียกว่าความถี่ของอนุกรมการแจกแจง
สัดส่วนของกลุ่มที่กำหนดในผลรวมเรียกว่าความถี่ ความถี่หรือโครงสร้าง แสดงสัดส่วนของประชากรในกลุ่มการจำแนกประเภทที่กำหนด
ความถี่คืออัตราส่วนของความถี่ต่อจำนวนองค์ประกอบทั้งหมดที่กำลังศึกษา ซึ่งก็คือปริมาตรของประชากร
เรามาแสดงความถี่ n หรือ f ความถี่ - p หรือ j
ตัวอย่างของซีรีส์ที่ไม่ต่อเนื่อง
การแสดงในกลุ่มนักศึกษาเศรษฐศาสตร์ จำนวน 15 คน ในวิชาใดวิชาหนึ่ง
การจัดกลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับวัตถุที่แตกต่างกัน หรือในทางกลับกัน สำหรับวัตถุหนึ่ง แต่มากกว่าสอง ช่วงเวลาที่แตกต่างกันเวลาอาจกลายเป็นสิ่งที่หาที่เปรียบมิได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกันหรือความแตกต่างในขอบเขตของช่วงเวลา
การจัดกลุ่มรองหรือการจัดกลุ่มใหม่ของข้อมูลที่จัดกลุ่มถูกนำมาใช้ ลักษณะที่ดีขึ้นปรากฏการณ์ที่กำลังศึกษา (ในกรณีที่การจัดกลุ่มเริ่มแรกไม่ได้ระบุลักษณะการกระจายตัวของหน่วยประชากรอย่างชัดเจน) หรือนำการจัดกลุ่มมาเป็นประเภทที่เทียบเคียงได้เพื่อการวิเคราะห์เปรียบเทียบ
การจัดกลุ่มรอง- นี่คือการดำเนินการเพื่อจัดตั้งกลุ่มใหม่บนพื้นฐานของการจัดกลุ่มที่ดำเนินการก่อนหน้านี้
มีสองวิธีในการสร้างกลุ่มใหม่ วิธีแรกที่ง่ายที่สุดและพบบ่อยที่สุดคือ การเปลี่ยนแปลง (โดยปกติจะเป็นการขยาย) ของช่วงเวลาเริ่มต้น วิธีที่สองเรียกว่า แบ่งปันการจัดกลุ่มใหม่ ประกอบด้วยการก่อตัวของกลุ่มใหม่บนพื้นฐานของการกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม ให้เราอธิบายเทคนิคการจัดกลุ่มรองด้วยตัวอย่าง (ตาราง 3.14)
ตารางที่ 3.14. การกระจายตัวของรัฐวิสาหกิจ ขายปลีกหนึ่งในเมืองของภูมิภาคมอสโกโดยจำนวนพนักงานเฉลี่ยต่อปีในปี 2554*
* ข้อมูลมีเงื่อนไข
เราจะจัดกลุ่มข้อมูลใหม่ โดยสร้างกลุ่มใหม่ในช่วงเวลาสูงสุด 5, 5-10, 10-20, 20-30, 30 คนขึ้นไป
ใหม่ครั้งแรก ทางกลุ่มจะประกอบไปด้วยวิสาหกิจการค้าปลีกกลุ่มแรกและเป็นส่วนหนึ่งของกลุ่มที่สองโดยสมบูรณ์ หากต้องการรวมกลุ่มไม่เกินห้าคน คุณจะต้องรับหนึ่งคนจากช่วงเวลาของกลุ่มที่สอง ขนาดของช่วงเวลาสำหรับกลุ่มนี้คือหกคน ดังนั้นจึงจำเป็นต้องเอา 1/6 ของมัน ส่วนที่คล้ายกันในกลุ่มแรกที่จัดตั้งขึ้นใหม่จะต้องนำมาจากจำนวนวิสาหกิจ ได้แก่ 20 -= 3 องค์กร 6
จากนั้นในกลุ่มวิสาหกิจการค้าปลีกกลุ่มแรกจะมี 16 + 3 = 19 หน่วย
กลุ่มใหม่ที่สองก่อตั้งขึ้นโดยวิสาหกิจการค้าปลีกของกลุ่มที่สองลบด้วยกลุ่มที่จัดเป็นกลุ่มแรกนั่นคือ 20 - 3 = 17 องค์กร กลุ่มที่สามที่ก่อตั้งขึ้นใหม่จะรวมถึงวิสาหกิจทั้งหมดของกลุ่มที่สามและเป็นส่วนหนึ่งของวิสาหกิจในกลุ่มที่สี่ ในการกำหนดส่วนนี้ของช่วงเวลา 18 30 (ความกว้างของช่วงเวลาคือ 12) คุณต้องเพิ่ม 2.0 ไปยังส่วนก่อนหน้า (เพื่อให้ขีดจำกัดบนของช่วงเวลาเท่ากับ 20 คน) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเป็น 2/12 = 1/6 กลุ่มนี้มี 74 วิสาหกิจ ซึ่งหมายความว่าเราต้องเลือก 74 (1/6) = 12 วิสาหกิจ กลุ่มที่สามใหม่จะรวม 44 + 12 = 56 องค์กร
กลุ่มที่สี่ที่จัดตั้งขึ้นใหม่จะรวม 74 - 12 = = 62 องค์กรที่เหลืออยู่จากกลุ่มที่สี่ก่อนหน้า ที่ห้าอีกครั้ง กลุ่มการศึกษาวิสาหกิจการค้าปลีกของกลุ่มก่อนหน้าที่ห้าและหกจะประกอบด้วย: 37 + 9 = 46 วิสาหกิจ
เป็นผลให้เราได้กลุ่มใหม่ (ตาราง 3.15)
ตารางที่ 3.15. การกระจายตัวของวิสาหกิจการค้าปลีกในเมืองใดเมืองหนึ่งของภูมิภาคมอสโกตามจำนวนพนักงานเฉลี่ยต่อปีในปี 2554 หลังจากการจัดกลุ่มข้อมูลใหม่*
* ข้อมูลมีเงื่อนไข
ตารางสถิติ: สาระสำคัญ องค์ประกอบ และการจำแนกประเภท
ตารางสถิติเป็นรูปแบบการนำเสนอเนื้อหาทางสถิติที่มีเหตุผล มองเห็นได้ และกะทัดรัดที่สุด รวมถึงผลลัพธ์ การจัดกลุ่มทางสถิติ- อย่างไรก็ตาม ไม่ใช่ทุกตารางจะมีสถิติ ตารางสูตรคูณหรือแบบสอบถามเชิงสำรวจทางสังคมวิทยาอาจอยู่ในรูปแบบตาราง แต่ยังไม่ใช่ตารางทางสถิติ
ตารางสถิติเป็นตารางที่มีลักษณะเชิงตัวเลขสรุปของประชากรที่กำลังศึกษาตามลักษณะสำคัญหนึ่งหรือหลายลักษณะ เชื่อมโยงกันด้วยตรรกะของการวิเคราะห์ทางเศรษฐศาสตร์
องค์ประกอบหลักของตารางสถิติที่ประกอบเป็นโครงกระดูก (ฐาน) แสดงในแผนภาพ 3.1
แบบตารางเป็นรูปแบบการจัดเรียงข้อมูลตัวเลขโดยตัวเลขจะอยู่ที่จุดตัดของส่วนหัวที่กำหนดไว้อย่างชัดเจนตามแนวคอลัมน์แนวตั้งเรียกว่า นับ, และชื่อตามแถบแนวนอนที่สอดคล้องกัน - เส้น. ดังนั้น ภายนอกตารางจึงเป็นจุดตัดของกราฟและแถวที่ประกอบกันเป็นโครงกระดูกของตาราง
ตารางสถิติประกอบด้วยส่วนหัวสามประเภท: ทั่วไป ด้านบน และด้านข้าง ชื่อทั่วไป สะท้อนถึงเนื้อหาของตารางทั้งหมด (เกี่ยวข้องกับสถานที่และเวลา) ซึ่งอยู่เหนือเค้าโครงตารางตรงกลางและเป็นส่วนหัวภายนอก หัวเรื่องยอดนิยม กำหนดลักษณะเนื้อหาของกราฟ (ส่วนหัวของภาคแสดง) และ ด้านข้าง (หัวเรื่อง) - บรรทัด. ทำหน้าที่เป็นหัวข้อภายใน
กรอบโต๊ะที่เต็มไปด้วยส่วนหัวสร้างเค้าโครงตาราง หากคุณเขียนตัวเลขที่จุดตัดของกราฟและเส้น คุณจะได้ตารางสถิติที่สมบูรณ์ ชื่อตาราง (ชื่อทั่วไป)
โครงการ 3.1 โครงกระดูก (ฐาน) ของตารางสถิติ
สื่อดิจิทัลสามารถแสดงได้ในรูปแบบสัมบูรณ์ ( ทุนจดทะเบียน, ปริมาณของสินค้านวัตกรรม ฯลฯ ) ความสัมพันธ์ (GDP ต่อหัว จำนวนคอมพิวเตอร์ส่วนบุคคลต่อคนงาน 100 คน เป็นต้น) และมูลค่าเฉลี่ย (ราคาหุ้นเฉลี่ย ผลผลิตนมเฉลี่ยต่อวัว ฯลฯ)
ตารางอาจมีหมายเหตุประกอบหากจำเป็น หัวข้อ วิธีการคำนวณตัวบ่งชี้บางตัว แหล่งข้อมูล ฯลฯ
ในแง่ของเนื้อหาเชิงตรรกะ ตารางนี้เป็น "ประโยคทางสถิติ" ซึ่งมีองค์ประกอบหลักคือหัวเรื่องและภาคแสดง
เรื่องวัตถุที่มีลักษณะเป็นตัวเลขเรียกว่า นี่อาจเป็นการรวมหนึ่งรายการขึ้นไป แต่ละหน่วยของการรวมตามลำดับรายการหรือจัดกลุ่มตามลักษณะบางอย่าง หน่วยอาณาเขต ฯลฯ โดยปกติแล้วหัวเรื่องของตารางจะระบุไว้ทางด้านซ้ายในชื่อของแถว
ภาคแสดงสร้างระบบตัวบ่งชี้ที่กำหนดลักษณะวัตถุประสงค์ของการศึกษาเช่น เรื่องของตาราง ภาคแสดงจะสร้างส่วนหัวบนสุดและประกอบขึ้นเป็นเนื้อหาของกราฟโดยมีการจัดเรียงตัวบ่งชี้ตามลำดับตรรกะจากซ้ายไปขวา
ตำแหน่งของเรื่องและภาคแสดงในบางกรณีสามารถสลับเพื่อให้สมบูรณ์ยิ่งขึ้น และ วิธีที่ดีที่สุดการอ่านและวิเคราะห์ข้อมูลเบื้องต้นเกี่ยวกับประชากรที่กำลังศึกษา
ตามโครงสร้างของเรื่องตารางสถิติที่เรียบง่ายและซับซ้อนนั้นขึ้นอยู่กับการจัดกลุ่มหน่วยในนั้น
เรียบง่าย เรียกว่าตารางสถิติ โดยหัวเรื่องจะให้รายการวัตถุหรือ หน่วยดินแดน- ตารางสถิติอย่างง่ายแบ่งออกเป็นแบบ monographic และแบบรายการ
ตารางโมโนแกรม ไม่ได้กำหนดลักษณะของหน่วยทั้งชุดของวัตถุที่กำลังศึกษา แต่มีเพียงหน่วยเดียวหรือกลุ่มที่ระบุตามลักษณะเฉพาะ (ตารางที่ 3 .16).
ตารางที่ 3.16. การว่าจ้างสิ่งอำนวยความสะดวกทางสังคมและวัฒนธรรมในหน่วยงานที่เป็นองค์ประกอบของสหพันธรัฐรัสเซียในปี 2552
ตารางรายการ เรียกว่าตารางที่มีหัวเรื่องประกอบด้วยรายการวัตถุหรือหน่วยของวัตถุที่กำลังศึกษา (ตารางที่ 3.17)
ตารางสถิติที่ซับซ้อน ตรงกันข้ามกับสิ่งธรรมดา ๆ พวกเขาทำให้สามารถระบุประเภททางเศรษฐกิจและสังคมของปรากฏการณ์ที่กำลังศึกษา โครงสร้างของพวกเขาตลอดจนความสัมพันธ์และการพึ่งพาซึ่งกันและกันระหว่างคุณลักษณะที่มีลักษณะเฉพาะ ปัญหาเหล่านี้สามารถแก้ไขได้อย่างสมบูรณ์ยิ่งขึ้นโดยใช้กลุ่มและโดยเฉพาะตารางรวม
กลุ่ม เรียกว่าตารางสถิติ ซึ่งมีการจัดกลุ่มหน่วยประชากรตามคุณลักษณะเชิงปริมาณหรือคุณลักษณะเดียว
ตารางกลุ่มประเภทที่ง่ายที่สุดคือแถวการแจกจ่าย ตารางกลุ่มอาจซับซ้อนกว่านี้หากภาคแสดงมีตัวบ่งชี้เพิ่มเติมจำนวนหนึ่งที่แสดงลักษณะกลุ่มของเรื่อง ตารางดังกล่าวมักใช้เพื่อเปรียบเทียบตัวบ่งชี้ทั่วไปตามกลุ่ม (ตารางที่ 3.18)
ตารางที่ 3.17. การรับการลงทุนจากต่างประเทศในเศรษฐกิจรัสเซียไปยังประเทศนักลงทุนหลักในปี 2552
กลุ่มประชากรแยกตามอายุปี |
ทั้งหมด |
รวมทั้ง |
|
ผู้ชาย |
ผู้หญิง |
||
ดังนั้นตารางกลุ่มทำให้สามารถระบุและจำแนกประเภทของปรากฏการณ์ทางเศรษฐกิจและสังคมและโครงสร้างได้ขึ้นอยู่กับลักษณะเฉพาะเพียงประการเดียว
การรวมกัน เรียกว่าตารางสถิติซึ่งมีการจัดกลุ่มหน่วยประชากรพร้อมกันตามลักษณะสองอย่างขึ้นไป: แต่ละกลุ่มที่สร้างขึ้นตามลักษณะเดียวจะถูกแบ่งออกเป็นกลุ่มย่อยตามลักษณะอื่น ๆ เป็นต้น (ตารางที่ 3.19)
ตารางที่ 3.19. การจัดกลุ่มอพาร์ทเมนท์ที่สร้างเสร็จในอาคารพักอาศัยตามจำนวนห้องและขนาดเฉลี่ย
ตารางที่ 3.18. การกระจายจำนวนผู้มีงานทำในเศรษฐกิจรัสเซียตามกลุ่มอายุ ณ สิ้นเดือนพฤศจิกายน 2552 % ของทั้งหมด
หัวเรื่องในตารางคือกลุ่มของอพาร์ทเมนต์ที่สร้างขึ้นตามจำนวนห้องและขนาดเฉลี่ย
ตารางรวมช่วยให้คุณสามารถระบุลักษณะกลุ่มทั่วไปที่ระบุด้วยคุณลักษณะหลายประการและความสัมพันธ์ระหว่างกลุ่มเหล่านั้น ลำดับของการแบ่งหน่วยประชากรออกเป็นกลุ่มเนื้อเดียวกันตามลักษณะจะพิจารณาจากความสำคัญของหน่วยใดหน่วยหนึ่งในการรวมกันหรือตามลำดับที่ศึกษา
ภาคแสดงของตารางสถิติดังที่ได้กล่าวไปแล้วประกอบด้วยตัวบ่งชี้ที่เป็นลักษณะของวัตถุที่กำลังศึกษา
ขึ้นอยู่กับโครงสร้างของภาคแสดง ตารางสถิติที่เรียบง่ายและซับซ้อนมีความโดดเด่น
ที่ การพัฒนาภาคแสดงอย่างง่าย คุณสมบัติที่นำเสนอในนั้นจะไม่ตัดกันและรับค่าสุดท้ายโดยการรวมค่าสำหรับแต่ละคุณสมบัติแยกกันโดยแยกจากกัน ตัวอย่างของการพัฒนาเพรดิเคตอย่างง่ายคือตาราง 3.20.
ที่ การพัฒนาภาคแสดงที่ซับซ้อน มันกลับกลายเป็นว่าสมบูรณ์ยิ่งขึ้นและ ลักษณะโดยละเอียดวัตถุ. ในกรณีนี้ สัญญาณทั้งสองของภาคแสดง (ตามเพศและอายุ) มีความเกี่ยวข้องกันอย่างใกล้ชิด คุณสามารถวิเคราะห์องค์ประกอบก่อนได้ รัฐดูมาตามฝ่าย
ตารางที่ 3.20.
ตามกลุ่มอายุ จากนั้นแต่ละราย กลุ่มอายุแบ่งออกเป็นสองกลุ่มย่อยตามเพศ กล่าวอีกนัยหนึ่ง ด้วยการพัฒนาที่ซับซ้อนของภาคแสดง ปรากฏการณ์หรือวัตถุสามารถถูกกำหนดลักษณะโดยการผสมผสานคุณสมบัติที่แตกต่างกันที่ก่อตัวขึ้น
ในทุกกรณี เมื่อสร้างตารางสถิติ ผู้วิจัยควรได้รับคำแนะนำจากอัตราส่วนที่เหมาะสมของตัวบ่งชี้ภาคแสดง
กฎพื้นฐานสำหรับการสร้างและวิเคราะห์ตารางทางสถิติ
ตารางสถิติเป็นวิธีการนำเสนอแบบเห็นภาพและกะทัดรัด ข้อมูลดิจิทัลจะต้องมีความถูกต้องทางสถิติ มีเทคนิคพื้นฐานต่อไปนี้ที่กำหนดเทคนิคในการสร้างตารางสถิติ
- 1. จะต้องนำเสนอเนื้อหาดิจิทัลในลักษณะที่เมื่อวิเคราะห์ตาราง สาระสำคัญของปรากฏการณ์จะถูกเปิดเผยโดยการอ่านบรรทัดจากซ้ายไปขวาและจากบนลงล่าง
- 2. ชื่อตารางและชื่อของคอลัมน์และแถวจะต้องมีความชัดเจน กระชับ และแสดงถึงความครบถ้วนสมบูรณ์ที่เข้ากับเนื้อหาของข้อความโดยธรรมชาติ ชื่อของตารางควรสะท้อนถึงวัตถุ ป้าย เวลา และสถานที่จัดงาน
- 3. ข้อมูลที่อยู่ในคอลัมน์ (คอลัมน์) ของตารางจะลงท้ายด้วยบรรทัดสรุป
- 4. หากชื่อของแต่ละคอลัมน์ซ้ำกัน มีคำศัพท์ซ้ำ หรือมีโหลดความหมายเดียว จะต้องกำหนดส่วนหัวแบบรวม
- 5. มีประโยชน์ในการนับจำนวนคอลัมน์และบรรทัด คอลัมน์ทางด้านซ้ายซึ่งเต็มไปด้วยชื่อของบรรทัด มักจะถูกกำหนดด้วยตัวพิมพ์ใหญ่ของตัวอักษร (A), (B) ฯลฯ และคอลัมน์ที่ตามมาทั้งหมด - ตามตัวเลขจากน้อยไปหามาก
- 6. ขอแนะนำให้วางข้อมูลที่เกี่ยวข้องกันซึ่งระบุลักษณะหนึ่งของปรากฏการณ์ที่กำลังวิเคราะห์ในคอลัมน์ที่อยู่ติดกัน
- 7. คอลัมน์และเส้นจะต้องมีหน่วยการวัดที่สอดคล้องกับตัวชี้วัดที่ตั้งไว้ในหัวเรื่องและภาคแสดง ในกรณีนี้จะใช้ตัวย่อที่ยอมรับโดยทั่วไปของหน่วยการวัด (rub., kWh ฯลฯ )
- 8. ควรปัดเศษตัวเลขทุกครั้งที่เป็นไปได้ ตัวเลขภายในคอลัมน์หรือบรรทัดเดียวกันควรปัดเศษด้วยความแม่นยำเท่ากัน
- 9. หากจำเป็น ข้อมูลเพิ่มเติม(คำอธิบายในตาราง) อาจให้หมายเหตุก็ได้
การปฏิบัติตามกฎที่กำหนดสำหรับการสร้างและการออกแบบตารางสถิติทำให้เป็นวิธีการหลักในการนำเสนอประมวลผลและสรุปข้อมูลทางสถิติเกี่ยวกับสถานะและการพัฒนาปรากฏการณ์ทางเศรษฐกิจและสังคมที่วิเคราะห์แล้ว
การวิเคราะห์ตารางสถิติดำเนินการในสองทิศทาง: โครงสร้างและเนื้อหา
การวิเคราะห์โครงสร้าง เกี่ยวข้องกับการวิเคราะห์โครงสร้างของตารางและการกำหนดลักษณะ:
- จำนวนทั้งสิ้นและหน่วยการสังเกตที่ก่อตัวขึ้น
- เครื่องหมายและการรวมกันที่ก่อให้เกิดหัวเรื่องและภาคแสดงของตาราง
- ประเภทโต๊ะ;
- งานที่จะแก้ไข
- การวิเคราะห์แต่ละกลุ่มของวิชาตามลักษณะที่สอดคล้องกันของภาคแสดง
- การระบุความสัมพันธ์และสัดส่วนระหว่างกลุ่มปรากฏการณ์ตามลักษณะ
- การวิเคราะห์เปรียบเทียบและการกำหนดข้อสรุป การสร้างรูปแบบ และการกำหนดปริมาณสำรองเพื่อการพัฒนาวัตถุที่กำลังศึกษา
การวิเคราะห์ลักษณะเฉพาะบุคคลและกลุ่มจะต้องเริ่มต้นด้วยการศึกษาค่าสัมบูรณ์จากนั้น - ค่าสัมพัทธ์ที่เกี่ยวข้องกับค่าเหล่านั้น
หากวัตถุประสงค์การวิจัยต้องการสิ่งนี้ การวิเคราะห์ตารางสามารถเสริมด้วยค่าสัมพัทธ์และค่าเฉลี่ยที่คำนวณได้ กราฟ ไดอะแกรม ฯลฯ
การวิเคราะห์ตารางเหล่านี้ดำเนินการสำหรับแต่ละลักษณะแยกกัน จากนั้นจึงรวมลักษณะเชิงตรรกะและเศรษฐกิจเข้าด้วยกัน
การปฏิบัติตามกฎและความสม่ำเสมอในการทำงานกับตารางสถิติจะช่วยให้ผู้วิจัยสามารถดำเนินการวิเคราะห์ทางเศรษฐศาสตร์และสถิติเชิงวิทยาศาสตร์ที่ครอบคลุมของวัตถุและกระบวนการที่กำลังศึกษาอยู่
คำถามที่ 10 การจัดกลุ่มรอง วิธีการนำไปใช้
การจัดกลุ่ม - นี่คือการแบ่งประชากรทางสถิติที่ศึกษาออกเป็นส่วนๆ ตามลักษณะการจัดกลุ่มตั้งแต่หนึ่งลักษณะขึ้นไป การจัดกลุ่มอย่างถูกต้องส่วนใหญ่รับประกันความน่าเชื่อถือของการศึกษาทางสถิติทั้งหมด
การจัดกลุ่มเบื้องต้น จัดทำขึ้นบนพื้นฐานของการเรียงลำดับแหล่งข้อมูลหลัก
การจัดกลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับภูมิภาคที่แตกต่างกัน หรือในทางกลับกัน สำหรับภูมิภาคเดียวกัน แต่ในช่วงเวลาที่แตกต่างกันสองช่วง อาจกลายเป็นสิ่งที่หาที่เปรียบมิได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกัน หรือขอบเขตที่ไม่เท่ากันของ ช่วงเวลา ในกรณีนี้ จำเป็นต้องจัดกลุ่มข้อมูลใหม่โดยใช้การจัดกลุ่มรอง
การจัดกลุ่มรอง - การดำเนินการจัดตั้งกลุ่มใหม่โดยยึดตามการจัดกลุ่มที่ดำเนินการก่อนหน้านี้
มีสองวิธีในการสร้างกลุ่มใหม่
1. วิธีที่ง่ายและธรรมดาที่สุดคือการเปลี่ยน (โดยปกติจะขยาย) ช่วงเวลาเริ่มต้น
2. ดีออกจากกลุ่มใหม่- วิธีการประกอบด้วยการก่อตัวของกลุ่มใหม่โดยกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม
ตัวอย่าง.จำเป็นต้องจัดกลุ่มข้อมูลใหม่โดยสร้างกลุ่มใหม่โดยมีช่วงเวลาสูงสุด 500, 500 - 1,000, 1,000 - 2,000, 2,000 - 3,000, มากกว่า 3,000 รูเบิล ตามข้อมูลการกระจายสัญญาของบริษัทรับเหมาก่อสร้างตามกำไร
โต๊ะ. การกระจายสัญญาของบริษัทรับเหมาก่อสร้างตามผลกำไร¹
กลุ่มใหม่กลุ่มแรกจะรวมสัญญากลุ่มที่ 1 ทั้งหมดและเป็นส่วนหนึ่งของกลุ่มที่ 2 หากต้องการสร้างกลุ่มมากถึง 500,000 รูเบิล คุณต้องรับ 100,000 รูเบิลจากช่วงเวลาของกลุ่มที่ 2 ขนาดของช่วงเวลาของกลุ่มนี้คือ 600,000 รูเบิล ดังนั้นจึงจำเป็นต้องใช้ 1/6 ของมัน (100: 600) ส่วนที่คล้ายกันในกลุ่มใหม่ที่ตั้งขึ้นใหม่จะต้องนำมาจากจำนวนสัญญา ได้แก่ 20 1/6 - 3 สัญญา จากนั้นในกลุ่มที่ 1 จะมี 16 + 3 = 19 สัญญา กลุ่มใหม่ที่สองถูกสร้างขึ้นโดยสัญญาของกลุ่มที่ 2 ลบด้วยสัญญาที่กำหนดให้กับกลุ่มที่ 1 นั่นคือ 20 - 3 = 17 หน่วย กลุ่มที่สามที่จัดตั้งขึ้นใหม่จะรวมสัญญาทั้งหมดของกลุ่มที่ 3 และเป็นส่วนหนึ่งของสัญญาของกลุ่มที่ 4 ในการกำหนดส่วนนี้จากช่วงเวลา 1800 -3000 (ความกว้างของช่วงเวลาคือ 1,200,000 รูเบิล) คุณต้องเพิ่ม 200,000 รูเบิลไปยังส่วนก่อนหน้า (เพื่อให้ขีด จำกัด บนของช่วงเวลาเท่ากับ 2,000 รูเบิล) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเวลาเป็น 200:1200 เช่น 1/6 กลุ่มนี้มี 74 สัญญา ซึ่งหมายความว่าคุณต้องรับ 74 ¦ (1: 6) = 12 หน่วย กลุ่มใหม่ที่สามจะรวม: 44 N-12 - 56 สัญญา กลุ่มที่สี่ที่ตั้งขึ้นใหม่จะประกอบด้วย: 74 - 12 =62 สัญญาที่เหลืออยู่จากกลุ่มที่ 4 ก่อนหน้า กลุ่มที่ห้าที่ตั้งขึ้นใหม่จะประกอบด้วยสัญญาจากกลุ่มก่อนหน้าที่ 5 และ 6: 37 + 9 = 46 สัญญา เทคนิคการจัดกลุ่มใหม่แสดงอยู่ในตาราง
นอกจากการจัดกลุ่มหลักแล้ว การจัดกลุ่มรองยังถูกนำมาใช้กันอย่างแพร่หลายในสถิติ วี การจัดกลุ่มรองเรียกการก่อตัวของกลุ่มใหม่ตามการจัดกลุ่มที่ดำเนินการก่อนหน้านี้
การจัดกลุ่มรองใช้ในการแก้ปัญหาต่าง ๆ ที่สำคัญที่สุดคือ: 1) การก่อตัวตามการจัดกลุ่มตามลักษณะเชิงปริมาณของกลุ่ม (ประเภทที่เป็นเนื้อเดียวกันในเชิงคุณภาพ); 2) นำสองกลุ่ม (หรือมากกว่า) ที่มีช่วงเวลาต่างกันมาเป็นรูปแบบเดียวเพื่อวัตถุประสงค์ในการเปรียบเทียบและการวิเคราะห์ 3) การก่อตัวของกลุ่มใหญ่ซึ่งลักษณะของการกระจายปรากฏชัดเจนยิ่งขึ้น
สาระสำคัญของเทคนิคนี้คือเพื่อให้ได้ข้อมูลที่เปรียบเทียบได้สำหรับกลุ่มต่างๆ ซึ่ง: ความแข็งแกร่งเชิงตัวเลขกลุ่ม (พร้อมเปอร์เซ็นต์) ได้รับการแก้ไขในระดับเดียวกันสำหรับทุกกลุ่ม มีการติดตั้งในห้องน้ำกลุ่มทั้งหมดด้วย จำนวนเท่ากันกลุ่มและเนื้อหาเดียวกันของตารางกลุ่ม ไม่ใช่ตัวบ่งชี้ที่แน่นอนโดยกลุ่มที่ต้องถูกเปรียบเทียบและเปรียบเทียบ แต่เป็นค่าสัมพัทธ์และเปอร์เซ็นต์
การจัดกลุ่มรองมีสองวิธี: 1) โดยการเปลี่ยนช่วงของการจัดกลุ่มหลัก (โดยปกติโดยการขยายช่วง) และ 2) โดยการกำหนดส่วนหนึ่งของหน่วยประชากรให้กับแต่ละกลุ่ม (การจัดกลุ่มใหม่บางส่วน) เมื่อใช้วิธีการจัดกลุ่มทุติยภูมิเหล่านี้ มักจะถือว่าการกระจายตัวของคุณลักษณะภายในช่วงเวลาจะสม่ำเสมอ
การใช้การจัดกลุ่มรองเพื่อนำสองกลุ่มที่มีช่วงเวลาต่างกันมาอยู่ในรูปแบบเดียวเพื่อวัตถุประสงค์ในการเปรียบเทียบจะแสดงตัวอย่างด้วยตัวอย่างต่อไปนี้ ในการดำเนินการนี้ เราใช้ข้อมูลจากการจัดกลุ่มหลักของสองภูมิภาคตามจำนวนคนงานปศุสัตว์ (ตาราง 3.7)
ตารางที่ 3.7. การจัดกลุ่มฟาร์มใน 2 อำเภอตามจำนวนคนงานปศุสัตว์
เขต 1 |
เขตที่ 2 |
||
กลุ่มฟาร์มโดย |
กลุ่มฟาร์มโดย |
||
ในที่สุด |
จำนวนพนักงานคน |
ในที่สุด |
|
ข้อมูลโดยตรงเกี่ยวกับการจัดกลุ่มของทั้งสองอำเภอไม่สามารถเปรียบเทียบได้ เนื่องจากฟาร์มจะกระจายออกเป็นกลุ่มตามช่วงเวลาที่แตกต่างกัน: 20 คน ในภูมิภาค 1 และ 30 คน ในภูมิภาค II จำนวนกลุ่มที่จัดสรรก็ไม่เท่ากัน
เพื่อนำทั้งสองกลุ่มมาอยู่ในรูปแบบที่เปรียบเทียบกันได้ เราจะดำเนินการจัดกลุ่มรอง เพื่อจุดประสงค์นี้ เราจึงจัดกลุ่มเนื้อหาใหม่ออกเป็นกลุ่มที่เหมือนกันสำหรับทั้งสองภูมิภาค: เรามาแบ่งกลุ่มกัน 40 คน (ตารางที่ 3.8)
เนื่องจากมีความเป็นไปได้ที่จะดำเนินการจัดกลุ่มฟาร์มรองในภูมิภาคโดยเพียงแค่ขยายช่วงเวลา (มีความบังเอิญที่ช่วงล่างและช่วงบนในสองกลุ่ม) เราจึงใช้วิธีนี้ในการแก้ปัญหา
ให้เราอธิบายลำดับการคำนวณ ฟาร์มกลุ่มแรกที่มีพนักงานมากถึง 160 คน จะรวมถึงฟาร์มของกลุ่ม I และ II
ตารางที่ 3.8. การจัดกลุ่มฟาร์มรองในสองอำเภอตามจำนวนคนงานปศุสัตว์
ในที่สุดส่วนแบ่งของฟาร์มในกลุ่มเหล่านี้จะอยู่ที่ 16% (4+12) ฟาร์มกลุ่มที่สองที่มีพนักงาน 160 ถึง 200 คน จะรวมถึงฟาร์มของกลุ่ม III และ IV ความถ่วงจำเพาะรวมจะเป็น 45% (18+27) การคำนวณจะดำเนินการในลักษณะเดียวกันเมื่อสร้างกลุ่มที่เหลือ
เรากำลังจัดกลุ่มฟาร์มของภูมิภาค II ใหม่ เนื่องจากการขยายช่วงระยะเวลาสำหรับฟาร์มในภูมิภาค II ไม่เหมาะสมและไม่สามารถแก้ปัญหาได้ เราจึงใช้วิธีการจัดกลุ่มข้อมูลการจัดกลุ่มหลักใหม่บางส่วน
กลุ่มฟาร์มกลุ่มแรกที่สร้างขึ้นใหม่ในภูมิภาค II ซึ่งมีจำนวนคนงานปศุสัตว์มากถึง 160 คนจะรวมฟาร์มของกลุ่มหลักที่มีช่วงเวลาเดียวกันโดยสมบูรณ์ ส่วนแบ่งของฟาร์มในกลุ่มนี้คือ 8%
ในกลุ่มฟาร์มที่สองของกลุ่มรองมีจำนวนคนงานตั้งแต่ 160 ถึง 200 คน ฟาร์มของกลุ่ม II (16%) และส่วนหนึ่งของฟาร์มของกลุ่ม III จะถูกรวมทั้งหมด ในการกำหนดส่วนของฟาร์มที่ต้องนำมาจากกลุ่ม III จำเป็นต้องแบ่งออกเป็นกลุ่มย่อยโดยมีจำนวนคนงาน 190 - 200, 200 - 210, 210 - 220 คน ตัวชี้วัดส่วนแบ่งของฟาร์มในกลุ่มย่อยเหล่านี้จะถูกกำหนดตามสัดส่วนการแบ่งช่วงเวลา ขนาดช่วงเวลาที่เรากำลังพิจารณาคือ 30 คน และแบ่งออกเป็นสามส่วนเท่าๆ กัน เพื่อให้ได้ช่วงที่ต้องการ 160 - 200 คน ถึงมูลค่าของช่วงเวลาของกลุ่ม II (160 - 190 คน) ควรเพิ่มหนึ่งในสามของมูลค่าของช่วงเวลาของกลุ่ม III (190 - 220 คน) และส่วนเดียวกันของฟาร์มของกลุ่มนี้
ดังนั้น กลุ่มฟาร์มที่สร้างขึ้นใหม่อีกกลุ่มหนึ่งจะรวม 16% ของฟาร์มของกลุ่มที่สองและหนึ่งในสามของกลุ่ม III - 10% (1/3-30) ซึ่งจะเท่ากับ 26% ของจำนวนฟาร์มทั้งหมด ในภูมิภาค II
ฟาร์มกลุ่มที่ 3 ของกลุ่มรอง (200 - 240 คน) จะรวมส่วนหนึ่งของฟาร์มของกลุ่มที่ 3 (190 - 220 คน) ซึ่งยังคงอยู่ - 20% (% -30) และสองในสามของฟาร์มของ กลุ่ม IV (220 - 250 คน) - 14% (%-21) นั่นคือ 34% ของจำนวนฟาร์มทั้งหมดในภูมิภาค II
การคำนวณที่คล้ายกันจะดำเนินการเมื่อสร้างกลุ่มฟาร์มที่สร้างขึ้นใหม่ที่เหลือ: 240 - 280 คนและมากกว่า 280 คน เหมือนอยู่ในโต๊ะ 3.7 พร้อมด้วยข้อมูลเกี่ยวกับส่วนแบ่งของฟาร์มตามกลุ่ม ให้ข้อมูลเกี่ยวกับตัวเลข จากนั้นการคำนวณในกลุ่มที่สร้างขึ้นใหม่จะดำเนินการในสัดส่วนเดียวกันกับ ความถ่วงจำเพาะฟาร์ม
หลังจากการจัดกลุ่มรอง วัสดุหลักจะสามารถเปรียบเทียบได้ เนื่องจากทั้งสองภูมิภาคใช้กลุ่มเดียวกันตามจำนวนคนงาน จากข้อมูลในตาราง ตาราง 3.8 แสดงให้เห็นว่าการกระจายตัวของฟาร์มตามจำนวนคนงานปศุสัตว์ในทั้งสองภูมิภาคมีความแตกต่างกันอย่างมีนัยสำคัญ: ในภูมิภาค 1 ฟาร์มที่มีคนงานปศุสัตว์มากถึง 200 คนมีอำนาจเหนือกว่า (61% ของจำนวนฟาร์มทั้งหมด) ในภูมิภาค II - ฟาร์มที่มีคนงานปศุสัตว์ - มากกว่า 200 คน (66% ของจำนวนฟาร์มทั้งหมด)
การส่งผลงานที่ดีของคุณไปยังฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง
นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง
โพสต์เมื่อ http://www.allbest.ru/
สถาบันมอสโกตั้งชื่อตาม ส.ยู. วิตต์
คณะเศรษฐศาสตร์
ทดสอบ
งานเสร็จแล้ว:
นักศึกษาชั้นปีที่ 1
การเรียนรู้ทางไกล
Vislyaeva M.N.
มอสโก
เมื่อดำเนินการ งานควบคุมคุณต้องทำการจัดเรียงใหม่เพื่อไม่ให้ ตัวอย่างที่ซับซ้อน(เลือกตัวอย่างด้วยตัวคุณเอง) และอธิบายว่าการคำนวณใหม่ดังกล่าวถูกต้องอย่างไรและภายใต้เงื่อนไขใด เมื่อใช้โปรแกรมคอมพิวเตอร์และตัวอย่างที่ซับซ้อนมากขึ้น ให้ระบุถึงผลกระทบและคุณสมบัติของการใช้งานไอทีด้วย
ในการตอบกลับเป็นลายลักษณ์อักษรของคุณต่องาน คุณต้อง:
1. อธิบายความเชื่อมโยงระหว่างสูตรบวกความแปรปรวนกับความสัมพันธ์สหสัมพันธ์ อธิบายความหมายทางสถิติ
2. เปรียบเทียบความแปรผันของการแจกแจงสองแบบด้วยค่าเฉลี่ยที่ต่างกัน อธิบายเงื่อนไขของการเปรียบเทียบได้เมื่อค่าเฉลี่ยแตกต่างกัน
3. ให้คำอธิบายที่สมบูรณ์ที่สุดเกี่ยวกับความหมายของข้อผิดพลาดส่วนเพิ่ม เชื่อมโยงกับแนวคิดเรื่องตัวแทนของกลุ่มตัวอย่างและปริมาตรที่ต้องการ
4. อธิบายความสัมพันธ์ระหว่างการประมาณค่าพารามิเตอร์ที่ไม่รู้จักโดยใช้ OLS และการตรวจสอบนัยสำคัญของผลลัพธ์ที่ได้รับโดยใช้เกณฑ์ในการทดสอบสมมติฐานทางสถิติ
การจัดกลุ่มสถิติที่จัดกลุ่มไว้ก่อนหน้านี้ใหม่เรียกว่าการจัดกลุ่มรอง วิธีการนี้ใช้ในกรณีที่ลักษณะของการกระจายตัวของประชากรที่กำลังศึกษาไม่ชัดเจนอันเป็นผลมาจากการจัดกลุ่มครั้งแรก
ในกรณีนี้ ช่วงเวลาจะขยายหรือลดลง การจัดกลุ่มรองยังใช้เพื่อนำการจัดกลุ่มตามช่วงเวลาที่ต่างกันมาเป็นรูปแบบที่เปรียบเทียบได้เพื่อจุดประสงค์ในการเปรียบเทียบ ลองดูเทคนิคการจัดกลุ่มรองโดยใช้ตัวอย่าง
ขยายช่วงเวลาตามข้อมูลในตารางที่ 1:
ตารางที่ 1
จำนวนร้านค้า |
|||
การจัดกลุ่มข้างต้นยังไม่ชัดเจนเพียงพอ เนื่องจากไม่ได้แสดงรูปแบบการเปลี่ยนแปลงมูลค่าการซื้อขายตามกลุ่มที่ชัดเจนและเข้มงวด
ให้เรากระชับแถวการแจกแจงโดยแบ่งเป็นหกกลุ่ม กลุ่มใหม่จะถูกสร้างขึ้นโดยการรวมกลุ่มเดิม (ตารางที่ 2)
ตารางที่ 2
กลุ่มร้านค้าตามขนาดมูลค่าการซื้อขายสำหรับไตรมาสที่สี่ พันรูเบิล |
จำนวนร้านค้า |
มูลค่าการซื้อขายในไตรมาสที่สี่พันรูเบิล |
มูลค่าการซื้อขายเฉลี่ยต่อร้าน พันรูเบิล |
|
เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งร้านค้ามีขนาดใหญ่เท่าใด ระดับการหมุนเวียนก็จะยิ่งสูงขึ้นเท่านั้น
1. จากการจัดกลุ่มเชิงวิเคราะห์ ความสัมพันธ์สามารถวัดได้โดยใช้ความสัมพันธ์เชิงประจักษ์ ตัวบ่งชี้นี้แสดงไว้ อักษรกรีกซี (นี่) ขึ้นอยู่กับกฎการสลายตัวของความแปรปรวน ซึ่งความแปรปรวนรวม s2 เท่ากับผลรวมของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม
การกระจายตัวของคุณลักษณะที่มีประสิทธิผลภายในกลุ่มที่มีความคงที่สัมพัทธ์ของคุณลักษณะของปัจจัยนั้นเกิดขึ้นเนื่องจากปัจจัยอื่นๆ ความแปรปรวนนี้เรียกว่าค่าคงเหลือ ถูกกำหนดโดยสูตร:
โดยที่ y ij คือค่าของคุณลักษณะ y สำหรับ หน่วยที่ iในกลุ่ม j;
J คือค่าเฉลี่ยของลักษณะในกลุ่มที่ j
nj - หมายเลข หน่วย jthกลุ่ม;
j = 1, 2, 3, ... เช่น
ความแปรปรวนภายในกลุ่มที่คำนวณสำหรับแต่ละกลุ่มจะรวมกันเข้ากับค่าเฉลี่ยความแปรปรวนภายในกลุ่ม:
ความแปรปรวนระหว่างกลุ่มเป็นผลมาจากปัจจัยที่กำลังศึกษา (และปัจจัยที่เกี่ยวข้อง) ดังนั้นจึงเรียกว่าความแปรปรวนของปัจจัย มันถูกกำหนดโดยสูตร
กฎสำหรับการบวกผลต่างสามารถเขียนได้:
อัตราส่วนสหสัมพันธ์เชิงประจักษ์วัดความแปรปรวนโดยรวมในคุณลักษณะผลลัพธ์ที่เกิดจากปัจจัยที่กำลังศึกษา ดังนั้นจึงคำนวณเป็นอัตราส่วนของความแปรปรวนของปัจจัยต่อความแปรปรวนรวมของคุณลักษณะผลลัพธ์:
ตัวบ่งชี้นี้รับค่าในช่วง: ยิ่งใกล้ 1 การเชื่อมต่อยิ่งใกล้มากขึ้น และในทางกลับกัน
ตารางที่ 3. ข้อมูลเริ่มต้น
ตารางที่ 4. แผ่นงาน
มูลค่าการซื้อขายเฉลี่ย = ?X*f / f= 17370/51 = 340.58 พันรูเบิล
ความแปรปรวนคือ:
G2 =? f*(X-Xav) 2 / ? ฉ = 38682.36/51 = 758.48
ส่วนเบี่ยงเบนมาตรฐาน:
ค่าสัมประสิทธิ์ของการแปรผันคือ:
วี = G / Xavg = 27.54/758.48 = 0.081; 8.1%
ค่าสัมประสิทธิ์การเปลี่ยนแปลงน้อยกว่า 33% ดังนั้นประชากรจึงเป็นเนื้อเดียวกัน
ตารางที่ 5. ข้อมูลเริ่มต้น
1) เวลาเฉลี่ยที่ใช้ในการเดินทางไปยังสถานที่ทำงานของคนงาน = X av =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41.8 นาที
2) การคำนวณผลต่าง
ความแปรปรวนคือ:
G2 =? ส่วนเบี่ยงเบนฉ:
3) ค่าสัมประสิทธิ์*(X-Xaver) 2 / ? ฉ = 43160.8/420 = 102.8
การแปรผันกำลังสองเฉลี่ยเท่ากับ:
วี = G / Xavg = 10.14/41.8 = 0.24; 24%
ค่าสัมประสิทธิ์ของการแปรผันน้อยกว่า 33% ดังนั้นประชากรที่พิจารณาว่าเป็นเนื้อเดียวกันและค่าเฉลี่ยของความแปรปรวนนั้นค่อนข้างปกติ
ประชากรตัวอย่างสามารถเกิดขึ้นได้จากลักษณะเชิงปริมาณของค่าทางสถิติ เช่นเดียวกับลักษณะทางเลือกหรือลักษณะเฉพาะ ในกรณีแรก ลักษณะทั่วไปของกลุ่มตัวอย่างคือค่าเฉลี่ยของกลุ่มตัวอย่าง ซึ่งแสดงด้วยสัญลักษณ์ และในกรณีที่สอง สัดส่วนของตัวอย่างจะแสดงด้วยสัญลักษณ์ w ในประชากรทั่วไป ตามลำดับ: ค่าเฉลี่ยทั่วไป และส่วนแบ่งทั่วไปของ p
ความแตกต่าง -- และ W -- p เรียกว่าข้อผิดพลาดในการสุ่มตัวอย่าง ซึ่งแบ่งออกเป็นข้อผิดพลาดในการลงทะเบียนและข้อผิดพลาดในการเป็นตัวแทน ส่วนแรกของข้อผิดพลาดในการสุ่มตัวอย่างเกิดขึ้นเนื่องจากข้อมูลที่ไม่ถูกต้องหรือไม่ถูกต้องเนื่องจากขาดความเข้าใจในสาระสำคัญของปัญหาการไม่เอาใจใส่ของนายทะเบียนเมื่อกรอกแบบสอบถามแบบฟอร์ม ฯลฯ มันค่อนข้างง่ายที่จะตรวจจับและกำจัด ส่วนที่สองของข้อผิดพลาดเกิดขึ้นจากความล้มเหลวอย่างต่อเนื่องหรือเกิดขึ้นเองในการปฏิบัติตามหลักการเลือกแบบสุ่ม ตรวจจับและกำจัดได้ยาก มีขนาดใหญ่กว่าอันแรกมาก ดังนั้นจึงให้ความสำคัญกับมันเป็นหลัก
พิเศษเฉพาะ บทบาทที่สำคัญเพื่อเป็นเหตุผลและการประยุกต์ใช้ การสังเกตตัวอย่างกฎแห่งจำนวนมากมายเกิดขึ้น การใช้กฎจำนวนมากคือภายใต้เงื่อนไขบางประการและมีการสังเกตในปริมาณมากพอสมควร ลักษณะสรุปที่ได้รับจากการสังเกตตัวอย่างจะแตกต่างเล็กน้อยจากลักษณะที่สอดคล้องกันของหนังสือมอบอำนาจทั่วไป ด้วยเหตุนี้ จึงเป็นไปได้โดยการเพิ่มขนาดประชากรตัวอย่างเพื่อลดขีดจำกัด ข้อผิดพลาดที่เป็นไปได้เป็นตัวแทนให้พาพวกเขาไป ขนาดที่เล็กที่สุด- ในทางกลับกัน เมื่อทราบขีดจำกัดของข้อผิดพลาดในการเป็นตัวแทนแล้ว จึงสามารถกำหนดขนาดที่ต้องการของประชากรตัวอย่างได้
งานที่สำคัญและมีความรับผิดชอบที่สุดประการหนึ่งในการจัดระเบียบและดำเนินการสังเกตตัวอย่างคือการกำหนดขนาดที่ต้องการของประชากรตัวอย่าง เช่น ตัวเลขดังกล่าวจะทำให้ได้รับข้อมูลที่สะท้อนคุณสมบัติที่ศึกษาของประชากรทั่วไปได้อย่างถูกต้องเพียงพอ
ในกรณีนี้จะต้องคำนึงถึงสิ่งต่อไปนี้: 1) ควรได้รับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดด้วยความแม่นยำระดับใด 2) ความน่าจะเป็นที่จะรับประกันความถูกต้องตามเงื่อนไขของผลลัพธ์ของการสังเกตตัวอย่างควรเป็นอย่างไร 3) ระดับความผันผวนของคุณสมบัติที่ศึกษาในประชากรที่ศึกษา
ซึ่งหมายความว่าขนาดตัวอย่างที่ต้องการจะถูกตั้งค่าโดยขึ้นอยู่กับขนาดของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ค่าของสัมประสิทธิ์ความเชื่อมั่น (t) และขนาดของความแปรปรวน
วิธีการประมาณค่าพารามิเตอร์ การถดถอยเชิงเส้นซึ่งจะลดผลรวมของการเบี่ยงเบนกำลังสองของการสังเกตตัวแปรตามจากฟังก์ชันเชิงเส้นที่ต้องการให้เหลือน้อยที่สุด เรียกว่าวิธีกำลังสองน้อยที่สุด
สาระสำคัญของวิธีการนี้คือเกณฑ์สำหรับคุณภาพของโซลูชันที่พิจารณาคือผลรวมของข้อผิดพลาดกำลังสองซึ่งพวกเขาพยายามลดให้เหลือน้อยที่สุด หากต้องการใช้วิธีนี้จำเป็นต้องดำเนินการให้มากที่สุด จำนวนที่มากขึ้นการวัดตัวแปรสุ่มที่ไม่รู้จัก (ยิ่งมาก ความแม่นยำของโซลูชันก็จะยิ่งสูงขึ้น) และชุดของโซลูชันโดยประมาณบางชุดที่ต้องเลือกโซลูชันที่ดีที่สุด ถ้าชุดของโซลูชันถูกกำหนดเป็นพารามิเตอร์ เราจำเป็นต้องค้นหาค่าที่เหมาะสมที่สุดของพารามิเตอร์
LSM ใช้ในคณิตศาสตร์ โดยเฉพาะในทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ วิธีนี้ใช้กันอย่างแพร่หลายในการกรองปัญหาเมื่อจำเป็นต้องแยกสัญญาณที่เป็นประโยชน์ออกจากสัญญาณรบกวนที่ซ้อนทับอยู่ นอกจากนี้ยังใช้ในการวิเคราะห์ทางคณิตศาสตร์เพื่อเป็นตัวแทนโดยประมาณ ฟังก์ชันที่กำหนดฟังก์ชั่นที่เรียบง่ายยิ่งขึ้น การประยุกต์ใช้กำลังสองน้อยที่สุดอีกประการหนึ่งคือการแก้ระบบสมการที่ไม่ทราบจำนวนน้อยกว่าจำนวนสมการ
ขั้นตอนการทดสอบสมมติฐานทางสถิติ:
การกำหนดสมมติฐานหลัก H 0 และสมมติฐานที่แข่งขันกัน H 1 . สมมติฐานจะต้องถูกทำให้เป็นทางการอย่างชัดเจนในแง่คณิตศาสตร์
การกำหนดความน่าจะเป็น ข เรียกว่าระดับนัยสำคัญและสอดคล้องกับข้อผิดพลาดประเภทแรกซึ่งจะมีข้อสรุปเกี่ยวกับความจริงของสมมติฐานในอนาคต
การคำนวณเกณฑ์สถิติμเป็นดังนี้:
ค่าของมันขึ้นอยู่กับตัวอย่างดั้งเดิม
ขึ้นอยู่กับคุณค่าของมันเราสามารถสรุปเกี่ยวกับความจริงของสมมติฐาน H 0 ;
สถิตินั้นจะต้องเป็นไปตามกฎหมายการกระจายที่ทราบบางประการเพราะว่า q นั้นสุ่มมาจากความบังเอิญ
การก่อสร้างพื้นที่วิกฤต จากช่วงของค่า μ จะมีการระบุชุดย่อยของค่าดังกล่าวตามที่สามารถตัดสินความแตกต่างที่มีนัยสำคัญกับสมมติฐานได้ ขนาดของมันถูกเลือกในลักษณะที่พึงพอใจอย่างเท่าเทียมกัน ชุดนี้เรียกว่าบริเวณวิกฤต
บทสรุปเกี่ยวกับความจริงของสมมติฐาน ค่าตัวอย่างที่สังเกตได้จะถูกแทนที่ในสถิติ q และขึ้นอยู่กับว่าค่าเหล่านี้ตก (หรือไม่ตก) ในบริเวณวิกฤต จึงมีการตัดสินใจที่จะปฏิเสธ (หรือยอมรับ) สมมติฐานที่หยิบยกขึ้นมา H0
การแปรผันสหสัมพันธ์การกระจายตัว
โพสต์บน Allbest.ru
...เอกสารที่คล้ายกัน
ตารางค่าตัวอย่างของตัวแปรสุ่มแบบไม่ต่อเนื่องในรูปแบบเรียงลำดับ ตารางช่วงเวลา ชุดสถิติความถี่สัมพัทธ์ การระบุฟังก์ชันการแจกแจงเชิงประจักษ์และการลงจุด รูปหลายเหลี่ยมและการแจกแจงตัวแปรสุ่ม
งานภาคปฏิบัติ เพิ่มเมื่อ 26/07/2555
ลักษณะเชิงตัวเลขสำหรับการแจกแจงทางสถิติ การสร้างอนุกรมการแปรผันตามช่วงเวลา รูปหลายเหลี่ยมความถี่ กราฟของฟังก์ชันการแจกแจงตัวอย่าง และการหาค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างด้วยสองวิธี
การนำเสนอเพิ่มเมื่อ 11/01/2013
ค่าเฉลี่ยของตัวบ่งชี้ (ค่าเฉลี่ยเลขคณิต) ตัวชี้วัดการเปลี่ยนแปลง - ช่วงของการแปรผัน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว ค่าสัมประสิทธิ์ของการแปรผัน สูงสุดและ ค่าต่ำสุดตัวบ่งชี้ทางสถิติ
ทดสอบเพิ่มเมื่อ 11/14/2551
แนวคิดเรื่องประชากรทั่วไป ความคาดหวังทางคณิตศาสตร์ และการกระจายตัว รับรองความสุ่มและความเป็นตัวแทนของกลุ่มตัวอย่างในการวางแผนทางสถิติ อนุกรมการแปรผันแบบไม่ต่อเนื่องและแบบช่วง การประมาณค่าจุดของพารามิเตอร์การกระจายตัวแบบคุณลักษณะ
บทคัดย่อเพิ่มเมื่อ 13/06/2554
สาระสำคัญของการวิจัยสุ่มตัวอย่าง วิธีการเลือกหน่วยในกลุ่มประชากรตัวอย่าง ค่าเฉลี่ยและความคลาดเคลื่อนส่วนเพิ่มสำหรับการวัดค่าเฉลี่ยและสัดส่วน การกำหนดขนาดตัวอย่างที่ต้องการสำหรับข้อมูลที่กำหนด ข้อผิดพลาดเล็กน้อยค่าเฉลี่ย
การนำเสนอเพิ่มเมื่อ 16/03/2014
รูปแบบ ประเภท และวิธีการสังเกตทางสถิติ ประเภทการจัดกลุ่ม ช่วงเวลา และความถี่ โครงสร้างของซีรีย์ไดนามิก ค่าสถิติสัมบูรณ์และค่าสัมพัทธ์ การนำเสนอตัวอย่างในรูปแบบชุดสถิติ การประมาณค่าจุดและช่วงเวลา
หลักสูตรการบรรยาย เพิ่มเมื่อ 29/11/2556
การสร้างอนุกรมความแปรผันตามช่วงเวลาตามตัวบ่งชี้ การคำนวณค่าเฉลี่ยเลขคณิต โหมด และค่ามัธยฐาน สัมพัทธ์และ ตัวชี้วัดที่แน่นอนรูปแบบต่างๆ การกำหนดลักษณะเชิงปริมาณของการแจกแจง การสร้างฟังก์ชันเชิงประจักษ์
งานหลักสูตรเพิ่มเมื่อวันที่ 11/01/2555
แผนภาพกระจายเป็นจุดบนระนาบซึ่งมีพิกัดสอดคล้องกับค่าของตัวแปรสุ่ม X และ Y ลำดับของโครงสร้างและวัตถุประสงค์ การหาค่าสัมประสิทธิ์และสร้างกราฟการประมาณเชิงเส้นและกราฟการประมาณกำลังสอง
งานหลักสูตร เพิ่มเมื่อ 05/03/2011
การสั่งตัวอย่างเบื้องต้นของเวลาถึงความล้มเหลว การทดสอบสมมติฐานทางสถิติของการโต้ตอบ การกระจายแบบเอ็กซ์โปเนนเชียลและการกระจายพันธุ์ไวบูล การประมาณค่าพารามิเตอร์การกระจายและตัวบ่งชี้ความน่าเชื่อถือ วิธีการและเทคนิคหลัก
งานหลักสูตรเพิ่มเมื่อ 22/01/2555
แนวคิดเรื่องอนุกรมความแปรผัน การกระจายตัวทางสถิติ ฟังก์ชันเชิงประจักษ์และคุณลักษณะหลักของความคาดหวังทางคณิตศาสตร์ของความแปรปรวนตัวอย่าง การประมาณจุดและช่วงเวลาของการแจกแจง ทฤษฎีสมมติฐานนั้นคล้ายคลึงกับทฤษฎีช่วงความเชื่อมั่น