ระเบียบวิธีในการจัดกลุ่มข้อมูลทางสถิติ การจัดกลุ่มรอง
การส่งผลงานที่ดีของคุณไปยังฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง
นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง
โพสต์เมื่อ http://www.allbest.ru/
สถาบันมอสโกตั้งชื่อตาม ส.ยู. วิตต์
คณะเศรษฐศาสตร์
ทดสอบ
งานเสร็จแล้ว:
นักศึกษาชั้นปีที่ 1
การเรียนรู้ทางไกล
Vislyaeva M.N.
มอสโก
เมื่อดำเนินการ งานควบคุมคุณต้องทำการจัดเรียงใหม่เพื่อไม่ให้ ตัวอย่างที่ซับซ้อน(เลือกตัวอย่างด้วยตัวคุณเอง) และอธิบายว่าการคำนวณใหม่ดังกล่าวถูกต้องอย่างไรและภายใต้เงื่อนไขใด เมื่อใช้โปรแกรมคอมพิวเตอร์และตัวอย่างที่ซับซ้อนมากขึ้น ให้ระบุถึงผลกระทบและคุณสมบัติของการใช้งานไอทีด้วย
ในการตอบกลับเป็นลายลักษณ์อักษรของคุณต่องาน คุณต้อง:
1. อธิบายความเชื่อมโยงระหว่างสูตรบวกความแปรปรวนกับความสัมพันธ์สหสัมพันธ์ อธิบายความหมายทางสถิติ
2. เปรียบเทียบความแปรผันของการแจกแจงสองแบบด้วยค่าเฉลี่ยที่ต่างกัน อธิบายเงื่อนไขของการเปรียบเทียบได้เมื่อค่าเฉลี่ยแตกต่างกัน
3. ให้คำอธิบายที่สมบูรณ์ที่สุดเกี่ยวกับความหมายของข้อผิดพลาดส่วนเพิ่ม เชื่อมโยงกับแนวคิดเรื่องตัวแทนของกลุ่มตัวอย่างและปริมาตรที่ต้องการ
4. อธิบายความสัมพันธ์ระหว่างการประมาณค่าพารามิเตอร์ที่ไม่รู้จักโดยใช้ OLS และการตรวจสอบนัยสำคัญของผลลัพธ์ที่ได้รับโดยใช้เกณฑ์ในการทดสอบสมมติฐานทางสถิติ
การจัดกลุ่มสถิติที่จัดกลุ่มไว้ก่อนหน้านี้ใหม่เรียกว่าการจัดกลุ่มรอง วิธีการนี้ใช้ในกรณีที่ลักษณะของการกระจายตัวของประชากรที่กำลังศึกษาไม่ชัดเจนอันเป็นผลมาจากการจัดกลุ่มครั้งแรก
ในกรณีนี้ ช่วงเวลาจะขยายหรือลดลง การจัดกลุ่มรองยังใช้เพื่อนำการจัดกลุ่มตามช่วงเวลาที่ต่างกันมาเป็นรูปแบบที่เปรียบเทียบได้เพื่อจุดประสงค์ในการเปรียบเทียบ ลองดูเทคนิคการจัดกลุ่มรองโดยใช้ตัวอย่าง
ขยายช่วงเวลาตามข้อมูลในตารางที่ 1:
ตารางที่ 1
จำนวนร้านค้า |
|||
การจัดกลุ่มข้างต้นยังไม่ชัดเจนเพียงพอ เนื่องจากไม่ได้แสดงรูปแบบการเปลี่ยนแปลงมูลค่าการซื้อขายตามกลุ่มที่ชัดเจนและเข้มงวด
ให้เรากระชับแถวการแจกแจงโดยแบ่งเป็นหกกลุ่ม กลุ่มใหม่จะถูกสร้างขึ้นโดยการรวมกลุ่มเดิม (ตารางที่ 2)
ตารางที่ 2
กลุ่มร้านค้าตามมูลค่าการซื้อขายในไตรมาสที่สี่พันรูเบิล |
จำนวนร้านค้า |
มูลค่าการซื้อขายในไตรมาสที่สี่พันรูเบิล |
มูลค่าการซื้อขายเฉลี่ยต่อร้าน พันรูเบิล |
|
เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งร้านค้ามีขนาดใหญ่เท่าใด ระดับการหมุนเวียนก็จะยิ่งสูงขึ้นเท่านั้น
1. จากการจัดกลุ่มเชิงวิเคราะห์ ความสัมพันธ์สามารถวัดได้โดยใช้ความสัมพันธ์เชิงประจักษ์ ตัวบ่งชี้นี้แสดงไว้ อักษรกรีก z (นี่) ขึ้นอยู่กับกฎการสลายตัวของความแปรปรวน ซึ่งความแปรปรวนรวม s2 เท่ากับผลรวมของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม
การกระจายตัวของคุณลักษณะที่มีประสิทธิผลภายในกลุ่มที่มีความคงที่สัมพัทธ์ของคุณลักษณะของปัจจัยนั้นเกิดขึ้นเนื่องจากปัจจัยอื่นๆ ความแปรปรวนนี้เรียกว่าค่าคงเหลือ ถูกกำหนดโดยสูตร:
โดยที่ y ij คือค่าของคุณลักษณะ y สำหรับ หน่วยที่ iในกลุ่ม j;
J คือค่าเฉลี่ยของลักษณะในกลุ่มที่ j
nj - หมายเลข หน่วย jthกลุ่ม;
j = 1, 2, 3, ... เช่น
ความแปรปรวนภายในกลุ่มที่คำนวณสำหรับแต่ละกลุ่มจะรวมกันเข้ากับค่าเฉลี่ยความแปรปรวนภายในกลุ่ม:
ความแปรปรวนระหว่างกลุ่มเป็นผลมาจากปัจจัยที่กำลังศึกษา (และปัจจัยที่เกี่ยวข้อง) ดังนั้นจึงเรียกว่าความแปรปรวนของปัจจัย มันถูกกำหนดโดยสูตร
กฎสำหรับการบวกผลต่างสามารถเขียนได้:
อัตราส่วนสหสัมพันธ์เชิงประจักษ์วัดความแปรปรวนทั้งหมดในคุณลักษณะผลลัพธ์ที่เกิดจากปัจจัยที่กำลังศึกษา ดังนั้นจึงคำนวณเป็นอัตราส่วนของความแปรปรวนของปัจจัยต่อความแปรปรวนรวมของคุณลักษณะผลลัพธ์:
ตัวบ่งชี้นี้รับค่าในช่วง: ยิ่งใกล้ 1 การเชื่อมต่อยิ่งใกล้มากขึ้น และในทางกลับกัน
ตารางที่ 3. ข้อมูลเริ่มต้น
ตารางที่ 4. แผ่นงาน
มูลค่าการซื้อขายเฉลี่ย = ?X*f / f= 17370/51 = 340.58 พันรูเบิล
ความแปรปรวนคือ:
G2 =? f*(X-Xav) 2 / ? ฉ = 38682.36/51 = 758.48
ส่วนเบี่ยงเบนมาตรฐาน:
ค่าสัมประสิทธิ์ของการแปรผันคือ:
วี = G / Xavg = 27.54/758.48 = 0.081; 8.1%
ค่าสัมประสิทธิ์การเปลี่ยนแปลงน้อยกว่า 33% ดังนั้นประชากรจึงเป็นเนื้อเดียวกัน
ตารางที่ 5. ข้อมูลเริ่มต้น
1) เวลาเฉลี่ยที่ใช้ในการเดินทางไปยังสถานที่ทำงานของคนงาน = X av =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41.8 นาที
2) การคำนวณผลต่าง
ความแปรปรวนคือ:
G2 =? ส่วนเบี่ยงเบนฉ:
3) ค่าสัมประสิทธิ์*(X-Xaver) 2 / ? ฉ = 43160.8/420 = 102.8
การแปรผันกำลังสองเฉลี่ยเท่ากับ:
วี = G / Xavg = 10.14/41.8 = 0.24; 24%
ค่าสัมประสิทธิ์ของการแปรผันน้อยกว่า 33% ดังนั้นประชากรที่พิจารณาว่าเป็นเนื้อเดียวกันและค่าเฉลี่ยของความแปรปรวนนั้นค่อนข้างปกติ
ประชากรตัวอย่างสามารถเกิดขึ้นได้จากลักษณะเชิงปริมาณของค่าทางสถิติ เช่นเดียวกับลักษณะทางเลือกหรือลักษณะเฉพาะ ในกรณีแรก ลักษณะทั่วไปของกลุ่มตัวอย่างคือค่าเฉลี่ยของกลุ่มตัวอย่าง ซึ่งแสดงด้วยสัญลักษณ์ และในกรณีที่สอง สัดส่วนของตัวอย่างจะแสดงด้วยสัญลักษณ์ w ในประชากรทั่วไป ตามลำดับ: ค่าเฉลี่ยทั่วไป และส่วนแบ่งทั่วไปของ p
ความแตกต่าง -- และ W -- p เรียกว่าข้อผิดพลาดในการสุ่มตัวอย่าง ซึ่งแบ่งออกเป็นข้อผิดพลาดในการลงทะเบียนและข้อผิดพลาดในการเป็นตัวแทน ส่วนแรกของข้อผิดพลาดในการสุ่มตัวอย่างเกิดขึ้นเนื่องจากข้อมูลที่ไม่ถูกต้องหรือไม่ถูกต้องเนื่องจากขาดความเข้าใจในสาระสำคัญของปัญหาการไม่เอาใจใส่ของนายทะเบียนเมื่อกรอกแบบสอบถามแบบฟอร์ม ฯลฯ มันค่อนข้างง่ายที่จะตรวจจับและกำจัด ส่วนที่สองของข้อผิดพลาดเกิดขึ้นจากความล้มเหลวอย่างต่อเนื่องหรือเกิดขึ้นเองในการปฏิบัติตามหลักการเลือกแบบสุ่ม ตรวจจับและกำจัดได้ยาก มีขนาดใหญ่กว่าอันแรกมาก ดังนั้นจึงให้ความสำคัญกับมันเป็นหลัก
พิเศษเฉพาะ บทบาทที่สำคัญเพื่อเป็นเหตุผลและการประยุกต์ใช้ การสังเกตตัวอย่างกฎแห่งจำนวนมากมายเกิดขึ้น การใช้กฎจำนวนมากคือภายใต้เงื่อนไขบางประการและมีการสังเกตในปริมาณมากพอสมควร ลักษณะสรุปที่ได้รับจากการสังเกตตัวอย่างจะแตกต่างเล็กน้อยจากลักษณะที่สอดคล้องกันของหนังสือมอบอำนาจทั่วไป จากสิ่งนี้ จึงเป็นไปได้โดยการเพิ่มขนาดของประชากรตัวอย่าง เพื่อลดขีดจำกัดของข้อผิดพลาดที่เป็นไปได้ของการเป็นตัวแทน โดยนำพวกเขาไปสู่ ขนาดที่เล็กที่สุด- ในทางกลับกัน เมื่อทราบขีดจำกัดของข้อผิดพลาดในการเป็นตัวแทนแล้ว จึงสามารถกำหนดขนาดที่ต้องการของประชากรตัวอย่างได้
งานที่สำคัญและมีความรับผิดชอบที่สุดประการหนึ่งในการจัดระเบียบและดำเนินการสังเกตตัวอย่างคือการกำหนดขนาดที่ต้องการของประชากรตัวอย่าง เช่น ตัวเลขดังกล่าวจะทำให้ได้รับข้อมูลที่สะท้อนคุณสมบัติที่ศึกษาของประชากรทั่วไปได้อย่างถูกต้องเพียงพอ
ในกรณีนี้จะต้องคำนึงถึงสิ่งต่อไปนี้: 1) ควรได้รับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดด้วยความแม่นยำระดับใด 2) ความน่าจะเป็นที่จะรับประกันความถูกต้องตามเงื่อนไขของผลลัพธ์ของการสังเกตตัวอย่างควรเป็นอย่างไร 3) ระดับความผันผวนของคุณสมบัติที่ศึกษาในประชากรที่ศึกษา
ซึ่งหมายความว่าขนาดตัวอย่างที่ต้องการจะถูกตั้งค่าโดยขึ้นอยู่กับขนาดของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ค่าของสัมประสิทธิ์ความเชื่อมั่น (t) และขนาดของความแปรปรวน
วิธีการประมาณค่าพารามิเตอร์ การถดถอยเชิงเส้นซึ่งจะลดผลรวมของการเบี่ยงเบนกำลังสองของการสังเกตตัวแปรตามจากฟังก์ชันเชิงเส้นที่ต้องการให้เหลือน้อยที่สุด เรียกว่าวิธีกำลังสองน้อยที่สุด
สาระสำคัญของวิธีการนี้คือเกณฑ์สำหรับคุณภาพของโซลูชันที่พิจารณาคือผลรวมของข้อผิดพลาดกำลังสองซึ่งพวกเขาพยายามลดให้เหลือน้อยที่สุด หากต้องการใช้วิธีนี้จำเป็นต้องดำเนินการให้มากที่สุด จำนวนที่มากขึ้นการวัดตัวแปรสุ่มที่ไม่รู้จัก (ยิ่งมาก ความแม่นยำของโซลูชันก็จะยิ่งสูงขึ้น) และชุดของโซลูชันโดยประมาณบางชุดที่ต้องเลือกโซลูชันที่ดีที่สุด ถ้าชุดของโซลูชันถูกกำหนดเป็นพารามิเตอร์ เราจำเป็นต้องค้นหาค่าที่เหมาะสมที่สุดของพารามิเตอร์
LSM ใช้ในคณิตศาสตร์ โดยเฉพาะในทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ วิธีนี้ใช้กันอย่างแพร่หลายในการกรองปัญหาเมื่อจำเป็นต้องแยกสัญญาณที่เป็นประโยชน์ออกจากสัญญาณรบกวนที่ซ้อนทับอยู่ นอกจากนี้ยังใช้ในการวิเคราะห์ทางคณิตศาสตร์เพื่อเป็นตัวแทนโดยประมาณ ฟังก์ชันที่กำหนดฟังก์ชั่นที่เรียบง่ายยิ่งขึ้น การประยุกต์ใช้กำลังสองน้อยที่สุดอีกประการหนึ่งคือการแก้ระบบสมการที่ไม่ทราบจำนวนน้อยกว่าจำนวนสมการ
ขั้นตอนการทดสอบสมมติฐานทางสถิติ:
การกำหนดสมมติฐานหลัก H 0 และสมมติฐานที่แข่งขันกัน H 1 . สมมติฐานจะต้องถูกทำให้เป็นทางการอย่างชัดเจนในแง่คณิตศาสตร์
การกำหนดความน่าจะเป็น ข เรียกว่าระดับนัยสำคัญและสอดคล้องกับข้อผิดพลาดประเภทแรกซึ่งจะมีข้อสรุปเกี่ยวกับความจริงของสมมติฐานในอนาคต
การคำนวณเกณฑ์สถิติμเป็นดังนี้:
ค่าของมันขึ้นอยู่กับตัวอย่างดั้งเดิม
ขึ้นอยู่กับคุณค่าของมันเราสามารถสรุปเกี่ยวกับความจริงของสมมติฐาน H 0 ;
สถิตินั้นจะต้องเป็นไปตามกฎหมายการกระจายที่ทราบบางประการเพราะว่า q นั้นสุ่มมาจากความบังเอิญ
การก่อสร้างพื้นที่วิกฤต จากช่วงของค่า μ จะมีการระบุชุดย่อยของค่าดังกล่าวตามที่สามารถตัดสินความแตกต่างที่มีนัยสำคัญกับสมมติฐานได้ ขนาดของมันถูกเลือกในลักษณะที่พึงพอใจอย่างเท่าเทียมกัน ชุดนี้เรียกว่าบริเวณวิกฤต
บทสรุปเกี่ยวกับความจริงของสมมติฐาน ค่าตัวอย่างที่สังเกตได้จะถูกแทนที่ในสถิติ q และขึ้นอยู่กับว่าค่าเหล่านี้ตก (หรือไม่ตก) ในบริเวณวิกฤต จึงมีการตัดสินใจที่จะปฏิเสธ (หรือยอมรับ) สมมติฐานที่หยิบยกขึ้นมา H0
การแปรผันสหสัมพันธ์การกระจายตัว
โพสต์บน Allbest.ru
...เอกสารที่คล้ายกัน
ตารางค่าตัวอย่างของตัวแปรสุ่มแบบไม่ต่อเนื่องในรูปแบบเรียงลำดับ ตารางช่วงสถิติชุดความถี่สัมพัทธ์ การระบุฟังก์ชันการแจกแจงเชิงประจักษ์และการลงจุด รูปหลายเหลี่ยมและการแจกแจงตัวแปรสุ่ม
งานภาคปฏิบัติ เพิ่มเมื่อ 26/07/2555
ลักษณะเชิงตัวเลขสำหรับการแจกแจงทางสถิติ การสร้างอนุกรมการแปรผันตามช่วงเวลา รูปหลายเหลี่ยมความถี่ กราฟของฟังก์ชันการแจกแจงตัวอย่าง และการหาค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างด้วยสองวิธี
การนำเสนอเพิ่มเมื่อ 11/01/2013
ค่าเฉลี่ยของตัวบ่งชี้ (ค่าเฉลี่ยเลขคณิต) ตัวชี้วัดการเปลี่ยนแปลง - ช่วงของการแปรผัน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว ค่าสัมประสิทธิ์ของการแปรผัน สูงสุดและ ค่าต่ำสุดตัวบ่งชี้ทางสถิติ
ทดสอบเพิ่มเมื่อ 11/14/2551
แนวคิดเรื่องประชากรทั่วไป ความคาดหวังทางคณิตศาสตร์ และการกระจายตัว รับรองความสุ่มและความเป็นตัวแทนของกลุ่มตัวอย่างในการวางแผนทางสถิติ อนุกรมการแปรผันแบบไม่ต่อเนื่องและแบบช่วง การประมาณค่าจุดของพารามิเตอร์การกระจายตัวแบบคุณลักษณะ
บทคัดย่อเพิ่มเมื่อ 13/06/2554
สาระสำคัญของการวิจัยสุ่มตัวอย่าง วิธีการเลือกหน่วยใน ประชากรตัวอย่าง- ค่าเฉลี่ยและความคลาดเคลื่อนส่วนเพิ่มสำหรับการวัดค่าเฉลี่ยและสัดส่วน การกำหนดขนาดตัวอย่างที่ต้องการสำหรับค่าความผิดพลาดสูงสุดของค่าเฉลี่ยที่กำหนด
การนำเสนอเพิ่มเมื่อ 16/03/2014
รูปแบบ ประเภท และวิธีการสังเกตทางสถิติ ประเภทการจัดกลุ่ม ช่วงเวลา และความถี่ โครงสร้างของซีรีย์ไดนามิก ค่าสถิติสัมบูรณ์และค่าสัมพัทธ์ การนำเสนอตัวอย่างในรูปแบบชุดสถิติ การประมาณค่าจุดและช่วงเวลา
หลักสูตรการบรรยาย เพิ่มเมื่อ 29/11/2556
การสร้างอนุกรมความแปรผันตามช่วงเวลาตามตัวบ่งชี้ การคำนวณค่าเฉลี่ยเลขคณิต โหมด และค่ามัธยฐาน สัมพัทธ์และ ตัวชี้วัดที่แน่นอนรูปแบบต่างๆ การกำหนดลักษณะเชิงปริมาณของการแจกแจง การสร้างฟังก์ชันเชิงประจักษ์
งานหลักสูตรเพิ่มเมื่อวันที่ 11/01/2555
แผนภาพกระจายเป็นจุดบนระนาบซึ่งมีพิกัดสอดคล้องกับค่าของตัวแปรสุ่ม X และ Y ลำดับของโครงสร้างและวัตถุประสงค์ การหาค่าสัมประสิทธิ์และสร้างกราฟการประมาณเชิงเส้นและกราฟการประมาณกำลังสอง
งานหลักสูตร เพิ่มเมื่อ 05/03/2011
การสั่งตัวอย่างเบื้องต้นของเวลาถึงความล้มเหลว การทดสอบสมมติฐานทางสถิติของการโต้ตอบ การกระจายแบบเอ็กซ์โปเนนเชียลและการกระจายพันธุ์ไวบูล การประมาณค่าพารามิเตอร์การกระจายและตัวบ่งชี้ความน่าเชื่อถือ วิธีการและเทคนิคหลัก
งานหลักสูตรเพิ่มเมื่อ 22/01/2555
แนวคิดเรื่องอนุกรมความแปรผัน การกระจายตัวทางสถิติ ฟังก์ชันเชิงประจักษ์และคุณลักษณะหลักของความคาดหวังทางคณิตศาสตร์ของความแปรปรวนตัวอย่าง การประมาณจุดและช่วงเวลาของการแจกแจง ทฤษฎีสมมติฐานมีความคล้ายคลึงกับทฤษฎีช่วงความเชื่อมั่น
เมื่อวิเคราะห์และเปรียบเทียบกลุ่มต่างๆ เช่น ในเวิร์กช็อป องค์กร ฯลฯ หลายแห่ง สถานการณ์อาจเกิดขึ้นเมื่อกลุ่มเดิมไม่สามารถเปรียบเทียบได้เนื่องจากมีจำนวนกลุ่มต่างกันหรือมีขนาดช่วงเวลาต่างกัน เพื่อนำการจัดกลุ่มดังกล่าวมาอยู่ในรูปแบบที่เทียบเคียงได้คือ ใช้วิธีการจัดกลุ่มรองโดยใช้วิธีการจัดกลุ่มรอง วิธีการจัดกลุ่มรอง เป็นวิธีการสร้างกลุ่มใหม่ตามกลุ่มที่มีอยู่ตามข้อกำหนดที่กำหนดในการดำเนินการจัดกลุ่มรอง มีการใช้ 2 วิธี: 1) รวมกลุ่มดั้งเดิม 2) การจัดกลุ่มใหม่แบบเศษส่วน
การนำกลุ่มที่แตกต่างกันหลายกลุ่มมาอยู่ในรูปแบบที่เทียบเคียงได้จะดำเนินการในสามขั้นตอน ในระยะแรก การจัดกลุ่มเริ่มแรกจะได้รับการวิเคราะห์เพื่อระบุเงื่อนไขของความไม่มีใครเทียบได้ของการจัดกลุ่มดั้งเดิม ในขั้นตอนที่สอง จะมีการเลือกวิธีการเพื่อนำการจัดกลุ่มดั้งเดิมมาอยู่ในรูปแบบที่เทียบเคียงได้ ในขั้นตอนที่สาม จะมีการจัดเรียงการจัดกลุ่มเริ่มต้นใหม่และการวิเคราะห์ผลลัพธ์ที่ได้รับอีกครั้ง หากจำเป็นให้ดำเนินการจัดกลุ่มใหม่ พิจารณาวิธีการจัดเรียงรองใหม่
1 วิธีการสังเกตทางสถิติเกี่ยวกับการกระจายตัวของคนงานในองค์กรตามระยะเวลาการทำงานในปี 2543 ให้ผลลัพธ์ดังต่อไปนี้ (ตารางที่ 2.7)
ตารางที่ 2.7
ในปี พ.ศ. 2545 ได้มีการสังเกตทางสถิติซ้ำแล้วซ้ำอีก ซึ่งให้ผลลัพธ์ดังต่อไปนี้ (ตารางที่ 2.8) ไม่สามารถประเมินการเปลี่ยนแปลงการกระจายตัวของคนงานตามระยะเวลาการทำงานมากกว่า 2 ปีได้โดยตรงจากข้อมูลในทั้งสองตาราง การวิเคราะห์ทั้งสองตารางแสดงให้เห็นว่าไม่สอดคล้องกันเนื่องจากจำนวนกลุ่มและขนาดช่วงเวลาต่างกัน
ตารางที่ 2.8
หากต้องการนำข้อมูลจากทั้งสองตารางมาอยู่ในรูปแบบที่เทียบเคียงได้ คุณสามารถรวมทั้งกลุ่ม 1 และ 2 และกลุ่ม 3 และ 4 ในตาราง 2.7 ได้ สิ่งนี้จะทำให้สามารถประเมินการเปลี่ยนแปลงในการกระจายตัวของคนงานตามระยะเวลาการทำงานที่เกิดขึ้นในองค์กรในช่วงสองปี ผลลัพธ์ของการจัดกลุ่มข้อมูลการสังเกตทางสถิติใหม่สำหรับปี 2000 (ตารางที่ 2.7) แสดงไว้ในตารางที่ 2.9
ตารางที่ 2.9
เมื่อเปรียบเทียบข้อมูลสำหรับปี 2545 (ตาราง 2.8) กับข้อมูลที่จัดกลุ่มใหม่สำหรับปี 2543 (ตาราง 2.9) เราสามารถสรุปได้: ในสองปีจำนวนคนงานที่มีประสบการณ์สูงสุด 6 ปีลดลงเช่น อายุน้อยและจำนวนคนทำงานที่มีประสบการณ์เพิ่มมากขึ้น
วิธีที่ 2ให้การสังเกตทางสถิติในปี พ.ศ. 2545 ให้ผลลัพธ์ดังนี้ (ตารางที่ 2.10) เมื่อเปรียบเทียบข้อมูลสำหรับปี 2000 (ตาราง 2.9) และข้อมูลสำหรับปี 2002 (ตาราง 2.7) เราสามารถสรุปได้ว่าข้อมูลเหล่านี้เข้ากันไม่ได้เนื่องจากจำนวนกลุ่มต่างกันและขนาดช่วงเวลาต่างกัน การวิเคราะห์แสดงให้เห็นว่าการใช้วิธีเดียวในการนำข้อมูลมาสู่รูปแบบที่เทียบเคียงนั้นเป็นไปไม่ได้ ดังนั้นเราจึงใช้วิธีที่ 2 จัดกลุ่มข้อมูลปี 2543 ใหม่ (ตาราง 2.7) เพื่อให้สอดคล้องกับการจัดกลุ่มข้อมูลปี 2545 (ตาราง 2.10)
ตารางที่ 2.10
การใช้วิธีที่สองถือว่าการกระจายความถี่สม่ำเสมอภายในแต่ละกลุ่ม นี่เป็นข้อกำหนดเบื้องต้นสำหรับการใช้วิธีการที่สอง หากต้องการจัดกลุ่มข้อมูลใหม่สำหรับปี 2000 (ตาราง 2.7) เราจะทำการคำนวณดังต่อไปนี้ ดังนั้นกลุ่มแรกใหม่ (1-4) (ตาราง 2.10) จะรวมข้อมูลทั้งหมดจากกลุ่มแรกเก่า (1-3) (ตาราง 22.7) และข้อมูลจำนวนคนงานที่มีประสบการณ์ 4 ปีจากกลุ่มที่สองเก่า . จำนวนคนงานที่มีประสบการณ์ 4 ปีคือ 3 (9/3=3 เนื่องจากมีคนงาน 9 คนในกลุ่มที่สองแบบเก่า และช่วงเวลาคือ 3) ดังนั้น กลุ่มแรกใหม่ (1-4) จะรวมคนงาน 18 คน (18=15+3) กลุ่มใหม่ที่สอง (5-8) จะรวมคนงาน 6 คน มีประสบการณ์ 5, 6 ปี (จากกลุ่มที่สองเก่า 6= 9/ 3·2) และคนงาน 18 คนที่มีประสบการณ์ 7, 8 ปี (จากกลุ่มที่สามเก่า 18=27/3·2) ดังนั้นกลุ่มที่สองใหม่ (5-8) จะรวมคนงาน 24 คน (24=6+ 18) กลุ่มที่สามใหม่ (9-12) จะรวมคนงานที่มีประสบการณ์ 9 ปี (9=27/3) และพนักงานทั้งหมด 9 คนจากกลุ่มที่สี่เก่า (10-12) ดังนั้นในกลุ่มที่สามใหม่ (9-12) จะมีคนงาน 18 คน (18=9+9) เราจะรวมข้อมูลที่จัดกลุ่มใหม่สำหรับปี 2000 และข้อมูลสำหรับปี 2002 ไว้ในตารางเดียว (2.11) ซึ่งจะช่วยให้สามารถวิเคราะห์เปรียบเทียบได้
ตารางที่ 2.11
การวิเคราะห์การกระจายตัวของคนงานในองค์กรตามระยะเวลาการทำงาน (ตาราง 2.11) แสดงให้เห็นว่าในปี 2545 จำนวนคนงานที่มีประสบการณ์มากกว่า (จาก 9 เป็น 12 ปี) เพิ่มขึ้น และผู้ที่มีประสบการณ์น้อยกว่า (จาก 1 เป็น 8 ปี) ลดลง ดังนั้น การจัดกลุ่มข้อมูลใหม่ทำให้สามารถนำข้อมูลมาอยู่ในรูปแบบที่เปรียบเทียบได้ ดำเนินการวิเคราะห์ และสรุปผลที่จำเป็นได้
คำถามเพื่อความปลอดภัยและงานต่างๆ
1.การสังเกตทางสถิติคืออะไร? ต้องปฏิบัติตามเงื่อนไขใดบ้างเมื่อดำเนินการสังเกตทางสถิติ (ดูคำจำกัดความ)
2. การสังเกตทางสถิติสามารถจำแนกตามเกณฑ์ใด? ยกตัวอย่างการสังเกตทางสถิติ
3. มีข้อผิดพลาดอะไรบ้างที่เกิดขึ้นเมื่อทำการสังเกตทางสถิติ และวิธีการควบคุมที่สามารถใช้ได้?
4. พิจารณาว่าตัวอย่างใดมีการสรุปอย่างง่าย และตัวอย่างใดที่มีการสรุปที่ซับซ้อน ตัวอย่างที่ 1 ในวันจันทร์ คนงาน 200 คนทำงานในโรงทอผ้า ตัวอย่างที่ 2 ในวันจันทร์ คนงานหญิง 40 คนทำงานในโรงทอผ้าที่ไซต์งานหมายเลข 1 คนงานหญิง 60 คนในไซต์หมายเลข 2 และคนงานหญิงทั้งหมด 100 คนทำงาน
5. การจัดกลุ่มใดที่ใช้ในการประมวลผลข้อมูลทางสถิติ? พวกเขาแตกต่างกันอย่างไร?
6. หัวหน้าฝ่ายเทคโนโลยีมีพนักงาน 15 คน และฝ่ายการตลาดและการขายมีพนักงาน 10 คน ในกรณีใดทีมงานแผนกเป็นประชากรเนื้อเดียวกัน และในกรณีใดบ้างที่พวกเขาเป็นประชากรต่างกัน
7. ยอดขายรายวันของรายการผ้า A ในร้านผ้าในเดือนตุลาคมมีลักษณะเป็นข้อมูลต่อไปนี้ (เป็นเมตร): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9 , 5, 10 , 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. จัดกลุ่มข้อมูลโดยใช้ช่วงเวลาที่เท่ากัน
8. จัดกลุ่มผลลัพธ์ของการจัดกลุ่มข้อมูลจากจุดที่ 7 ใหม่เป็นกลุ่มต่อไปนี้: (3-9), (9-15), 15-21)
หัวข้อที่ 3 ชุดการกระจายทางสถิติ ตาราง กราฟิก
3.1 ชุดการแจกแจงทางสถิติ - แนวคิด ประเภท รูปแบบการนำเสนอ
รูปแบบหนึ่งของการนำเสนอข้อมูลการสังเกตทางสถิติคือชุดการแจกแจงทางสถิติ อนุกรมทางสถิติ การกระจายคือการจัดเรียงหน่วยประชากรออกเป็นกลุ่มตามลักษณะการจัดกลุ่มตามลำดับด้วยความช่วยเหลือของชุดการแจกแจงทางสถิติ คุณสามารถศึกษาโครงสร้างและขอบเขตของการเปลี่ยนแปลงประชากร ประเมินความเป็นเนื้อเดียวกัน และกำหนดรูปแบบการพัฒนาหน่วยประชากรได้ โดยรูปลักษณ์ภายนอก ชุดสถิติการแจกแจงแบ่งออกเป็นคุณลักษณะ รูปแบบ และอนุกรมเวลา
อนุกรมที่แสดงที่มาและแปรผันประกอบด้วยสององค์ประกอบ: การแปรผันและความถี่ (ความถี่หรือความหนาแน่น) ตัวเลือก() – นี่คือค่าเฉพาะของแอตทริบิวต์ที่ใช้ในซีรีย์การแจกจ่าย ความถี่ () - นี้ จำนวนสัมบูรณ์แสดงจำนวนครั้ง (บ่อยแค่ไหน) ที่ค่าเฉพาะของคุณลักษณะ (ตัวแปร) เกิดขึ้นในประชากร หรือจำนวนหน่วยของประชากรที่มีค่าเฉพาะของคุณลักษณะ (ตัวแปร) ความถี่() – นี่คือค่าสัมพัทธ์ที่กำหนดส่วนแบ่งของตัวเลือกแต่ละรายการในปริมาณรวมของประชากร ()ความถี่สามารถแสดงเป็นเศษส่วนได้ ซึ่งในกรณีนี้ปริมาตรของประชากรจะเท่ากับหนึ่ง () หรือเป็นเปอร์เซ็นต์ ซึ่งในกรณีนี้ปริมาตรของประชากรจะเท่ากับ 100% () โดยทั่วไปจะมีการคำนวณความถี่ ดังต่อไปนี้
ปริมาณประชากรอยู่ที่ไหน
ความหนาแน่น() เป็นค่าสัมพัทธ์ที่แสดงจำนวนหน่วยของประชากร (ในรูปแบบสัมบูรณ์หรือสัมพัทธ์) ต่อความยาวหน่วยของช่วงกลุ่ม ()ความหนาแน่นอาจเป็นแบบสัมบูรณ์หรือแบบสัมพัทธ์ก็ได้ ความหนาแน่นสัมบูรณ์ เท่ากับ
ความหนาแน่นสัมพัทธ์เท่ากับ
เมื่อคำนวณความหนาแน่นสัมพัทธ์ จะใช้ความถี่โดยแสดงเป็นเศษส่วน
ซีรี่ส์ที่มีคุณลักษณะเป็นชุดที่สร้างขึ้นบนพื้นฐานของคุณลักษณะเชิงคุณภาพของประชากรซีรีส์เหล่านี้สร้างขึ้นโดยใช้การจัดกลุ่มประเภทและสามารถแสดงเป็นตารางได้ ตัวอย่างเช่นการกระจายตัวของผู้ปฏิบัติงานตามประเภทภาษี (ตารางที่ 3.1)
ตารางที่ 3.1
ในตัวอย่างที่ให้มา (ตารางที่ 3.1) จำนวนทั้งสิ้นคือคนงานทั้งหมดขององค์กร ขนาดประชากร 250 คน หน่วยประชากรคือคนงานหนึ่งคน หมวดหมู่ภาษีถูกเลือกเป็นลักษณะของหน่วยประชากร คุณลักษณะนี้มีความหมายเฉพาะหลายประการ - ตัวแปร (หมวดที่ 1, หมวดที่ 2, หมวดที่ 3, หมวดที่ 4, หมวดที่ 5) ในตาราง ค่าแอตทริบิวต์จะได้รับในคอลัมน์ 2 ค่าความถี่ในคอลัมน์ 3 และค่าความถี่ในคอลัมน์ 4
ซีรี่ส์รูปแบบต่างๆเป็นชุดที่สร้างขึ้นบนพื้นฐานของคุณลักษณะเชิงปริมาณของประชากรซีรีส์เหล่านี้สร้างขึ้นโดยใช้การจัดกลุ่มโครงสร้างเป็นหลัก และสามารถแสดงเป็นตารางได้ ซีรีย์รูปแบบมีสองประเภท: ซีรีย์รูปแบบแยกและซีรีย์ช่วง ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง – นี่คือชุดค่าของคุณลักษณะ (ตัวเลือก) ที่แสดงด้วยค่าที่ไม่ต่อเนื่อง. อนุกรมความแปรผันของช่วง – นี่คือชุดที่แสดงค่าของคุณลักษณะเป็นช่วงเวลา- อ้างอิงจากข้อมูลการหมุนเวียน 34 รายวัน ผู้ประกอบการแต่ละรายที่ให้ไว้ในหน้า เราจะสร้างรูปแบบต่างๆ ซีรีย์ช่วงเวลา(ตารางที่ 3.2)
ตารางที่ 3.2
คอลัมน์ที่ 3 แสดงความถี่ - จำนวนผู้ประกอบการที่ผลประกอบการหนึ่งวันอยู่ในช่วงที่กำหนด (คอลัมน์ที่ 2) คอลัมน์ 4 คำนวณความถี่เป็นเปอร์เซ็นต์โดยใช้สูตร 3.1 ดังนั้นความถี่ของกลุ่มแรก (3.1 – 3.9) จะเท่ากับ
ความถี่จะถูกคำนวณเช่นเดียวกันสำหรับกลุ่มอื่นๆ คอลัมน์ 5 แสดงความถี่ในการแชร์ สามารถรับได้โดยการคำนวณ
หรือโดยการแปลงเปอร์เซ็นต์เป็นหุ้น เมื่อทำการคำนวณต้องแสดงข้อมูลในรูปแบบทศนิยมด้วยความแม่นยำสูงสุด 3 ตำแหน่ง ซึ่งจะช่วยปรับปรุงความแม่นยำในการคำนวณและการผลิตข้อมูลขั้นสุดท้ายที่เหมาะสม ดังนั้นผลรวมของความถี่เป็นเปอร์เซ็นต์ควรเท่ากับ 100% และเป็นเศษส่วน – เท่ากับ 1
คอลัมน์ที่ 6 ของตาราง 3.2 แสดงค่าความหนาแน่นสัมบูรณ์ การคำนวณดำเนินการตามสูตร 3.2 ดังนั้นสำหรับกลุ่มแรก ความหนาแน่นสัมบูรณ์จะเท่ากับ
หากนำความถี่ () จากคอลัมน์ 3 ค่าของช่วงเวลา () จะถูกกำหนดให้เป็นความแตกต่างระหว่างขีดจำกัดบน (3.9) และขีดจำกัดล่าง (3.1) ของช่วงเวลาของกลุ่มแรก เช่น - ความหนาแน่นสัมบูรณ์สำหรับกลุ่มอื่นๆ จะคำนวณในลักษณะเดียวกัน หลังจากทำการคำนวณแล้วคุณจะต้องให้พวกเขา การตีความทางเศรษฐกิจ- ตัวอย่างเช่น ความหนาแน่นสัมบูรณ์ของกลุ่มแรกบ่งชี้ว่าทุกๆ พันรูเบิล มูลค่าการซื้อขายในกลุ่มแรกมีผู้ประกอบการ 5 ราย
คอลัมน์ที่ 7 ของตาราง 3.2 แสดงค่าความหนาแน่นสัมพัทธ์ การคำนวณดำเนินการตามสูตร 3.3 ดังนั้นกลุ่มแรกความหนาแน่นสัมพัทธ์จะเท่ากับ
ความหนาแน่นสัมพัทธ์ได้รับการคำนวณในลักษณะเดียวกันสำหรับกลุ่มอื่นๆ ความหนาแน่นสัมพัทธ์ของกลุ่มแรกแสดงให้เห็นว่าส่วนแบ่งของผู้ประกอบการที่มาต่อรายได้ทุกๆ พันรายในกลุ่มแรกคือ 0.147
คอลัมน์ที่ 2 ของตาราง 3.3 นำเสนอมูลค่าการซื้อขายในรูปแบบของช่วงเวลา และคอลัมน์ 3 นำเสนอมูลค่าการซื้อขายในรูปแบบของค่าที่ไม่ต่อเนื่อง สำหรับกลุ่มแรกจะมีการคำนวณค่าแยกดังนี้
มูลค่าการซื้อขายจะคำนวณในลักษณะเดียวกับมูลค่าแยกสำหรับกลุ่มอื่นๆ
บ่อยครั้งเมื่อวิเคราะห์ชุดการแปรผัน จำเป็นต้องเข้าใจการเปลี่ยนแปลงในปริมาณของประชากรเมื่อเปลี่ยนค่าของคุณลักษณะ (โดยส่วนใหญ่จะเรียงลำดับจากน้อยไปหามาก) เพื่อจุดประสงค์นี้ จะใช้แนวคิดต่างๆ เช่น ความถี่สะสมหรือความถี่สะสม ความถี่สะสม ( )– นี่คือผลรวมของความถี่ของอนุกรมแรกจนถึงและรวมถึงค่าหนึ่งของลักษณะเฉพาะด้วย ความถี่สะสม คือผลรวมของความถี่ตั้งแต่เริ่มต้นซีรีส์จนถึงค่าหนึ่งของแอตทริบิวต์ลองพิจารณาค้นหาค่าของตัวบ่งชี้เหล่านี้ตามข้อมูลในตาราง 3.4 ในคอลัมน์ที่ 6 ของตาราง 3.4 แสดงความถี่สะสม ในกลุ่มแรก (กลุ่มที่ 1) ผู้ประกอบการ 4 ราย (กลุ่มที่ 4) มีมูลค่าการซื้อขาย 3.1 ถึง 3.9 พันรูเบิล (คอลัมน์ 2) หรือมูลค่าการซื้อขายเฉลี่ย 3.5 พันรูเบิล (กรัม 3) เนื่องจากเป็นกลุ่มแรกความถี่สะสมคือ จำนวนผู้ประกอบการจะเท่ากับ 4 (คอลัมน์ 6) ในกลุ่มที่สองคือจำนวนผู้ประกอบการที่มีมูลค่าการซื้อขาย 3.9 ถึง 4.7 พันรูเบิล หรือมูลค่าการซื้อขายเฉลี่ย 4.3 พันรูเบิล เท่ากับ 5 คน ดังนั้นความถี่สะสมคือ จำนวนผู้ประกอบการที่มีมูลค่าการซื้อขาย 3.1 ถึง 4.7 พันรูเบิล หรือโดยเฉลี่ยจากและน้อยกว่า 4.3 พันรูเบิล จะเท่ากับ 9=4+5 กลุ่มที่ 3 ความถี่สะสมจะเป็น 16=4+5+7 เป็นต้น ความถี่สะสมจะคำนวณในลักษณะเดียวกัน
การจัดกลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับวัตถุที่แตกต่างกัน หรือในทางกลับกัน สำหรับวัตถุหนึ่ง แต่มากกว่าสอง ช่วงเวลาที่แตกต่างกันเวลาอาจกลายเป็นสิ่งที่หาที่เปรียบมิได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกันหรือความแตกต่างในขอบเขตของช่วงเวลา
การจัดกลุ่มรองหรือการจัดกลุ่มใหม่ของข้อมูลที่จัดกลุ่มถูกนำมาใช้ ลักษณะที่ดีขึ้นปรากฏการณ์ที่กำลังศึกษา (กรณีที่การจัดกลุ่มครั้งแรกไม่ระบุลักษณะการกระจายตัวของหน่วยประชากรอย่างชัดเจน) หรือนำการจัดกลุ่มมาเป็นประเภทที่เทียบเคียงกันเพื่อดำเนินการได้ การวิเคราะห์เปรียบเทียบ.
การจัดกลุ่มรองคือการดำเนินการเพื่อสร้างกลุ่มใหม่โดยยึดตามการจัดกลุ่มที่ดำเนินการก่อนหน้านี้
มีสองวิธีในการสร้างกลุ่มใหม่ วิธีแรก ง่ายที่สุดและพบบ่อยที่สุดคือการเปลี่ยน (โดยปกติจะขยาย) ช่วงเวลาเริ่มต้น วิธีที่สองเรียกว่าการจัดกลุ่มใหม่แบบเศษส่วนและประกอบด้วยการก่อตัวของกลุ่มใหม่โดยพิจารณาจากการกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม ให้เราอธิบายเทคนิคการจัดกลุ่มรองด้วยตัวอย่างต่อไปนี้
ตัวอย่าง:
การกระจายตัวของพนักงานบริษัทตามระดับรายได้
เราจะจัดกลุ่มข้อมูลใหม่โดยสร้างกลุ่มใหม่โดยมีช่วงเวลาสูงสุด 5, 5-10, 10-20, 20-30, มากกว่า 30,000 รูเบิล
กลุ่มใหม่กลุ่มแรกจะรวมพนักงานกลุ่มแรกทั้งหมดและส่วนหนึ่งของกลุ่มที่สอง หากต้องการสร้างกลุ่มมากถึง 5,000 รูเบิล คุณต้องรับ 1.0,000 รูเบิลจากช่วงเวลาของกลุ่มที่สอง ค่าของช่วงเวลาของกลุ่มนี้คือ 6.0 พันรูเบิล ดังนั้นจึงจำเป็นต้องแยกส่วนออกมา 1/6 (1.0:6.0) ส่วนที่คล้ายกันในกลุ่มแรกที่จัดตั้งขึ้นใหม่จะต้องนำมาจากจำนวนคนงานนั่นคือ
20x1 = 3 คน จากนั้นในกลุ่มแรกจะมีคนงาน: 16+3 = 19 คน
6
กลุ่มใหม่ที่สองก่อตั้งขึ้นโดยผู้ที่ทำงานในกลุ่มที่สองลบกลุ่มที่ได้รับมอบหมายให้เป็นกลุ่มแรกนั่นคือ 20-3 = 17 คน กลุ่มที่สามที่จัดตั้งขึ้นใหม่จะประกอบด้วยพนักงานทั้งหมดของกลุ่มที่สามและพนักงานบางส่วนในกลุ่มที่สี่ ในการกำหนดส่วนนี้จากช่วงเวลา 18-30 (ความกว้างของช่วงเวลาคือ 12) คุณต้องเพิ่ม 2.0 ไปยังส่วนก่อนหน้า (เพื่อให้ขีด จำกัด บนของช่วงเวลาเท่ากับ 2.0 พันรูเบิล) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเวลาส่วนหนึ่งเป็น กลุ่มนี้มี 74 คน ซึ่งหมายความว่าเราต้องเอา 74x(1:6) = 12 คน กลุ่มที่สามใหม่จะรวม 44+12 = 56 คน กลุ่มที่สี่ที่ตั้งขึ้นใหม่จะรวม 74-12 = 62 คนที่เหลืออยู่จากกลุ่มที่สี่ก่อนหน้า ที่ห้าอีกครั้ง กลุ่มการศึกษาจะเป็นคนงานที่ห้าและหกของกลุ่มก่อนหน้านี้: 37+9 = 46 คน
เป็นผลให้เราได้รับกลุ่มใหม่ดังต่อไปนี้:
ข้อมูลเพิ่มเติมในหัวข้อการเปรียบเทียบการจัดกลุ่มทางสถิติ การจัดกลุ่มรอง:
- 1.3. การสังเกตและสรุปทางสถิติ การจัดกลุ่มวัสดุการสังเกตทางสถิติ
- 10.2. การสังเกตทางสถิติและการบัญชีในองค์กรของอุตสาหกรรมต่างๆ ข้อมูลและความสามารถในการวิเคราะห์ของการรายงานทางสถิติ
กลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับวัตถุที่แตกต่างกัน หรือในทางกลับกัน สำหรับวัตถุหนึ่งชิ้น แต่ในช่วงเวลาที่แตกต่างกันสองช่วง อาจกลายเป็นสิ่งที่ไม่มีที่เปรียบได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกัน หรือขอบเขตของช่วงเวลาที่ไม่เท่ากัน .
การจัดกลุ่มทุติยภูมิหรือการจัดกลุ่มข้อมูลที่จัดกลุ่มใหม่ใช้เพื่อระบุลักษณะปรากฏการณ์ที่กำลังศึกษาได้ดีขึ้น (ในกรณีที่การจัดกลุ่มเริ่มแรกไม่ได้ระบุลักษณะของการกระจายตัวของหน่วยประชากรอย่างชัดเจน) หรือเพื่อจัดกลุ่มให้เป็นประเภทที่เทียบเคียงได้สำหรับ วัตถุประสงค์ของการวิเคราะห์เปรียบเทียบ
การจัดกลุ่มรอง- นี่คือการดำเนินการเพื่อจัดตั้งกลุ่มใหม่บนพื้นฐานของการจัดกลุ่มที่ดำเนินการก่อนหน้านี้
มีสองวิธีในการสร้างกลุ่มใหม่ วิธีแรกที่ง่ายที่สุดและพบบ่อยที่สุดคือ การเปลี่ยนแปลง (โดยปกติจะเป็นการขยาย) ของช่วงเวลาเริ่มต้น วิธีที่สองเรียกว่า แบ่งปันการจัดกลุ่มใหม่ ประกอบด้วยการก่อตัวของกลุ่มใหม่บนพื้นฐานของการกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม ให้เราอธิบายเทคนิคการจัดกลุ่มรองด้วยตัวอย่าง (ตาราง 3.14)
ตารางที่ 3.14. การกระจายตัวของรัฐวิสาหกิจ ขายปลีกหนึ่งในเมืองของภูมิภาคมอสโกโดยจำนวนพนักงานเฉลี่ยต่อปีในปี 2554*
* ข้อมูลมีเงื่อนไข
เราจะจัดกลุ่มข้อมูลใหม่ โดยสร้างกลุ่มใหม่ในช่วงเวลาสูงสุด 5, 5-10, 10-20, 20-30, 30 คนขึ้นไป
กลุ่มใหม่กลุ่มแรกจะรวมกลุ่มธุรกิจค้าปลีกกลุ่มแรกทั้งหมดและเป็นส่วนหนึ่งของกลุ่มที่สอง หากต้องการรวมกลุ่มไม่เกินห้าคน คุณจะต้องรับหนึ่งคนจากช่วงเวลาของกลุ่มที่สอง ขนาดของช่วงเวลาสำหรับกลุ่มนี้คือหกคน ดังนั้นจึงจำเป็นต้องเอา 1/6 ของมัน ส่วนที่คล้ายกันในกลุ่มแรกที่จัดตั้งขึ้นใหม่จะต้องนำมาจากจำนวนวิสาหกิจ ได้แก่ 20 -= 3 องค์กร 6
จากนั้นในกลุ่มวิสาหกิจการค้าปลีกกลุ่มแรกจะมี 16 + 3 = 19 หน่วย
กลุ่มใหม่ที่สองก่อตั้งขึ้นโดยวิสาหกิจการค้าปลีกของกลุ่มที่สองลบด้วยกลุ่มที่จัดเป็นกลุ่มแรกนั่นคือ 20 - 3 = 17 องค์กร กลุ่มที่สามที่ก่อตั้งขึ้นใหม่จะรวมถึงวิสาหกิจทั้งหมดของกลุ่มที่สามและเป็นส่วนหนึ่งของวิสาหกิจในกลุ่มที่สี่ ในการกำหนดส่วนนี้ของช่วงเวลา 18 30 (ความกว้างของช่วงเวลาคือ 12) คุณต้องเพิ่ม 2.0 ไปยังส่วนก่อนหน้า (เพื่อให้ขีดจำกัดบนของช่วงเวลาเท่ากับ 20 คน) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเป็น 2/12 = 1/6 กลุ่มนี้มี 74 วิสาหกิจ ซึ่งหมายความว่าเราต้องเลือก 74 (1/6) = 12 วิสาหกิจ กลุ่มที่สามใหม่จะรวม 44 + 12 = 56 องค์กร
กลุ่มที่สี่ที่จัดตั้งขึ้นใหม่จะรวม 74 - 12 = = 62 องค์กรที่เหลืออยู่จากกลุ่มที่สี่ก่อนหน้า กลุ่มที่ห้าที่จัดตั้งขึ้นใหม่จะประกอบด้วยวิสาหกิจการค้าปลีกของกลุ่มที่ห้าและหกก่อนหน้านี้: 37 + 9 = 46 วิสาหกิจ
เป็นผลให้เราได้กลุ่มใหม่ (ตาราง 3.15)
ตารางที่ 3.15. การกระจายตัวของวิสาหกิจการค้าปลีกในเมืองใดเมืองหนึ่งของภูมิภาคมอสโกตามจำนวนพนักงานเฉลี่ยต่อปีในปี 2554 หลังจากการจัดกลุ่มข้อมูลใหม่*
* ข้อมูลมีเงื่อนไข
ตารางสถิติ: สาระสำคัญ องค์ประกอบ และการจำแนกประเภท
ตารางสถิติเป็นรูปแบบการนำเสนอเนื้อหาทางสถิติที่มีเหตุผล มองเห็นได้ และกะทัดรัดที่สุด รวมถึงผลลัพธ์ การจัดกลุ่มทางสถิติ- อย่างไรก็ตาม ไม่ใช่ทุกตารางจะมีสถิติ ตารางสูตรคูณหรือแบบสอบถามเชิงสำรวจทางสังคมวิทยาอาจอยู่ในรูปแบบตาราง แต่ยังไม่ใช่ตารางทางสถิติ
ตารางสถิติเป็นตารางที่มีลักษณะตัวเลขสรุปของประชากรที่กำลังศึกษาตั้งแต่หนึ่งรายการขึ้นไป คุณสมบัติที่สำคัญเชื่อมโยงกันด้วยตรรกะของการวิเคราะห์ทางเศรษฐศาสตร์
องค์ประกอบหลักของตารางสถิติที่ประกอบเป็นโครงกระดูก (ฐาน) แสดงในแผนภาพ 3.1
แบบตารางเป็นรูปแบบการจัดเรียงข้อมูลตัวเลขโดยตัวเลขจะอยู่ที่จุดตัดของส่วนหัวที่กำหนดไว้อย่างชัดเจนตามแนวคอลัมน์แนวตั้งเรียกว่า นับ, และชื่อตามแถบแนวนอนที่สอดคล้องกัน - เส้น. ดังนั้น ภายนอกตารางจึงเป็นจุดตัดของกราฟและแถวที่ประกอบกันเป็นโครงกระดูกของตาราง
ตารางสถิติประกอบด้วยส่วนหัวสามประเภท: ทั่วไป ด้านบน และด้านข้าง ชื่อทั่วไป สะท้อนถึงเนื้อหาของตารางทั้งหมด (เกี่ยวข้องกับสถานที่และเวลา) ซึ่งอยู่เหนือเค้าโครงตารางตรงกลางและเป็นส่วนหัวภายนอก หัวเรื่องยอดนิยม กำหนดลักษณะเนื้อหาของกราฟ (ส่วนหัวของภาคแสดง) และ ด้านข้าง (หัวเรื่อง) - บรรทัด. ทำหน้าที่เป็นหัวข้อภายใน
กรอบโต๊ะที่เต็มไปด้วยส่วนหัวสร้างเค้าโครงตาราง หากคุณเขียนตัวเลขที่จุดตัดของกราฟและเส้น คุณจะได้ตารางสถิติที่สมบูรณ์ ชื่อตาราง (ชื่อทั่วไป)
โครงการ 3.1 โครงกระดูก (ฐาน) ของตารางสถิติ
สื่อดิจิทัลสามารถแสดงได้ในรูปแบบสัมบูรณ์ ( ทุนจดทะเบียน, ปริมาณของสินค้านวัตกรรม ฯลฯ ) ความสัมพันธ์ (GDP ต่อหัว จำนวนคอมพิวเตอร์ส่วนบุคคลต่อคนงาน 100 คน เป็นต้น) และมูลค่าเฉลี่ย (ราคาหุ้นเฉลี่ย ผลผลิตนมเฉลี่ยต่อวัว ฯลฯ)
ตารางอาจมีหมายเหตุประกอบหากจำเป็น หัวข้อ วิธีการคำนวณตัวบ่งชี้บางตัว แหล่งข้อมูล ฯลฯ
ในแง่ของเนื้อหาเชิงตรรกะ ตารางนี้เป็น "ประโยคทางสถิติ" ซึ่งมีองค์ประกอบหลักคือหัวเรื่องและภาคแสดง
เรื่องวัตถุที่มีลักษณะเป็นตัวเลขเรียกว่า นี่อาจเป็นการรวมหนึ่งรายการขึ้นไป แต่ละหน่วยของการรวมตามลำดับรายการหรือจัดกลุ่มตามลักษณะบางอย่าง หน่วยอาณาเขต ฯลฯ โดยปกติแล้วหัวเรื่องของตารางจะระบุไว้ทางด้านซ้ายในชื่อของแถว
ภาคแสดงสร้างระบบตัวบ่งชี้ที่กำหนดลักษณะวัตถุประสงค์ของการศึกษาเช่น เรื่องของตาราง ภาคแสดงจะสร้างส่วนหัวบนสุดและประกอบขึ้นเป็นเนื้อหาของกราฟโดยมีการจัดเรียงตัวบ่งชี้ตามลำดับตรรกะจากซ้ายไปขวา
ตำแหน่งของเรื่องและภาคแสดงในบางกรณีสามารถสลับเพื่อให้สมบูรณ์ยิ่งขึ้น และ วิธีที่ดีที่สุดการอ่านและวิเคราะห์ข้อมูลเบื้องต้นเกี่ยวกับประชากรที่กำลังศึกษา
ตามโครงสร้างของเรื่องตารางสถิติที่เรียบง่ายและซับซ้อนนั้นขึ้นอยู่กับการจัดกลุ่มหน่วยในนั้น
เรียบง่าย เรียกว่าตารางสถิติ โดยหัวเรื่องจะให้รายการวัตถุหรือ หน่วยดินแดน- ตารางสถิติอย่างง่ายแบ่งออกเป็นแบบ monographic และแบบรายการ
ตารางโมโนแกรม ไม่ได้กำหนดลักษณะของหน่วยทั้งชุดของวัตถุที่กำลังศึกษา แต่มีเพียงหน่วยเดียวหรือกลุ่มที่ระบุตามลักษณะเฉพาะ (ตารางที่ 3 .16).
ตารางที่ 3.16. การว่าจ้างสิ่งอำนวยความสะดวกทางสังคมและวัฒนธรรมในหน่วยงานที่เป็นองค์ประกอบของสหพันธรัฐรัสเซียในปี 2552
ตารางรายการ เรียกว่าตารางที่มีหัวเรื่องประกอบด้วยรายการวัตถุหรือหน่วยของวัตถุที่กำลังศึกษา (ตารางที่ 3.17)
ตารางสถิติที่ซับซ้อน ตรงกันข้ามกับสิ่งธรรมดา ๆ พวกเขาทำให้สามารถระบุประเภททางเศรษฐกิจและสังคมของปรากฏการณ์ที่กำลังศึกษา โครงสร้างของพวกเขาตลอดจนความสัมพันธ์และการพึ่งพาซึ่งกันและกันระหว่างคุณลักษณะที่มีลักษณะเฉพาะ ปัญหาเหล่านี้สามารถแก้ไขได้อย่างสมบูรณ์ยิ่งขึ้นโดยใช้กลุ่มและโดยเฉพาะตารางรวม
กลุ่ม เรียกว่าตารางสถิติ ซึ่งมีการจัดกลุ่มหน่วยประชากรตามคุณลักษณะเชิงปริมาณหรือคุณลักษณะเดียว
ตารางกลุ่มประเภทที่ง่ายที่สุดคือแถวการแจกจ่าย ตารางกลุ่มอาจซับซ้อนกว่านี้หากภาคแสดงมีตัวบ่งชี้เพิ่มเติมจำนวนหนึ่งที่แสดงลักษณะกลุ่มของเรื่อง ตารางดังกล่าวมักใช้เพื่อเปรียบเทียบตัวบ่งชี้ทั่วไปตามกลุ่ม (ตารางที่ 3.18)
ตารางที่ 3.17. การรับการลงทุนจากต่างประเทศในเศรษฐกิจรัสเซียไปยังประเทศนักลงทุนหลักในปี 2552
กลุ่มประชากรแยกตามอายุปี |
ทั้งหมด |
รวมทั้ง |
|
ผู้ชาย |
ผู้หญิง |
||
ดังนั้นตารางกลุ่มทำให้สามารถระบุและจำแนกประเภทของปรากฏการณ์ทางเศรษฐกิจและสังคมและโครงสร้างได้ขึ้นอยู่กับลักษณะเฉพาะเพียงประการเดียว
การรวมกัน เรียกว่าตารางสถิติซึ่งมีการจัดกลุ่มหน่วยประชากรพร้อมกันตามลักษณะสองอย่างขึ้นไป: แต่ละกลุ่มที่สร้างขึ้นตามลักษณะเดียวจะถูกแบ่งออกเป็นกลุ่มย่อยตามลักษณะอื่น ๆ เป็นต้น (ตารางที่ 3.19)
ตารางที่ 3.19. การจัดกลุ่มอพาร์ทเมนท์ที่สร้างเสร็จในอาคารพักอาศัยตามจำนวนห้องและขนาดเฉลี่ย
ตารางที่ 3.18. การกระจายจำนวนผู้มีงานทำในเศรษฐกิจรัสเซียตามกลุ่มอายุ ณ สิ้นเดือนพฤศจิกายน 2552 % ของทั้งหมด
หัวเรื่องในตารางคือกลุ่มของอพาร์ทเมนต์ที่สร้างขึ้นตามจำนวนห้องและขนาดเฉลี่ย
ตารางรวมช่วยให้คุณสามารถระบุลักษณะกลุ่มทั่วไปที่ระบุด้วยคุณลักษณะหลายประการและความสัมพันธ์ระหว่างกลุ่มเหล่านั้น ลำดับของการแบ่งหน่วยประชากรออกเป็นกลุ่มเนื้อเดียวกันตามลักษณะจะพิจารณาจากความสำคัญของหน่วยใดหน่วยหนึ่งในการรวมกันหรือตามลำดับที่ศึกษา
ภาคแสดงของตารางสถิติดังที่ได้กล่าวไปแล้วประกอบด้วยตัวบ่งชี้ที่เป็นลักษณะของวัตถุที่กำลังศึกษา
ขึ้นอยู่กับโครงสร้างของภาคแสดง ตารางสถิติที่เรียบง่ายและซับซ้อนมีความโดดเด่น
ที่ การพัฒนาภาคแสดงอย่างง่าย คุณสมบัติที่นำเสนอในนั้นจะไม่ตัดกันและรับค่าสุดท้ายโดยการรวมค่าสำหรับแต่ละคุณสมบัติแยกกันโดยแยกจากกัน ตัวอย่างของการพัฒนาเพรดิเคตอย่างง่ายคือตาราง 3.20.
ที่ การพัฒนาภาคแสดงที่ซับซ้อน มันกลับกลายเป็นว่าสมบูรณ์ยิ่งขึ้นและ ลักษณะโดยละเอียดวัตถุ. ในกรณีนี้ สัญญาณทั้งสองของภาคแสดง (ตามเพศและอายุ) มีความเกี่ยวข้องกันอย่างใกล้ชิด คุณสามารถวิเคราะห์องค์ประกอบก่อนได้ รัฐดูมาตามฝ่าย
ตารางที่ 3.20.
ตามกลุ่มอายุ จากนั้นแต่ละราย กลุ่มอายุแบ่งออกเป็นสองกลุ่มย่อยตามเพศ กล่าวอีกนัยหนึ่ง ด้วยการพัฒนาที่ซับซ้อนของภาคแสดง ปรากฏการณ์หรือวัตถุสามารถถูกกำหนดลักษณะโดยการผสมผสานคุณสมบัติที่แตกต่างกันที่ก่อตัวขึ้น
ในทุกกรณี เมื่อสร้างตารางสถิติ ผู้วิจัยควรได้รับคำแนะนำจากอัตราส่วนที่เหมาะสมของตัวบ่งชี้ภาคแสดง
กฎพื้นฐานสำหรับการสร้างและวิเคราะห์ตารางทางสถิติ
ตารางสถิติเป็นวิธีการนำเสนอแบบเห็นภาพและกะทัดรัด ข้อมูลดิจิทัลจะต้องมีความถูกต้องทางสถิติ มีเทคนิคพื้นฐานต่อไปนี้ที่กำหนดเทคนิคในการสร้างตารางสถิติ
- 1. จะต้องนำเสนอเนื้อหาดิจิทัลในลักษณะที่เมื่อวิเคราะห์ตาราง สาระสำคัญของปรากฏการณ์จะถูกเปิดเผยโดยการอ่านบรรทัดจากซ้ายไปขวาและจากบนลงล่าง
- 2. ชื่อตารางและชื่อของคอลัมน์และแถวจะต้องมีความชัดเจน กระชับ และแสดงถึงความครบถ้วนสมบูรณ์ที่เข้ากับเนื้อหาของข้อความโดยธรรมชาติ ชื่อของตารางควรสะท้อนถึงวัตถุ ป้าย เวลา และสถานที่จัดงาน
- 3. ข้อมูลที่อยู่ในคอลัมน์ (คอลัมน์) ของตารางจะลงท้ายด้วยบรรทัดสรุป
- 4. หากชื่อของแต่ละคอลัมน์ซ้ำกัน มีคำศัพท์ซ้ำ หรือมีโหลดความหมายเดียว จะต้องกำหนดส่วนหัวแบบรวม
- 5. มีประโยชน์ในการนับจำนวนคอลัมน์และบรรทัด คอลัมน์ทางด้านซ้ายซึ่งเต็มไปด้วยชื่อของบรรทัด มักจะถูกกำหนดด้วยตัวพิมพ์ใหญ่ของตัวอักษร (A), (B) ฯลฯ และคอลัมน์ที่ตามมาทั้งหมด - ตามตัวเลขจากน้อยไปหามาก
- 6. ขอแนะนำให้วางข้อมูลที่เกี่ยวข้องกันซึ่งระบุลักษณะหนึ่งของปรากฏการณ์ที่กำลังวิเคราะห์ในคอลัมน์ที่อยู่ติดกัน
- 7. คอลัมน์และเส้นจะต้องมีหน่วยการวัดที่สอดคล้องกับตัวชี้วัดที่ตั้งไว้ในหัวเรื่องและภาคแสดง ในกรณีนี้จะใช้ตัวย่อที่ยอมรับโดยทั่วไปของหน่วยการวัด (rub., kWh ฯลฯ )
- 8. ควรปัดเศษตัวเลขทุกครั้งที่เป็นไปได้ ตัวเลขภายในคอลัมน์หรือบรรทัดเดียวกันควรปัดเศษด้วยความแม่นยำเท่ากัน
- 9. หากจำเป็น ข้อมูลเพิ่มเติม(คำอธิบายในตาราง) อาจให้หมายเหตุก็ได้
การปฏิบัติตามกฎที่กำหนดสำหรับการสร้างและการออกแบบตารางสถิติทำให้เป็นวิธีการหลักในการนำเสนอประมวลผลและสรุปข้อมูลทางสถิติเกี่ยวกับสถานะและการพัฒนาปรากฏการณ์ทางเศรษฐกิจและสังคมที่วิเคราะห์แล้ว
การวิเคราะห์ตารางสถิติดำเนินการในสองทิศทาง: โครงสร้างและเนื้อหา
การวิเคราะห์โครงสร้าง เกี่ยวข้องกับการวิเคราะห์โครงสร้างของตารางและการกำหนดลักษณะ:
- จำนวนทั้งสิ้นและหน่วยการสังเกตที่ก่อตัวขึ้น
- เครื่องหมายและการรวมกันที่ก่อให้เกิดหัวเรื่องและภาคแสดงของตาราง
- ประเภทโต๊ะ;
- งานที่จะแก้ไข
- การวิเคราะห์แต่ละกลุ่มของวิชาตามลักษณะที่สอดคล้องกันของภาคแสดง
- การระบุความสัมพันธ์และสัดส่วนระหว่างกลุ่มปรากฏการณ์ตามลักษณะ
- การวิเคราะห์เปรียบเทียบและการกำหนดข้อสรุป การสร้างรูปแบบ และการกำหนดปริมาณสำรองเพื่อการพัฒนาวัตถุที่กำลังศึกษา
การวิเคราะห์ลักษณะเฉพาะบุคคลและกลุ่มจะต้องเริ่มต้นด้วยการศึกษาค่าสัมบูรณ์จากนั้น - ค่าสัมพัทธ์ที่เกี่ยวข้องกับค่าเหล่านั้น
หากวัตถุประสงค์การวิจัยต้องการสิ่งนี้ การวิเคราะห์ตารางสามารถเสริมด้วยค่าสัมพัทธ์และค่าเฉลี่ยที่คำนวณได้ กราฟ ไดอะแกรม ฯลฯ
การวิเคราะห์ตารางเหล่านี้ดำเนินการสำหรับแต่ละลักษณะแยกกัน จากนั้นจึงรวมลักษณะเชิงตรรกะและเศรษฐกิจเข้าด้วยกัน
การปฏิบัติตามกฎและความสม่ำเสมอในการทำงานกับตารางสถิติจะช่วยให้ผู้วิจัยสามารถดำเนินการวิเคราะห์ทางเศรษฐศาสตร์และสถิติเชิงวิทยาศาสตร์ที่ครอบคลุมของวัตถุและกระบวนการที่กำลังศึกษาอยู่
แยกแยะกลุ่มได้:
- หลักรวบรวมบนพื้นฐานของวัสดุปฐมภูมิที่รวบรวมระหว่างการสังเกต
- รองรวบรวมบนพื้นฐานของหลักใช้ในสองกรณี:
- เมื่อจำเป็นต้องจัดกลุ่มอย่างเป็นทางการขนาดเล็กให้เป็นกลุ่มใหญ่
- เมื่อจะให้ การประเมินเปรียบเทียบรวบรวมวัสดุจากสถานที่ต่าง ๆ และใช้วิธีการที่แตกต่างกัน
ลักษณะที่เรียกว่ากลุ่มหรือประเภทของปรากฏการณ์ การจัดกลุ่มหรือพื้นฐานการจัดกลุ่ม- พื้นฐานอาจเป็นเชิงปริมาณหรือเชิงประกอบก็ได้ แอตทริบิวต์– นี่คือสัญลักษณ์ที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า, ครู ฯลฯ )
ตัวอย่างหมายเลข 1 ข้อมูลต่อไปนี้มีอยู่ในการกระจายของบริษัทการค้าตามจำนวนพนักงานในสองภูมิภาค
สร้างกลุ่มรองของข้อมูลการกระจายของบริษัทโดยการคำนวณข้อมูลจากภูมิภาค 1 ใหม่ตามการจัดกลุ่มของภูมิภาค 2 จำนวนพนักงานโดยเฉลี่ยในภูมิภาคใดมากกว่า
สารละลาย:
กลุ่มแรก “น้อยกว่า 5” จะรวม 4/5 ของกลุ่ม “1-5” จากนั้นจำนวนบริษัทจะเป็น: 6*4/5 = 4.8 µm 5
กลุ่ม "5-10" รวมกลุ่ม "6-10" อย่างสมบูรณ์และเป็นส่วนหนึ่งของกลุ่ม "1-5" เช่น บริษัทเลขจะเป็น 4 + (6-5) = 5
ในกลุ่ม "11-20" อย่างสมบูรณ์ กลุ่มจะเข้า“11-15” และส่วนหนึ่งของกลุ่ม “16-20” คือ ¼*50 = 12.5 data 13
กลุ่ม "21-30" ประกอบด้วยกลุ่ม "16-20" และกลุ่ม "21-25" และกลุ่ม "มากกว่า 25" โดยสมบูรณ์ เราได้: (50-13) + 20 + 15 = 72
ค้นหาจำนวนพนักงานโดยเฉลี่ย:
สำหรับภาคแรก
ค่าเฉลี่ยถ่วงน้ำหนัก: x av = 1960/105 = 18.67
สำหรับภูมิภาคที่สอง
ค่าเฉลี่ยถ่วงน้ำหนัก: x av = 3502.5/117 = 29.94
ดังนั้นในภูมิภาคที่สอง จำนวนพนักงานโดยเฉลี่ยจึงสูงขึ้น
ตัวอย่างหมายเลข 2
การแบ่งคนงานตามระยะเวลาการทำงาน
หมายเลขกลุ่ม | กลุ่มคนงาน จำแนกตามอายุงาน ปี | จำนวนคนงานคน | จำนวนคนงานคิดเป็นเปอร์เซ็นต์ของทั้งหมด |
ฉัน | 2-6 | 6 | 30,0 |
ครั้งที่สอง | 6-10 | 6 | 30,0 |
III | 10-14 | 5 | 25,0 |
IV | 14-18 | 3 | 15,0 |
ทั้งหมด | 20 | 100,0 |
ในชุดการแจกแจง เพื่อความชัดเจน คุณลักษณะที่กำลังศึกษาจะคำนวณเป็นเปอร์เซ็นต์ ผลการจัดกลุ่มเบื้องต้นพบว่า 60.0% ของคนงานมีประสบการณ์มากถึง 10 ปี โดยแบ่งเป็น 2-6 ปีเท่ากัน - 30% และจาก 6-10 ปี - 30% และ 40% ของคนงานมีประสบการณ์จาก 10 ถึง 18 ปี
เพื่อศึกษาความสัมพันธ์ระหว่างประสบการณ์การทำงานและผลลัพธ์ จำเป็นต้องสร้างกลุ่มการวิเคราะห์ ที่ฐานเราจะใช้กลุ่มเดียวกับในชุดการแจกจ่าย เรานำเสนอผลลัพธ์การจัดกลุ่มในตารางที่ 2
ตารางที่ 2 - การจัดกลุ่มคนงานตามระยะเวลาการทำงาน
หมายเลขกลุ่ม | กลุ่มคนงานตามประสบการณ์ | จำนวนคนงานคน | ประสบการณ์การทำงานโดยเฉลี่ยปี | ผลลัพธ์ของผลิตภัณฑ์ถู | |
ทั้งหมด | เพื่อทาสคนหนึ่ง | ||||
ฉัน | 2-6 | 6 | 3,25 | 1335,0 | 222,5 |
ครั้งที่สอง | 6-10 | 6 | 7,26 | 1613,0 | 268,8 |
III | 10-14 | 5 | 11,95 | 1351,0 | 270,2 |
IV | 14-18 | 3 | 16,5 | 965,0 | 321,6 |
ทั้งหมด: | 20 | 8,62 | 5264 | 236 |
ในการกรอกตารางที่ 2 คุณต้องสร้างแผ่นงาน 3
ตารางที่ 3.
เลขที่ | กลุ่มคนงาน จำแนกตามอายุงาน ปี | หมายเลขคนงาน | ประสบการณ์ | ส่งออกเป็นถู |
1 | 2 | 3 | 4 | 5 |
1 | 2-6 | 1, 2, 3, 4, | 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 | 205, 200, 205, 250, 225, 250 |
รวมสำหรับกลุ่ม: | 6 | 19,5 | 1335 | |
2 | 6-10 | 5, 6, 8, 13, 17, 19 | 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 | 208, 290, 270, 250, 270, 253 |
รวมสำหรับกลุ่ม | 6 | 43,6 | 1613 | |
3 | 10-14 | 9, 12, 15, 16, 18 | 12,5; 13,0; 11,0; 10,5; 12,8 | 230, 300, 287, 276, 258 |
รวมสำหรับกลุ่ม | 5 | 59,8 | 1351 | |
4 | 14-18 | 11, 20, 14 | 16, 18, 15,5 | 295, 320, 350 |
รวมสำหรับกลุ่ม | 3 | 49,5 | 965 | |
ทั้งหมด | 20 | 172.4 | 5264,0 |
การแบ่งคอลัมน์ (4:3); (5:3) แท็บ 3 เราได้รับข้อมูลที่เกี่ยวข้องเพื่อกรอกตารางที่ 2 นอกจากนี้สำหรับทุกกลุ่ม โดยการกรอกตารางที่ 2 เราจะได้ตารางการวิเคราะห์
เมื่อคำนวณตารางงานแล้วเราจะเปรียบเทียบผลลัพธ์สุดท้ายของตารางกับข้อมูลของเงื่อนไขปัญหาที่ต้องตรงกัน ดังนั้น นอกเหนือจากการสร้างกลุ่มและการค้นหาค่าเฉลี่ยแล้ว เรายังจะตรวจสอบการควบคุมทางคณิตศาสตร์ด้วย
จากการวิเคราะห์ตารางวิเคราะห์ที่ 2 เราสามารถสรุปได้ว่าลักษณะที่ศึกษา (ตัวชี้วัด) ขึ้นอยู่กับแต่ละอื่น ๆ ด้วยประสบการณ์การทำงานที่เพิ่มขึ้น ผลผลิตต่อพนักงานก็เพิ่มขึ้นอย่างต่อเนื่อง ผลลัพธ์ของคนงานกลุ่มที่สี่คือ 99.1 รูเบิล สูงกว่าครั้งแรกหรือ 44.5% เราพิจารณาตัวอย่างการจัดกลุ่มตามลักษณะหนึ่ง แต่ในหลายกรณี การจัดกลุ่มดังกล่าวไม่เพียงพอที่จะแก้ไขปัญหาที่ได้รับมอบหมาย ในกรณีเช่นนี้ จะดำเนินการจัดกลุ่มตามลักษณะตั้งแต่สองลักษณะขึ้นไป ได้แก่ เพื่อการรวมกัน ให้เราจัดกลุ่มข้อมูลรองตามผลผลิตเฉลี่ย
เรากำหนดลักษณะแต่ละกลุ่มตามจำนวนคนงาน ประสบการณ์การทำงานโดยเฉลี่ย ผลลัพธ์เฉลี่ย - รวมและการคำนวณต่อพนักงานแสดงไว้ในตารางที่ 4
ตารางที่ 4 - การจัดกลุ่มคนงานตามระยะเวลาการให้บริการและผลผลิตเฉลี่ย
เลขที่ | กลุ่มคนงาน | จำนวนคนงานคน | เฉลี่ย ประสบการณ์การทำงานปี | ผลผลิตเฉลี่ยถู | ||
โดยประสบการณ์ | ตามการผลิตโดยเฉลี่ย ต่อ ในถู | ทั้งหมด | ต่อคนงานหนึ่งคน | |||
1 | 2-6 | 200,0-250,0 | 4 | 2,5 | 835,0 | 208,75 |
รวมสำหรับกลุ่ม | 6 | 3,25 | 1335,0 | 222,5 | ||
2 | 6-10 | 200,0-250,0 | - | - | - | - |
3 | 10-14 | 200,0-250,0 | 1 | 12,5 | 230,0 | 230,0 |
รวมสำหรับกลุ่ม | 5 | 11,96 | 1351,0 | 270,2 | ||
4 | 14-18 | 200,0-250,0 | - | - | - | - |
รวมสำหรับกลุ่ม | 3 | 16,5 | 965,0 | 321,6 | ||
รวมเป็นรายกลุ่ม | 200,0-250,0 | 5 | 3,0 | 1065,0 | 213,0 | |
ทั้งหมด | 20 | 8,62 | 5264 | 263,2 |
ในการสร้างการจัดกลุ่มเชิงวิเคราะห์รองตามผลผลิตผลิตภัณฑ์โดยเฉลี่ยภายในกลุ่มที่สร้างขึ้นครั้งแรก เราจะกำหนดช่วงเวลาของการจัดกลุ่มรองโดยเน้นสามกลุ่ม ได้แก่ น้อยกว่าในกลุ่มเดิมหนึ่งรายการ
จากนั้น i=(350-200)/3 = 50 ถู
ไม่มีประโยชน์ที่จะรับหลายกลุ่ม จะมีช่วงเวลาสั้นมาก เป็นไปได้น้อย ข้อมูลสุดท้ายของกลุ่มคำนวณจากผลรวมของประสบการณ์ของกลุ่ม ส่ง 19.5 ปีแรก หารด้วยจำนวนคนงาน - 6 คน เราได้ 3.25 ปี
ข้อมูลในตารางแสดงให้เห็นว่าผลผลิตของผลิตภัณฑ์ขึ้นอยู่กับประสบการณ์การทำงานโดยตรง
บางครั้งการจัดกลุ่มเริ่มแรกไม่ได้ระบุลักษณะของการกระจายหน่วยประชากรอย่างชัดเจน หรือเพื่อนำการจัดกลุ่มไปเป็นประเภทที่เทียบเคียงได้เพื่อวัตถุประสงค์ในการวิเคราะห์เชิงเปรียบเทียบ จำเป็นต้องเปลี่ยนการจัดกลุ่มที่มีอยู่เล็กน้อย: การรวมกลุ่มที่ระบุก่อนหน้านี้มีขนาดค่อนข้างเล็ก จัดกลุ่มเป็นกลุ่มเล็ก ๆ ทั่วไปหรือเปลี่ยนขอบเขตของกลุ่มก่อนหน้าเพื่อให้กลุ่มสามารถเปรียบเทียบกับกลุ่มอื่นได้