ระเบียบวิธีในการจัดกลุ่มข้อมูลทางสถิติ การจัดกลุ่มรอง

การส่งผลงานที่ดีของคุณไปยังฐานความรู้เป็นเรื่องง่าย ใช้แบบฟอร์มด้านล่าง

นักศึกษา นักศึกษาระดับบัณฑิตศึกษา นักวิทยาศาสตร์รุ่นเยาว์ ที่ใช้ฐานความรู้ในการศึกษาและการทำงาน จะรู้สึกขอบคุณเป็นอย่างยิ่ง

โพสต์เมื่อ http://www.allbest.ru/

สถาบันมอสโกตั้งชื่อตาม ส.ยู. วิตต์

คณะเศรษฐศาสตร์

ทดสอบ

งานเสร็จแล้ว:

นักศึกษาชั้นปีที่ 1

การเรียนรู้ทางไกล

Vislyaeva M.N.

มอสโก

เมื่อดำเนินการ งานควบคุมคุณต้องทำการจัดเรียงใหม่เพื่อไม่ให้ ตัวอย่างที่ซับซ้อน(เลือกตัวอย่างด้วยตัวคุณเอง) และอธิบายว่าการคำนวณใหม่ดังกล่าวถูกต้องอย่างไรและภายใต้เงื่อนไขใด เมื่อใช้โปรแกรมคอมพิวเตอร์และตัวอย่างที่ซับซ้อนมากขึ้น ให้ระบุถึงผลกระทบและคุณสมบัติของการใช้งานไอทีด้วย

ในการตอบกลับเป็นลายลักษณ์อักษรของคุณต่องาน คุณต้อง:

1. อธิบายความเชื่อมโยงระหว่างสูตรบวกความแปรปรวนกับความสัมพันธ์สหสัมพันธ์ อธิบายความหมายทางสถิติ

2. เปรียบเทียบความแปรผันของการแจกแจงสองแบบด้วยค่าเฉลี่ยที่ต่างกัน อธิบายเงื่อนไขของการเปรียบเทียบได้เมื่อค่าเฉลี่ยแตกต่างกัน

3. ให้คำอธิบายที่สมบูรณ์ที่สุดเกี่ยวกับความหมายของข้อผิดพลาดส่วนเพิ่ม เชื่อมโยงกับแนวคิดเรื่องตัวแทนของกลุ่มตัวอย่างและปริมาตรที่ต้องการ

4. อธิบายความสัมพันธ์ระหว่างการประมาณค่าพารามิเตอร์ที่ไม่รู้จักโดยใช้ OLS และการตรวจสอบนัยสำคัญของผลลัพธ์ที่ได้รับโดยใช้เกณฑ์ในการทดสอบสมมติฐานทางสถิติ

การจัดกลุ่มสถิติที่จัดกลุ่มไว้ก่อนหน้านี้ใหม่เรียกว่าการจัดกลุ่มรอง วิธีการนี้ใช้ในกรณีที่ลักษณะของการกระจายตัวของประชากรที่กำลังศึกษาไม่ชัดเจนอันเป็นผลมาจากการจัดกลุ่มครั้งแรก

ในกรณีนี้ ช่วงเวลาจะขยายหรือลดลง การจัดกลุ่มรองยังใช้เพื่อนำการจัดกลุ่มตามช่วงเวลาที่ต่างกันมาเป็นรูปแบบที่เปรียบเทียบได้เพื่อจุดประสงค์ในการเปรียบเทียบ ลองดูเทคนิคการจัดกลุ่มรองโดยใช้ตัวอย่าง

ขยายช่วงเวลาตามข้อมูลในตารางที่ 1:

ตารางที่ 1

	จำนวนร้านค้า

การจัดกลุ่มข้างต้นยังไม่ชัดเจนเพียงพอ เนื่องจากไม่ได้แสดงรูปแบบการเปลี่ยนแปลงมูลค่าการซื้อขายตามกลุ่มที่ชัดเจนและเข้มงวด

ให้เรากระชับแถวการแจกแจงโดยแบ่งเป็นหกกลุ่ม กลุ่มใหม่จะถูกสร้างขึ้นโดยการรวมกลุ่มเดิม (ตารางที่ 2)

ตารางที่ 2

กลุ่มร้านค้าตามมูลค่าการซื้อขายในไตรมาสที่สี่พันรูเบิล	จำนวนร้านค้า	มูลค่าการซื้อขายในไตรมาสที่สี่พันรูเบิล	มูลค่าการซื้อขายเฉลี่ยต่อร้าน พันรูเบิล

เป็นที่ชัดเจนอย่างยิ่งว่ายิ่งร้านค้ามีขนาดใหญ่เท่าใด ระดับการหมุนเวียนก็จะยิ่งสูงขึ้นเท่านั้น

1. จากการจัดกลุ่มเชิงวิเคราะห์ ความสัมพันธ์สามารถวัดได้โดยใช้ความสัมพันธ์เชิงประจักษ์ ตัวบ่งชี้นี้แสดงไว้ อักษรกรีก z (นี่) ขึ้นอยู่กับกฎการสลายตัวของความแปรปรวน ซึ่งความแปรปรวนรวม s2 เท่ากับผลรวมของความแปรปรวนภายในกลุ่มและระหว่างกลุ่ม

การกระจายตัวของคุณลักษณะที่มีประสิทธิผลภายในกลุ่มที่มีความคงที่สัมพัทธ์ของคุณลักษณะของปัจจัยนั้นเกิดขึ้นเนื่องจากปัจจัยอื่นๆ ความแปรปรวนนี้เรียกว่าค่าคงเหลือ ถูกกำหนดโดยสูตร:

โดยที่ y ij คือค่าของคุณลักษณะ y สำหรับ หน่วยที่ iในกลุ่ม j;

J คือค่าเฉลี่ยของลักษณะในกลุ่มที่ j

nj - หมายเลข หน่วย jthกลุ่ม;

j = 1, 2, 3, ... เช่น

ความแปรปรวนภายในกลุ่มที่คำนวณสำหรับแต่ละกลุ่มจะรวมกันเข้ากับค่าเฉลี่ยความแปรปรวนภายในกลุ่ม:

ความแปรปรวนระหว่างกลุ่มเป็นผลมาจากปัจจัยที่กำลังศึกษา (และปัจจัยที่เกี่ยวข้อง) ดังนั้นจึงเรียกว่าความแปรปรวนของปัจจัย มันถูกกำหนดโดยสูตร

กฎสำหรับการบวกผลต่างสามารถเขียนได้:

อัตราส่วนสหสัมพันธ์เชิงประจักษ์วัดความแปรปรวนทั้งหมดในคุณลักษณะผลลัพธ์ที่เกิดจากปัจจัยที่กำลังศึกษา ดังนั้นจึงคำนวณเป็นอัตราส่วนของความแปรปรวนของปัจจัยต่อความแปรปรวนรวมของคุณลักษณะผลลัพธ์:

ตัวบ่งชี้นี้รับค่าในช่วง: ยิ่งใกล้ 1 การเชื่อมต่อยิ่งใกล้มากขึ้น และในทางกลับกัน

ตารางที่ 3. ข้อมูลเริ่มต้น

ตารางที่ 4. แผ่นงาน

มูลค่าการซื้อขายเฉลี่ย = ?X*f / f= 17370/51 = 340.58 พันรูเบิล

ความแปรปรวนคือ:

G2 =? f*(X-Xav) 2 / ? ฉ = 38682.36/51 = 758.48

ส่วนเบี่ยงเบนมาตรฐาน:

ค่าสัมประสิทธิ์ของการแปรผันคือ:

วี = G / Xavg = 27.54/758.48 = 0.081; 8.1%

ค่าสัมประสิทธิ์การเปลี่ยนแปลงน้อยกว่า 33% ดังนั้นประชากรจึงเป็นเนื้อเดียวกัน

ตารางที่ 5. ข้อมูลเริ่มต้น

1) เวลาเฉลี่ยที่ใช้ในการเดินทางไปยังสถานที่ทำงานของคนงาน = X av =? Xf / ?f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41.8 นาที

2) การคำนวณผลต่าง

ความแปรปรวนคือ:

G2 =? ส่วนเบี่ยงเบนฉ:

3) ค่าสัมประสิทธิ์*(X-Xaver) 2 / ? ฉ = 43160.8/420 = 102.8

การแปรผันกำลังสองเฉลี่ยเท่ากับ:

วี = G / Xavg = 10.14/41.8 = 0.24; 24%

ค่าสัมประสิทธิ์ของการแปรผันน้อยกว่า 33% ดังนั้นประชากรที่พิจารณาว่าเป็นเนื้อเดียวกันและค่าเฉลี่ยของความแปรปรวนนั้นค่อนข้างปกติ

ประชากรตัวอย่างสามารถเกิดขึ้นได้จากลักษณะเชิงปริมาณของค่าทางสถิติ เช่นเดียวกับลักษณะทางเลือกหรือลักษณะเฉพาะ ในกรณีแรก ลักษณะทั่วไปของกลุ่มตัวอย่างคือค่าเฉลี่ยของกลุ่มตัวอย่าง ซึ่งแสดงด้วยสัญลักษณ์ และในกรณีที่สอง สัดส่วนของตัวอย่างจะแสดงด้วยสัญลักษณ์ w ในประชากรทั่วไป ตามลำดับ: ค่าเฉลี่ยทั่วไป และส่วนแบ่งทั่วไปของ p

ความแตกต่าง -- และ W -- p เรียกว่าข้อผิดพลาดในการสุ่มตัวอย่าง ซึ่งแบ่งออกเป็นข้อผิดพลาดในการลงทะเบียนและข้อผิดพลาดในการเป็นตัวแทน ส่วนแรกของข้อผิดพลาดในการสุ่มตัวอย่างเกิดขึ้นเนื่องจากข้อมูลที่ไม่ถูกต้องหรือไม่ถูกต้องเนื่องจากขาดความเข้าใจในสาระสำคัญของปัญหาการไม่เอาใจใส่ของนายทะเบียนเมื่อกรอกแบบสอบถามแบบฟอร์ม ฯลฯ มันค่อนข้างง่ายที่จะตรวจจับและกำจัด ส่วนที่สองของข้อผิดพลาดเกิดขึ้นจากความล้มเหลวอย่างต่อเนื่องหรือเกิดขึ้นเองในการปฏิบัติตามหลักการเลือกแบบสุ่ม ตรวจจับและกำจัดได้ยาก มีขนาดใหญ่กว่าอันแรกมาก ดังนั้นจึงให้ความสำคัญกับมันเป็นหลัก

พิเศษเฉพาะ บทบาทที่สำคัญเพื่อเป็นเหตุผลและการประยุกต์ใช้ การสังเกตตัวอย่างกฎแห่งจำนวนมากมายเกิดขึ้น การใช้กฎจำนวนมากคือภายใต้เงื่อนไขบางประการและมีการสังเกตในปริมาณมากพอสมควร ลักษณะสรุปที่ได้รับจากการสังเกตตัวอย่างจะแตกต่างเล็กน้อยจากลักษณะที่สอดคล้องกันของหนังสือมอบอำนาจทั่วไป จากสิ่งนี้ จึงเป็นไปได้โดยการเพิ่มขนาดของประชากรตัวอย่าง เพื่อลดขีดจำกัดของข้อผิดพลาดที่เป็นไปได้ของการเป็นตัวแทน โดยนำพวกเขาไปสู่ ขนาดที่เล็กที่สุด- ในทางกลับกัน เมื่อทราบขีดจำกัดของข้อผิดพลาดในการเป็นตัวแทนแล้ว จึงสามารถกำหนดขนาดที่ต้องการของประชากรตัวอย่างได้

งานที่สำคัญและมีความรับผิดชอบที่สุดประการหนึ่งในการจัดระเบียบและดำเนินการสังเกตตัวอย่างคือการกำหนดขนาดที่ต้องการของประชากรตัวอย่าง เช่น ตัวเลขดังกล่าวจะทำให้ได้รับข้อมูลที่สะท้อนคุณสมบัติที่ศึกษาของประชากรทั่วไปได้อย่างถูกต้องเพียงพอ

ในกรณีนี้จะต้องคำนึงถึงสิ่งต่อไปนี้: 1) ควรได้รับข้อผิดพลาดในการสุ่มตัวอย่างสูงสุดด้วยความแม่นยำระดับใด 2) ความน่าจะเป็นที่จะรับประกันความถูกต้องตามเงื่อนไขของผลลัพธ์ของการสังเกตตัวอย่างควรเป็นอย่างไร 3) ระดับความผันผวนของคุณสมบัติที่ศึกษาในประชากรที่ศึกษา

ซึ่งหมายความว่าขนาดตัวอย่างที่ต้องการจะถูกตั้งค่าโดยขึ้นอยู่กับขนาดของข้อผิดพลาดในการสุ่มตัวอย่างสูงสุด ค่าของสัมประสิทธิ์ความเชื่อมั่น (t) และขนาดของความแปรปรวน

วิธีการประมาณค่าพารามิเตอร์ การถดถอยเชิงเส้นซึ่งจะลดผลรวมของการเบี่ยงเบนกำลังสองของการสังเกตตัวแปรตามจากฟังก์ชันเชิงเส้นที่ต้องการให้เหลือน้อยที่สุด เรียกว่าวิธีกำลังสองน้อยที่สุด

สาระสำคัญของวิธีการนี้คือเกณฑ์สำหรับคุณภาพของโซลูชันที่พิจารณาคือผลรวมของข้อผิดพลาดกำลังสองซึ่งพวกเขาพยายามลดให้เหลือน้อยที่สุด หากต้องการใช้วิธีนี้จำเป็นต้องดำเนินการให้มากที่สุด จำนวนที่มากขึ้นการวัดตัวแปรสุ่มที่ไม่รู้จัก (ยิ่งมาก ความแม่นยำของโซลูชันก็จะยิ่งสูงขึ้น) และชุดของโซลูชันโดยประมาณบางชุดที่ต้องเลือกโซลูชันที่ดีที่สุด ถ้าชุดของโซลูชันถูกกำหนดเป็นพารามิเตอร์ เราจำเป็นต้องค้นหาค่าที่เหมาะสมที่สุดของพารามิเตอร์

LSM ใช้ในคณิตศาสตร์ โดยเฉพาะในทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ วิธีนี้ใช้กันอย่างแพร่หลายในการกรองปัญหาเมื่อจำเป็นต้องแยกสัญญาณที่เป็นประโยชน์ออกจากสัญญาณรบกวนที่ซ้อนทับอยู่ นอกจากนี้ยังใช้ในการวิเคราะห์ทางคณิตศาสตร์เพื่อเป็นตัวแทนโดยประมาณ ฟังก์ชันที่กำหนดฟังก์ชั่นที่เรียบง่ายยิ่งขึ้น การประยุกต์ใช้กำลังสองน้อยที่สุดอีกประการหนึ่งคือการแก้ระบบสมการที่ไม่ทราบจำนวนน้อยกว่าจำนวนสมการ

ขั้นตอนการทดสอบสมมติฐานทางสถิติ:

การกำหนดสมมติฐานหลัก H 0 และสมมติฐานที่แข่งขันกัน H 1 . สมมติฐานจะต้องถูกทำให้เป็นทางการอย่างชัดเจนในแง่คณิตศาสตร์

การกำหนดความน่าจะเป็น ข เรียกว่าระดับนัยสำคัญและสอดคล้องกับข้อผิดพลาดประเภทแรกซึ่งจะมีข้อสรุปเกี่ยวกับความจริงของสมมติฐานในอนาคต

การคำนวณเกณฑ์สถิติμเป็นดังนี้:

ค่าของมันขึ้นอยู่กับตัวอย่างดั้งเดิม

ขึ้นอยู่กับคุณค่าของมันเราสามารถสรุปเกี่ยวกับความจริงของสมมติฐาน H 0 ;

สถิตินั้นจะต้องเป็นไปตามกฎหมายการกระจายที่ทราบบางประการเพราะว่า q นั้นสุ่มมาจากความบังเอิญ

การก่อสร้างพื้นที่วิกฤต จากช่วงของค่า μ จะมีการระบุชุดย่อยของค่าดังกล่าวตามที่สามารถตัดสินความแตกต่างที่มีนัยสำคัญกับสมมติฐานได้ ขนาดของมันถูกเลือกในลักษณะที่พึงพอใจอย่างเท่าเทียมกัน ชุดนี้เรียกว่าบริเวณวิกฤต

บทสรุปเกี่ยวกับความจริงของสมมติฐาน ค่าตัวอย่างที่สังเกตได้จะถูกแทนที่ในสถิติ q และขึ้นอยู่กับว่าค่าเหล่านี้ตก (หรือไม่ตก) ในบริเวณวิกฤต จึงมีการตัดสินใจที่จะปฏิเสธ (หรือยอมรับ) สมมติฐานที่หยิบยกขึ้นมา H0

การแปรผันสหสัมพันธ์การกระจายตัว

โพสต์บน Allbest.ru

...

เอกสารที่คล้ายกัน

ตารางค่าตัวอย่างของตัวแปรสุ่มแบบไม่ต่อเนื่องในรูปแบบเรียงลำดับ ตารางช่วงสถิติชุดความถี่สัมพัทธ์ การระบุฟังก์ชันการแจกแจงเชิงประจักษ์และการลงจุด รูปหลายเหลี่ยมและการแจกแจงตัวแปรสุ่ม

งานภาคปฏิบัติ เพิ่มเมื่อ 26/07/2555

ลักษณะเชิงตัวเลขสำหรับการแจกแจงทางสถิติ การสร้างอนุกรมการแปรผันตามช่วงเวลา รูปหลายเหลี่ยมความถี่ กราฟของฟังก์ชันการแจกแจงตัวอย่าง และการหาค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างด้วยสองวิธี

การนำเสนอเพิ่มเมื่อ 11/01/2013

ค่าเฉลี่ยของตัวบ่งชี้ (ค่าเฉลี่ยเลขคณิต) ตัวชี้วัดการเปลี่ยนแปลง - ช่วงของการแปรผัน ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย ค่าเบี่ยงเบนมาตรฐาน การกระจายตัว ค่าสัมประสิทธิ์ของการแปรผัน สูงสุดและ ค่าต่ำสุดตัวบ่งชี้ทางสถิติ

ทดสอบเพิ่มเมื่อ 11/14/2551

แนวคิดเรื่องประชากรทั่วไป ความคาดหวังทางคณิตศาสตร์ และการกระจายตัว รับรองความสุ่มและความเป็นตัวแทนของกลุ่มตัวอย่างในการวางแผนทางสถิติ อนุกรมการแปรผันแบบไม่ต่อเนื่องและแบบช่วง การประมาณค่าจุดของพารามิเตอร์การกระจายตัวแบบคุณลักษณะ

บทคัดย่อเพิ่มเมื่อ 13/06/2554

สาระสำคัญของการวิจัยสุ่มตัวอย่าง วิธีการเลือกหน่วยใน ประชากรตัวอย่าง- ค่าเฉลี่ยและความคลาดเคลื่อนส่วนเพิ่มสำหรับการวัดค่าเฉลี่ยและสัดส่วน การกำหนดขนาดตัวอย่างที่ต้องการสำหรับค่าความผิดพลาดสูงสุดของค่าเฉลี่ยที่กำหนด

การนำเสนอเพิ่มเมื่อ 16/03/2014

รูปแบบ ประเภท และวิธีการสังเกตทางสถิติ ประเภทการจัดกลุ่ม ช่วงเวลา และความถี่ โครงสร้างของซีรีย์ไดนามิก ค่าสถิติสัมบูรณ์และค่าสัมพัทธ์ การนำเสนอตัวอย่างในรูปแบบชุดสถิติ การประมาณค่าจุดและช่วงเวลา

หลักสูตรการบรรยาย เพิ่มเมื่อ 29/11/2556

การสร้างอนุกรมความแปรผันตามช่วงเวลาตามตัวบ่งชี้ การคำนวณค่าเฉลี่ยเลขคณิต โหมด และค่ามัธยฐาน สัมพัทธ์และ ตัวชี้วัดที่แน่นอนรูปแบบต่างๆ การกำหนดลักษณะเชิงปริมาณของการแจกแจง การสร้างฟังก์ชันเชิงประจักษ์

งานหลักสูตรเพิ่มเมื่อวันที่ 11/01/2555

แผนภาพกระจายเป็นจุดบนระนาบซึ่งมีพิกัดสอดคล้องกับค่าของตัวแปรสุ่ม X และ Y ลำดับของโครงสร้างและวัตถุประสงค์ การหาค่าสัมประสิทธิ์และสร้างกราฟการประมาณเชิงเส้นและกราฟการประมาณกำลังสอง

งานหลักสูตร เพิ่มเมื่อ 05/03/2011

การสั่งตัวอย่างเบื้องต้นของเวลาถึงความล้มเหลว การทดสอบสมมติฐานทางสถิติของการโต้ตอบ การกระจายแบบเอ็กซ์โปเนนเชียลและการกระจายพันธุ์ไวบูล การประมาณค่าพารามิเตอร์การกระจายและตัวบ่งชี้ความน่าเชื่อถือ วิธีการและเทคนิคหลัก

งานหลักสูตรเพิ่มเมื่อ 22/01/2555

แนวคิดเรื่องอนุกรมความแปรผัน การกระจายตัวทางสถิติ ฟังก์ชันเชิงประจักษ์และคุณลักษณะหลักของความคาดหวังทางคณิตศาสตร์ของความแปรปรวนตัวอย่าง การประมาณจุดและช่วงเวลาของการแจกแจง ทฤษฎีสมมติฐานมีความคล้ายคลึงกับทฤษฎีช่วงความเชื่อมั่น

เมื่อวิเคราะห์และเปรียบเทียบกลุ่มต่างๆ เช่น ในเวิร์กช็อป องค์กร ฯลฯ หลายแห่ง สถานการณ์อาจเกิดขึ้นเมื่อกลุ่มเดิมไม่สามารถเปรียบเทียบได้เนื่องจากมีจำนวนกลุ่มต่างกันหรือมีขนาดช่วงเวลาต่างกัน เพื่อนำการจัดกลุ่มดังกล่าวมาอยู่ในรูปแบบที่เทียบเคียงได้คือ ใช้วิธีการจัดกลุ่มรองโดยใช้วิธีการจัดกลุ่มรอง วิธีการจัดกลุ่มรอง เป็นวิธีการสร้างกลุ่มใหม่ตามกลุ่มที่มีอยู่ตามข้อกำหนดที่กำหนดในการดำเนินการจัดกลุ่มรอง มีการใช้ 2 วิธี: 1) รวมกลุ่มดั้งเดิม 2) การจัดกลุ่มใหม่แบบเศษส่วน

การนำกลุ่มที่แตกต่างกันหลายกลุ่มมาอยู่ในรูปแบบที่เทียบเคียงได้จะดำเนินการในสามขั้นตอน ในระยะแรก การจัดกลุ่มเริ่มแรกจะได้รับการวิเคราะห์เพื่อระบุเงื่อนไขของความไม่มีใครเทียบได้ของการจัดกลุ่มดั้งเดิม ในขั้นตอนที่สอง จะมีการเลือกวิธีการเพื่อนำการจัดกลุ่มดั้งเดิมมาอยู่ในรูปแบบที่เทียบเคียงได้ ในขั้นตอนที่สาม จะมีการจัดเรียงการจัดกลุ่มเริ่มต้นใหม่และการวิเคราะห์ผลลัพธ์ที่ได้รับอีกครั้ง หากจำเป็นให้ดำเนินการจัดกลุ่มใหม่ พิจารณาวิธีการจัดเรียงรองใหม่

1 วิธีการสังเกตทางสถิติเกี่ยวกับการกระจายตัวของคนงานในองค์กรตามระยะเวลาการทำงานในปี 2543 ให้ผลลัพธ์ดังต่อไปนี้ (ตารางที่ 2.7)

ตารางที่ 2.7

ในปี พ.ศ. 2545 ได้มีการสังเกตทางสถิติซ้ำแล้วซ้ำอีก ซึ่งให้ผลลัพธ์ดังต่อไปนี้ (ตารางที่ 2.8) ไม่สามารถประเมินการเปลี่ยนแปลงการกระจายตัวของคนงานตามระยะเวลาการทำงานมากกว่า 2 ปีได้โดยตรงจากข้อมูลในทั้งสองตาราง การวิเคราะห์ทั้งสองตารางแสดงให้เห็นว่าไม่สอดคล้องกันเนื่องจากจำนวนกลุ่มและขนาดช่วงเวลาต่างกัน

ตารางที่ 2.8

หากต้องการนำข้อมูลจากทั้งสองตารางมาอยู่ในรูปแบบที่เทียบเคียงได้ คุณสามารถรวมทั้งกลุ่ม 1 และ 2 และกลุ่ม 3 และ 4 ในตาราง 2.7 ได้ สิ่งนี้จะทำให้สามารถประเมินการเปลี่ยนแปลงในการกระจายตัวของคนงานตามระยะเวลาการทำงานที่เกิดขึ้นในองค์กรในช่วงสองปี ผลลัพธ์ของการจัดกลุ่มข้อมูลการสังเกตทางสถิติใหม่สำหรับปี 2000 (ตารางที่ 2.7) แสดงไว้ในตารางที่ 2.9

ตารางที่ 2.9

เมื่อเปรียบเทียบข้อมูลสำหรับปี 2545 (ตาราง 2.8) กับข้อมูลที่จัดกลุ่มใหม่สำหรับปี 2543 (ตาราง 2.9) เราสามารถสรุปได้: ในสองปีจำนวนคนงานที่มีประสบการณ์สูงสุด 6 ปีลดลงเช่น อายุน้อยและจำนวนคนทำงานที่มีประสบการณ์เพิ่มมากขึ้น

วิธีที่ 2ให้การสังเกตทางสถิติในปี พ.ศ. 2545 ให้ผลลัพธ์ดังนี้ (ตารางที่ 2.10) เมื่อเปรียบเทียบข้อมูลสำหรับปี 2000 (ตาราง 2.9) และข้อมูลสำหรับปี 2002 (ตาราง 2.7) เราสามารถสรุปได้ว่าข้อมูลเหล่านี้เข้ากันไม่ได้เนื่องจากจำนวนกลุ่มต่างกันและขนาดช่วงเวลาต่างกัน การวิเคราะห์แสดงให้เห็นว่าการใช้วิธีเดียวในการนำข้อมูลมาสู่รูปแบบที่เทียบเคียงนั้นเป็นไปไม่ได้ ดังนั้นเราจึงใช้วิธีที่ 2 จัดกลุ่มข้อมูลปี 2543 ใหม่ (ตาราง 2.7) เพื่อให้สอดคล้องกับการจัดกลุ่มข้อมูลปี 2545 (ตาราง 2.10)

ตารางที่ 2.10

การใช้วิธีที่สองถือว่าการกระจายความถี่สม่ำเสมอภายในแต่ละกลุ่ม นี่เป็นข้อกำหนดเบื้องต้นสำหรับการใช้วิธีการที่สอง หากต้องการจัดกลุ่มข้อมูลใหม่สำหรับปี 2000 (ตาราง 2.7) เราจะทำการคำนวณดังต่อไปนี้ ดังนั้นกลุ่มแรกใหม่ (1-4) (ตาราง 2.10) จะรวมข้อมูลทั้งหมดจากกลุ่มแรกเก่า (1-3) (ตาราง 22.7) และข้อมูลจำนวนคนงานที่มีประสบการณ์ 4 ปีจากกลุ่มที่สองเก่า . จำนวนคนงานที่มีประสบการณ์ 4 ปีคือ 3 (9/3=3 เนื่องจากมีคนงาน 9 คนในกลุ่มที่สองแบบเก่า และช่วงเวลาคือ 3) ดังนั้น กลุ่มแรกใหม่ (1-4) จะรวมคนงาน 18 คน (18=15+3) กลุ่มใหม่ที่สอง (5-8) จะรวมคนงาน 6 คน มีประสบการณ์ 5, 6 ปี (จากกลุ่มที่สองเก่า 6= 9/ 3·2) และคนงาน 18 คนที่มีประสบการณ์ 7, 8 ปี (จากกลุ่มที่สามเก่า 18=27/3·2) ดังนั้นกลุ่มที่สองใหม่ (5-8) จะรวมคนงาน 24 คน (24=6+ 18) กลุ่มที่สามใหม่ (9-12) จะรวมคนงานที่มีประสบการณ์ 9 ปี (9=27/3) และพนักงานทั้งหมด 9 คนจากกลุ่มที่สี่เก่า (10-12) ดังนั้นในกลุ่มที่สามใหม่ (9-12) จะมีคนงาน 18 คน (18=9+9) เราจะรวมข้อมูลที่จัดกลุ่มใหม่สำหรับปี 2000 และข้อมูลสำหรับปี 2002 ไว้ในตารางเดียว (2.11) ซึ่งจะช่วยให้สามารถวิเคราะห์เปรียบเทียบได้

ตารางที่ 2.11

การวิเคราะห์การกระจายตัวของคนงานในองค์กรตามระยะเวลาการทำงาน (ตาราง 2.11) แสดงให้เห็นว่าในปี 2545 จำนวนคนงานที่มีประสบการณ์มากกว่า (จาก 9 เป็น 12 ปี) เพิ่มขึ้น และผู้ที่มีประสบการณ์น้อยกว่า (จาก 1 เป็น 8 ปี) ลดลง ดังนั้น การจัดกลุ่มข้อมูลใหม่ทำให้สามารถนำข้อมูลมาอยู่ในรูปแบบที่เปรียบเทียบได้ ดำเนินการวิเคราะห์ และสรุปผลที่จำเป็นได้

คำถามเพื่อความปลอดภัยและงานต่างๆ

1.การสังเกตทางสถิติคืออะไร? ต้องปฏิบัติตามเงื่อนไขใดบ้างเมื่อดำเนินการสังเกตทางสถิติ (ดูคำจำกัดความ)

2. การสังเกตทางสถิติสามารถจำแนกตามเกณฑ์ใด? ยกตัวอย่างการสังเกตทางสถิติ

3. มีข้อผิดพลาดอะไรบ้างที่เกิดขึ้นเมื่อทำการสังเกตทางสถิติ และวิธีการควบคุมที่สามารถใช้ได้?

4. พิจารณาว่าตัวอย่างใดมีการสรุปอย่างง่าย และตัวอย่างใดที่มีการสรุปที่ซับซ้อน ตัวอย่างที่ 1 ในวันจันทร์ คนงาน 200 คนทำงานในโรงทอผ้า ตัวอย่างที่ 2 ในวันจันทร์ คนงานหญิง 40 คนทำงานในโรงทอผ้าที่ไซต์งานหมายเลข 1 คนงานหญิง 60 คนในไซต์หมายเลข 2 และคนงานหญิงทั้งหมด 100 คนทำงาน

5. การจัดกลุ่มใดที่ใช้ในการประมวลผลข้อมูลทางสถิติ? พวกเขาแตกต่างกันอย่างไร?

6. หัวหน้าฝ่ายเทคโนโลยีมีพนักงาน 15 คน และฝ่ายการตลาดและการขายมีพนักงาน 10 คน ในกรณีใดทีมงานแผนกเป็นประชากรเนื้อเดียวกัน และในกรณีใดบ้างที่พวกเขาเป็นประชากรต่างกัน

7. ยอดขายรายวันของรายการผ้า A ในร้านผ้าในเดือนตุลาคมมีลักษณะเป็นข้อมูลต่อไปนี้ (เป็นเมตร): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9 , 5, 10 , 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. จัดกลุ่มข้อมูลโดยใช้ช่วงเวลาที่เท่ากัน

8. จัดกลุ่มผลลัพธ์ของการจัดกลุ่มข้อมูลจากจุดที่ 7 ใหม่เป็นกลุ่มต่อไปนี้: (3-9), (9-15), 15-21)

หัวข้อที่ 3 ชุดการกระจายทางสถิติ ตาราง กราฟิก

3.1 ชุดการแจกแจงทางสถิติ - แนวคิด ประเภท รูปแบบการนำเสนอ

รูปแบบหนึ่งของการนำเสนอข้อมูลการสังเกตทางสถิติคือชุดการแจกแจงทางสถิติ อนุกรมทางสถิติ การกระจายคือการจัดเรียงหน่วยประชากรออกเป็นกลุ่มตามลักษณะการจัดกลุ่มตามลำดับด้วยความช่วยเหลือของชุดการแจกแจงทางสถิติ คุณสามารถศึกษาโครงสร้างและขอบเขตของการเปลี่ยนแปลงประชากร ประเมินความเป็นเนื้อเดียวกัน และกำหนดรูปแบบการพัฒนาหน่วยประชากรได้ โดยรูปลักษณ์ภายนอก ชุดสถิติการแจกแจงแบ่งออกเป็นคุณลักษณะ รูปแบบ และอนุกรมเวลา

อนุกรมที่แสดงที่มาและแปรผันประกอบด้วยสององค์ประกอบ: การแปรผันและความถี่ (ความถี่หรือความหนาแน่น) ตัวเลือก() – นี่คือค่าเฉพาะของแอตทริบิวต์ที่ใช้ในซีรีย์การแจกจ่าย ความถี่ () - นี้ จำนวนสัมบูรณ์แสดงจำนวนครั้ง (บ่อยแค่ไหน) ที่ค่าเฉพาะของคุณลักษณะ (ตัวแปร) เกิดขึ้นในประชากร หรือจำนวนหน่วยของประชากรที่มีค่าเฉพาะของคุณลักษณะ (ตัวแปร) ความถี่() – นี่คือค่าสัมพัทธ์ที่กำหนดส่วนแบ่งของตัวเลือกแต่ละรายการในปริมาณรวมของประชากร ()ความถี่สามารถแสดงเป็นเศษส่วนได้ ซึ่งในกรณีนี้ปริมาตรของประชากรจะเท่ากับหนึ่ง () หรือเป็นเปอร์เซ็นต์ ซึ่งในกรณีนี้ปริมาตรของประชากรจะเท่ากับ 100% () โดยทั่วไปจะมีการคำนวณความถี่ ดังต่อไปนี้

ปริมาณประชากรอยู่ที่ไหน

ความหนาแน่น() เป็นค่าสัมพัทธ์ที่แสดงจำนวนหน่วยของประชากร (ในรูปแบบสัมบูรณ์หรือสัมพัทธ์) ต่อความยาวหน่วยของช่วงกลุ่ม ()ความหนาแน่นอาจเป็นแบบสัมบูรณ์หรือแบบสัมพัทธ์ก็ได้ ความหนาแน่นสัมบูรณ์ เท่ากับ

ความหนาแน่นสัมพัทธ์เท่ากับ

เมื่อคำนวณความหนาแน่นสัมพัทธ์ จะใช้ความถี่โดยแสดงเป็นเศษส่วน

ซีรี่ส์ที่มีคุณลักษณะเป็นชุดที่สร้างขึ้นบนพื้นฐานของคุณลักษณะเชิงคุณภาพของประชากรซีรีส์เหล่านี้สร้างขึ้นโดยใช้การจัดกลุ่มประเภทและสามารถแสดงเป็นตารางได้ ตัวอย่างเช่นการกระจายตัวของผู้ปฏิบัติงานตามประเภทภาษี (ตารางที่ 3.1)

ตารางที่ 3.1

ในตัวอย่างที่ให้มา (ตารางที่ 3.1) จำนวนทั้งสิ้นคือคนงานทั้งหมดขององค์กร ขนาดประชากร 250 คน หน่วยประชากรคือคนงานหนึ่งคน หมวดหมู่ภาษีถูกเลือกเป็นลักษณะของหน่วยประชากร คุณลักษณะนี้มีความหมายเฉพาะหลายประการ - ตัวแปร (หมวดที่ 1, หมวดที่ 2, หมวดที่ 3, หมวดที่ 4, หมวดที่ 5) ในตาราง ค่าแอตทริบิวต์จะได้รับในคอลัมน์ 2 ค่าความถี่ในคอลัมน์ 3 และค่าความถี่ในคอลัมน์ 4

ซีรี่ส์รูปแบบต่างๆเป็นชุดที่สร้างขึ้นบนพื้นฐานของคุณลักษณะเชิงปริมาณของประชากรซีรีส์เหล่านี้สร้างขึ้นโดยใช้การจัดกลุ่มโครงสร้างเป็นหลัก และสามารถแสดงเป็นตารางได้ ซีรีย์รูปแบบมีสองประเภท: ซีรีย์รูปแบบแยกและซีรีย์ช่วง ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง – นี่คือชุดค่าของคุณลักษณะ (ตัวเลือก) ที่แสดงด้วยค่าที่ไม่ต่อเนื่อง. อนุกรมความแปรผันของช่วง – นี่คือชุดที่แสดงค่าของคุณลักษณะเป็นช่วงเวลา- อ้างอิงจากข้อมูลการหมุนเวียน 34 รายวัน ผู้ประกอบการแต่ละรายที่ให้ไว้ในหน้า เราจะสร้างรูปแบบต่างๆ ซีรีย์ช่วงเวลา(ตารางที่ 3.2)

ตารางที่ 3.2

คอลัมน์ที่ 3 แสดงความถี่ - จำนวนผู้ประกอบการที่ผลประกอบการหนึ่งวันอยู่ในช่วงที่กำหนด (คอลัมน์ที่ 2) คอลัมน์ 4 คำนวณความถี่เป็นเปอร์เซ็นต์โดยใช้สูตร 3.1 ดังนั้นความถี่ของกลุ่มแรก (3.1 – 3.9) จะเท่ากับ

ความถี่จะถูกคำนวณเช่นเดียวกันสำหรับกลุ่มอื่นๆ คอลัมน์ 5 แสดงความถี่ในการแชร์ สามารถรับได้โดยการคำนวณ

หรือโดยการแปลงเปอร์เซ็นต์เป็นหุ้น เมื่อทำการคำนวณต้องแสดงข้อมูลในรูปแบบทศนิยมด้วยความแม่นยำสูงสุด 3 ตำแหน่ง ซึ่งจะช่วยปรับปรุงความแม่นยำในการคำนวณและการผลิตข้อมูลขั้นสุดท้ายที่เหมาะสม ดังนั้นผลรวมของความถี่เป็นเปอร์เซ็นต์ควรเท่ากับ 100% และเป็นเศษส่วน – เท่ากับ 1

คอลัมน์ที่ 6 ของตาราง 3.2 แสดงค่าความหนาแน่นสัมบูรณ์ การคำนวณดำเนินการตามสูตร 3.2 ดังนั้นสำหรับกลุ่มแรก ความหนาแน่นสัมบูรณ์จะเท่ากับ

หากนำความถี่ () จากคอลัมน์ 3 ค่าของช่วงเวลา () จะถูกกำหนดให้เป็นความแตกต่างระหว่างขีดจำกัดบน (3.9) และขีดจำกัดล่าง (3.1) ของช่วงเวลาของกลุ่มแรก เช่น - ความหนาแน่นสัมบูรณ์สำหรับกลุ่มอื่นๆ จะคำนวณในลักษณะเดียวกัน หลังจากทำการคำนวณแล้วคุณจะต้องให้พวกเขา การตีความทางเศรษฐกิจ- ตัวอย่างเช่น ความหนาแน่นสัมบูรณ์ของกลุ่มแรกบ่งชี้ว่าทุกๆ พันรูเบิล มูลค่าการซื้อขายในกลุ่มแรกมีผู้ประกอบการ 5 ราย

คอลัมน์ที่ 7 ของตาราง 3.2 แสดงค่าความหนาแน่นสัมพัทธ์ การคำนวณดำเนินการตามสูตร 3.3 ดังนั้นกลุ่มแรกความหนาแน่นสัมพัทธ์จะเท่ากับ

ความหนาแน่นสัมพัทธ์ได้รับการคำนวณในลักษณะเดียวกันสำหรับกลุ่มอื่นๆ ความหนาแน่นสัมพัทธ์ของกลุ่มแรกแสดงให้เห็นว่าส่วนแบ่งของผู้ประกอบการที่มาต่อรายได้ทุกๆ พันรายในกลุ่มแรกคือ 0.147

คอลัมน์ที่ 2 ของตาราง 3.3 นำเสนอมูลค่าการซื้อขายในรูปแบบของช่วงเวลา และคอลัมน์ 3 นำเสนอมูลค่าการซื้อขายในรูปแบบของค่าที่ไม่ต่อเนื่อง สำหรับกลุ่มแรกจะมีการคำนวณค่าแยกดังนี้

มูลค่าการซื้อขายจะคำนวณในลักษณะเดียวกับมูลค่าแยกสำหรับกลุ่มอื่นๆ

บ่อยครั้งเมื่อวิเคราะห์ชุดการแปรผัน จำเป็นต้องเข้าใจการเปลี่ยนแปลงในปริมาณของประชากรเมื่อเปลี่ยนค่าของคุณลักษณะ (โดยส่วนใหญ่จะเรียงลำดับจากน้อยไปหามาก) เพื่อจุดประสงค์นี้ จะใช้แนวคิดต่างๆ เช่น ความถี่สะสมหรือความถี่สะสม ความถี่สะสม ( )– นี่คือผลรวมของความถี่ของอนุกรมแรกจนถึงและรวมถึงค่าหนึ่งของลักษณะเฉพาะด้วย ความถี่สะสม คือผลรวมของความถี่ตั้งแต่เริ่มต้นซีรีส์จนถึงค่าหนึ่งของแอตทริบิวต์ลองพิจารณาค้นหาค่าของตัวบ่งชี้เหล่านี้ตามข้อมูลในตาราง 3.4 ในคอลัมน์ที่ 6 ของตาราง 3.4 แสดงความถี่สะสม ในกลุ่มแรก (กลุ่มที่ 1) ผู้ประกอบการ 4 ราย (กลุ่มที่ 4) มีมูลค่าการซื้อขาย 3.1 ถึง 3.9 พันรูเบิล (คอลัมน์ 2) หรือมูลค่าการซื้อขายเฉลี่ย 3.5 พันรูเบิล (กรัม 3) เนื่องจากเป็นกลุ่มแรกความถี่สะสมคือ จำนวนผู้ประกอบการจะเท่ากับ 4 (คอลัมน์ 6) ในกลุ่มที่สองคือจำนวนผู้ประกอบการที่มีมูลค่าการซื้อขาย 3.9 ถึง 4.7 พันรูเบิล หรือมูลค่าการซื้อขายเฉลี่ย 4.3 พันรูเบิล เท่ากับ 5 คน ดังนั้นความถี่สะสมคือ จำนวนผู้ประกอบการที่มีมูลค่าการซื้อขาย 3.1 ถึง 4.7 พันรูเบิล หรือโดยเฉลี่ยจากและน้อยกว่า 4.3 พันรูเบิล จะเท่ากับ 9=4+5 กลุ่มที่ 3 ความถี่สะสมจะเป็น 16=4+5+7 เป็นต้น ความถี่สะสมจะคำนวณในลักษณะเดียวกัน

การจัดกลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับวัตถุที่แตกต่างกัน หรือในทางกลับกัน สำหรับวัตถุหนึ่ง แต่มากกว่าสอง ช่วงเวลาที่แตกต่างกันเวลาอาจกลายเป็นสิ่งที่หาที่เปรียบมิได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกันหรือความแตกต่างในขอบเขตของช่วงเวลา
การจัดกลุ่มรองหรือการจัดกลุ่มใหม่ของข้อมูลที่จัดกลุ่มถูกนำมาใช้ ลักษณะที่ดีขึ้นปรากฏการณ์ที่กำลังศึกษา (กรณีที่การจัดกลุ่มครั้งแรกไม่ระบุลักษณะการกระจายตัวของหน่วยประชากรอย่างชัดเจน) หรือนำการจัดกลุ่มมาเป็นประเภทที่เทียบเคียงกันเพื่อดำเนินการได้ การวิเคราะห์เปรียบเทียบ.
การจัดกลุ่มรองคือการดำเนินการเพื่อสร้างกลุ่มใหม่โดยยึดตามการจัดกลุ่มที่ดำเนินการก่อนหน้านี้
มีสองวิธีในการสร้างกลุ่มใหม่ วิธีแรก ง่ายที่สุดและพบบ่อยที่สุดคือการเปลี่ยน (โดยปกติจะขยาย) ช่วงเวลาเริ่มต้น วิธีที่สองเรียกว่าการจัดกลุ่มใหม่แบบเศษส่วนและประกอบด้วยการก่อตัวของกลุ่มใหม่โดยพิจารณาจากการกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม ให้เราอธิบายเทคนิคการจัดกลุ่มรองด้วยตัวอย่างต่อไปนี้
ตัวอย่าง:
การกระจายตัวของพนักงานบริษัทตามระดับรายได้

เราจะจัดกลุ่มข้อมูลใหม่โดยสร้างกลุ่มใหม่โดยมีช่วงเวลาสูงสุด 5, 5-10, 10-20, 20-30, มากกว่า 30,000 รูเบิล
กลุ่มใหม่กลุ่มแรกจะรวมพนักงานกลุ่มแรกทั้งหมดและส่วนหนึ่งของกลุ่มที่สอง หากต้องการสร้างกลุ่มมากถึง 5,000 รูเบิล คุณต้องรับ 1.0,000 รูเบิลจากช่วงเวลาของกลุ่มที่สอง ค่าของช่วงเวลาของกลุ่มนี้คือ 6.0 พันรูเบิล ดังนั้นจึงจำเป็นต้องแยกส่วนออกมา 1/6 (1.0:6.0) ส่วนที่คล้ายกันในกลุ่มแรกที่จัดตั้งขึ้นใหม่จะต้องนำมาจากจำนวนคนงานนั่นคือ
20x1 = 3 คน จากนั้นในกลุ่มแรกจะมีคนงาน: 16+3 = 19 คน
6
กลุ่มใหม่ที่สองก่อตั้งขึ้นโดยผู้ที่ทำงานในกลุ่มที่สองลบกลุ่มที่ได้รับมอบหมายให้เป็นกลุ่มแรกนั่นคือ 20-3 = 17 คน กลุ่มที่สามที่จัดตั้งขึ้นใหม่จะประกอบด้วยพนักงานทั้งหมดของกลุ่มที่สามและพนักงานบางส่วนในกลุ่มที่สี่ ในการกำหนดส่วนนี้จากช่วงเวลา 18-30 (ความกว้างของช่วงเวลาคือ 12) คุณต้องเพิ่ม 2.0 ไปยังส่วนก่อนหน้า (เพื่อให้ขีด จำกัด บนของช่วงเวลาเท่ากับ 2.0 พันรูเบิล) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเวลาส่วนหนึ่งเป็น กลุ่มนี้มี 74 คน ซึ่งหมายความว่าเราต้องเอา 74x(1:6) = 12 คน กลุ่มที่สามใหม่จะรวม 44+12 = 56 คน กลุ่มที่สี่ที่ตั้งขึ้นใหม่จะรวม 74-12 = 62 คนที่เหลืออยู่จากกลุ่มที่สี่ก่อนหน้า ที่ห้าอีกครั้ง กลุ่มการศึกษาจะเป็นคนงานที่ห้าและหกของกลุ่มก่อนหน้านี้: 37+9 = 46 คน
เป็นผลให้เราได้รับกลุ่มใหม่ดังต่อไปนี้:

ข้อมูลเพิ่มเติมในหัวข้อการเปรียบเทียบการจัดกลุ่มทางสถิติ การจัดกลุ่มรอง:

1.3. การสังเกตและสรุปทางสถิติ การจัดกลุ่มวัสดุการสังเกตทางสถิติ
10.2. การสังเกตทางสถิติและการบัญชีในองค์กรของอุตสาหกรรมต่างๆ ข้อมูลและความสามารถในการวิเคราะห์ของการรายงานทางสถิติ

กลุ่มที่สร้างขึ้นในช่วงเวลาเดียวกัน แต่สำหรับวัตถุที่แตกต่างกัน หรือในทางกลับกัน สำหรับวัตถุหนึ่งชิ้น แต่ในช่วงเวลาที่แตกต่างกันสองช่วง อาจกลายเป็นสิ่งที่ไม่มีที่เปรียบได้เนื่องจากจำนวนกลุ่มที่เลือกต่างกัน หรือขอบเขตของช่วงเวลาที่ไม่เท่ากัน .

การจัดกลุ่มทุติยภูมิหรือการจัดกลุ่มข้อมูลที่จัดกลุ่มใหม่ใช้เพื่อระบุลักษณะปรากฏการณ์ที่กำลังศึกษาได้ดีขึ้น (ในกรณีที่การจัดกลุ่มเริ่มแรกไม่ได้ระบุลักษณะของการกระจายตัวของหน่วยประชากรอย่างชัดเจน) หรือเพื่อจัดกลุ่มให้เป็นประเภทที่เทียบเคียงได้สำหรับ วัตถุประสงค์ของการวิเคราะห์เปรียบเทียบ

การจัดกลุ่มรอง- นี่คือการดำเนินการเพื่อจัดตั้งกลุ่มใหม่บนพื้นฐานของการจัดกลุ่มที่ดำเนินการก่อนหน้านี้

มีสองวิธีในการสร้างกลุ่มใหม่ วิธีแรกที่ง่ายที่สุดและพบบ่อยที่สุดคือ การเปลี่ยนแปลง (โดยปกติจะเป็นการขยาย) ของช่วงเวลาเริ่มต้น วิธีที่สองเรียกว่า แบ่งปันการจัดกลุ่มใหม่ ประกอบด้วยการก่อตัวของกลุ่มใหม่บนพื้นฐานของการกำหนดสัดส่วนหน่วยในประชากรให้กับแต่ละกลุ่ม ให้เราอธิบายเทคนิคการจัดกลุ่มรองด้วยตัวอย่าง (ตาราง 3.14)

ตารางที่ 3.14. การกระจายตัวของรัฐวิสาหกิจ ขายปลีกหนึ่งในเมืองของภูมิภาคมอสโกโดยจำนวนพนักงานเฉลี่ยต่อปีในปี 2554*

* ข้อมูลมีเงื่อนไข

เราจะจัดกลุ่มข้อมูลใหม่ โดยสร้างกลุ่มใหม่ในช่วงเวลาสูงสุด 5, 5-10, 10-20, 20-30, 30 คนขึ้นไป

กลุ่มใหม่กลุ่มแรกจะรวมกลุ่มธุรกิจค้าปลีกกลุ่มแรกทั้งหมดและเป็นส่วนหนึ่งของกลุ่มที่สอง หากต้องการรวมกลุ่มไม่เกินห้าคน คุณจะต้องรับหนึ่งคนจากช่วงเวลาของกลุ่มที่สอง ขนาดของช่วงเวลาสำหรับกลุ่มนี้คือหกคน ดังนั้นจึงจำเป็นต้องเอา 1/6 ของมัน ส่วนที่คล้ายกันในกลุ่มแรกที่จัดตั้งขึ้นใหม่จะต้องนำมาจากจำนวนวิสาหกิจ ได้แก่ 20 -= 3 องค์กร 6

จากนั้นในกลุ่มวิสาหกิจการค้าปลีกกลุ่มแรกจะมี 16 + 3 = 19 หน่วย

กลุ่มใหม่ที่สองก่อตั้งขึ้นโดยวิสาหกิจการค้าปลีกของกลุ่มที่สองลบด้วยกลุ่มที่จัดเป็นกลุ่มแรกนั่นคือ 20 - 3 = 17 องค์กร กลุ่มที่สามที่ก่อตั้งขึ้นใหม่จะรวมถึงวิสาหกิจทั้งหมดของกลุ่มที่สามและเป็นส่วนหนึ่งของวิสาหกิจในกลุ่มที่สี่ ในการกำหนดส่วนนี้ของช่วงเวลา 18 30 (ความกว้างของช่วงเวลาคือ 12) คุณต้องเพิ่ม 2.0 ไปยังส่วนก่อนหน้า (เพื่อให้ขีดจำกัดบนของช่วงเวลาเท่ากับ 20 คน) ดังนั้นจึงจำเป็นต้องแบ่งช่วงเป็น 2/12 = 1/6 กลุ่มนี้มี 74 วิสาหกิจ ซึ่งหมายความว่าเราต้องเลือก 74 (1/6) = 12 วิสาหกิจ กลุ่มที่สามใหม่จะรวม 44 + 12 = 56 องค์กร

กลุ่มที่สี่ที่จัดตั้งขึ้นใหม่จะรวม 74 - 12 = = 62 องค์กรที่เหลืออยู่จากกลุ่มที่สี่ก่อนหน้า กลุ่มที่ห้าที่จัดตั้งขึ้นใหม่จะประกอบด้วยวิสาหกิจการค้าปลีกของกลุ่มที่ห้าและหกก่อนหน้านี้: 37 + 9 = 46 วิสาหกิจ

เป็นผลให้เราได้กลุ่มใหม่ (ตาราง 3.15)

ตารางที่ 3.15. การกระจายตัวของวิสาหกิจการค้าปลีกในเมืองใดเมืองหนึ่งของภูมิภาคมอสโกตามจำนวนพนักงานเฉลี่ยต่อปีในปี 2554 หลังจากการจัดกลุ่มข้อมูลใหม่*

* ข้อมูลมีเงื่อนไข

ตารางสถิติ: สาระสำคัญ องค์ประกอบ และการจำแนกประเภท

ตารางสถิติเป็นรูปแบบการนำเสนอเนื้อหาทางสถิติที่มีเหตุผล มองเห็นได้ และกะทัดรัดที่สุด รวมถึงผลลัพธ์ การจัดกลุ่มทางสถิติ- อย่างไรก็ตาม ไม่ใช่ทุกตารางจะมีสถิติ ตารางสูตรคูณหรือแบบสอบถามเชิงสำรวจทางสังคมวิทยาอาจอยู่ในรูปแบบตาราง แต่ยังไม่ใช่ตารางทางสถิติ

ตารางสถิติเป็นตารางที่มีลักษณะตัวเลขสรุปของประชากรที่กำลังศึกษาตั้งแต่หนึ่งรายการขึ้นไป คุณสมบัติที่สำคัญเชื่อมโยงกันด้วยตรรกะของการวิเคราะห์ทางเศรษฐศาสตร์

องค์ประกอบหลักของตารางสถิติที่ประกอบเป็นโครงกระดูก (ฐาน) แสดงในแผนภาพ 3.1

แบบตารางเป็นรูปแบบการจัดเรียงข้อมูลตัวเลขโดยตัวเลขจะอยู่ที่จุดตัดของส่วนหัวที่กำหนดไว้อย่างชัดเจนตามแนวคอลัมน์แนวตั้งเรียกว่า นับ, และชื่อตามแถบแนวนอนที่สอดคล้องกัน - เส้น. ดังนั้น ภายนอกตารางจึงเป็นจุดตัดของกราฟและแถวที่ประกอบกันเป็นโครงกระดูกของตาราง

ตารางสถิติประกอบด้วยส่วนหัวสามประเภท: ทั่วไป ด้านบน และด้านข้าง ชื่อทั่วไป สะท้อนถึงเนื้อหาของตารางทั้งหมด (เกี่ยวข้องกับสถานที่และเวลา) ซึ่งอยู่เหนือเค้าโครงตารางตรงกลางและเป็นส่วนหัวภายนอก หัวเรื่องยอดนิยม กำหนดลักษณะเนื้อหาของกราฟ (ส่วนหัวของภาคแสดง) และ ด้านข้าง (หัวเรื่อง) - บรรทัด. ทำหน้าที่เป็นหัวข้อภายใน

กรอบโต๊ะที่เต็มไปด้วยส่วนหัวสร้างเค้าโครงตาราง หากคุณเขียนตัวเลขที่จุดตัดของกราฟและเส้น คุณจะได้ตารางสถิติที่สมบูรณ์ ชื่อตาราง (ชื่อทั่วไป)

โครงการ 3.1 โครงกระดูก (ฐาน) ของตารางสถิติ

สื่อดิจิทัลสามารถแสดงได้ในรูปแบบสัมบูรณ์ ( ทุนจดทะเบียน, ปริมาณของสินค้านวัตกรรม ฯลฯ ) ความสัมพันธ์ (GDP ต่อหัว จำนวนคอมพิวเตอร์ส่วนบุคคลต่อคนงาน 100 คน เป็นต้น) และมูลค่าเฉลี่ย (ราคาหุ้นเฉลี่ย ผลผลิตนมเฉลี่ยต่อวัว ฯลฯ)

ตารางอาจมีหมายเหตุประกอบหากจำเป็น หัวข้อ วิธีการคำนวณตัวบ่งชี้บางตัว แหล่งข้อมูล ฯลฯ

ในแง่ของเนื้อหาเชิงตรรกะ ตารางนี้เป็น "ประโยคทางสถิติ" ซึ่งมีองค์ประกอบหลักคือหัวเรื่องและภาคแสดง

เรื่องวัตถุที่มีลักษณะเป็นตัวเลขเรียกว่า นี่อาจเป็นการรวมหนึ่งรายการขึ้นไป แต่ละหน่วยของการรวมตามลำดับรายการหรือจัดกลุ่มตามลักษณะบางอย่าง หน่วยอาณาเขต ฯลฯ โดยปกติแล้วหัวเรื่องของตารางจะระบุไว้ทางด้านซ้ายในชื่อของแถว

ภาคแสดงสร้างระบบตัวบ่งชี้ที่กำหนดลักษณะวัตถุประสงค์ของการศึกษาเช่น เรื่องของตาราง ภาคแสดงจะสร้างส่วนหัวบนสุดและประกอบขึ้นเป็นเนื้อหาของกราฟโดยมีการจัดเรียงตัวบ่งชี้ตามลำดับตรรกะจากซ้ายไปขวา

ตำแหน่งของเรื่องและภาคแสดงในบางกรณีสามารถสลับเพื่อให้สมบูรณ์ยิ่งขึ้น และ วิธีที่ดีที่สุดการอ่านและวิเคราะห์ข้อมูลเบื้องต้นเกี่ยวกับประชากรที่กำลังศึกษา

ตามโครงสร้างของเรื่องตารางสถิติที่เรียบง่ายและซับซ้อนนั้นขึ้นอยู่กับการจัดกลุ่มหน่วยในนั้น

เรียบง่าย เรียกว่าตารางสถิติ โดยหัวเรื่องจะให้รายการวัตถุหรือ หน่วยดินแดน- ตารางสถิติอย่างง่ายแบ่งออกเป็นแบบ monographic และแบบรายการ

ตารางโมโนแกรม ไม่ได้กำหนดลักษณะของหน่วยทั้งชุดของวัตถุที่กำลังศึกษา แต่มีเพียงหน่วยเดียวหรือกลุ่มที่ระบุตามลักษณะเฉพาะ (ตารางที่ 3 .16).

ตารางที่ 3.16. การว่าจ้างสิ่งอำนวยความสะดวกทางสังคมและวัฒนธรรมในหน่วยงานที่เป็นองค์ประกอบของสหพันธรัฐรัสเซียในปี 2552

ตารางรายการ เรียกว่าตารางที่มีหัวเรื่องประกอบด้วยรายการวัตถุหรือหน่วยของวัตถุที่กำลังศึกษา (ตารางที่ 3.17)

ตารางสถิติที่ซับซ้อน ตรงกันข้ามกับสิ่งธรรมดา ๆ พวกเขาทำให้สามารถระบุประเภททางเศรษฐกิจและสังคมของปรากฏการณ์ที่กำลังศึกษา โครงสร้างของพวกเขาตลอดจนความสัมพันธ์และการพึ่งพาซึ่งกันและกันระหว่างคุณลักษณะที่มีลักษณะเฉพาะ ปัญหาเหล่านี้สามารถแก้ไขได้อย่างสมบูรณ์ยิ่งขึ้นโดยใช้กลุ่มและโดยเฉพาะตารางรวม

กลุ่ม เรียกว่าตารางสถิติ ซึ่งมีการจัดกลุ่มหน่วยประชากรตามคุณลักษณะเชิงปริมาณหรือคุณลักษณะเดียว

ตารางกลุ่มประเภทที่ง่ายที่สุดคือแถวการแจกจ่าย ตารางกลุ่มอาจซับซ้อนกว่านี้หากภาคแสดงมีตัวบ่งชี้เพิ่มเติมจำนวนหนึ่งที่แสดงลักษณะกลุ่มของเรื่อง ตารางดังกล่าวมักใช้เพื่อเปรียบเทียบตัวบ่งชี้ทั่วไปตามกลุ่ม (ตารางที่ 3.18)

ตารางที่ 3.17. การรับการลงทุนจากต่างประเทศในเศรษฐกิจรัสเซียไปยังประเทศนักลงทุนหลักในปี 2552

กลุ่มประชากรแยกตามอายุปี	ทั้งหมด	รวมทั้ง
กลุ่มประชากรแยกตามอายุปี	ทั้งหมด	ผู้ชาย	ผู้หญิง

ดังนั้นตารางกลุ่มทำให้สามารถระบุและจำแนกประเภทของปรากฏการณ์ทางเศรษฐกิจและสังคมและโครงสร้างได้ขึ้นอยู่กับลักษณะเฉพาะเพียงประการเดียว

การรวมกัน เรียกว่าตารางสถิติซึ่งมีการจัดกลุ่มหน่วยประชากรพร้อมกันตามลักษณะสองอย่างขึ้นไป: แต่ละกลุ่มที่สร้างขึ้นตามลักษณะเดียวจะถูกแบ่งออกเป็นกลุ่มย่อยตามลักษณะอื่น ๆ เป็นต้น (ตารางที่ 3.19)

ตารางที่ 3.19. การจัดกลุ่มอพาร์ทเมนท์ที่สร้างเสร็จในอาคารพักอาศัยตามจำนวนห้องและขนาดเฉลี่ย

ตารางที่ 3.18. การกระจายจำนวนผู้มีงานทำในเศรษฐกิจรัสเซียตามกลุ่มอายุ ณ สิ้นเดือนพฤศจิกายน 2552 % ของทั้งหมด

หัวเรื่องในตารางคือกลุ่มของอพาร์ทเมนต์ที่สร้างขึ้นตามจำนวนห้องและขนาดเฉลี่ย

ตารางรวมช่วยให้คุณสามารถระบุลักษณะกลุ่มทั่วไปที่ระบุด้วยคุณลักษณะหลายประการและความสัมพันธ์ระหว่างกลุ่มเหล่านั้น ลำดับของการแบ่งหน่วยประชากรออกเป็นกลุ่มเนื้อเดียวกันตามลักษณะจะพิจารณาจากความสำคัญของหน่วยใดหน่วยหนึ่งในการรวมกันหรือตามลำดับที่ศึกษา

ภาคแสดงของตารางสถิติดังที่ได้กล่าวไปแล้วประกอบด้วยตัวบ่งชี้ที่เป็นลักษณะของวัตถุที่กำลังศึกษา

ขึ้นอยู่กับโครงสร้างของภาคแสดง ตารางสถิติที่เรียบง่ายและซับซ้อนมีความโดดเด่น

ที่ การพัฒนาภาคแสดงอย่างง่าย คุณสมบัติที่นำเสนอในนั้นจะไม่ตัดกันและรับค่าสุดท้ายโดยการรวมค่าสำหรับแต่ละคุณสมบัติแยกกันโดยแยกจากกัน ตัวอย่างของการพัฒนาเพรดิเคตอย่างง่ายคือตาราง 3.20.

ที่ การพัฒนาภาคแสดงที่ซับซ้อน มันกลับกลายเป็นว่าสมบูรณ์ยิ่งขึ้นและ ลักษณะโดยละเอียดวัตถุ. ในกรณีนี้ สัญญาณทั้งสองของภาคแสดง (ตามเพศและอายุ) มีความเกี่ยวข้องกันอย่างใกล้ชิด คุณสามารถวิเคราะห์องค์ประกอบก่อนได้ รัฐดูมาตามฝ่าย

ตารางที่ 3.20.

ตามกลุ่มอายุ จากนั้นแต่ละราย กลุ่มอายุแบ่งออกเป็นสองกลุ่มย่อยตามเพศ กล่าวอีกนัยหนึ่ง ด้วยการพัฒนาที่ซับซ้อนของภาคแสดง ปรากฏการณ์หรือวัตถุสามารถถูกกำหนดลักษณะโดยการผสมผสานคุณสมบัติที่แตกต่างกันที่ก่อตัวขึ้น

ในทุกกรณี เมื่อสร้างตารางสถิติ ผู้วิจัยควรได้รับคำแนะนำจากอัตราส่วนที่เหมาะสมของตัวบ่งชี้ภาคแสดง

กฎพื้นฐานสำหรับการสร้างและวิเคราะห์ตารางทางสถิติ

ตารางสถิติเป็นวิธีการนำเสนอแบบเห็นภาพและกะทัดรัด ข้อมูลดิจิทัลจะต้องมีความถูกต้องทางสถิติ มีเทคนิคพื้นฐานต่อไปนี้ที่กำหนดเทคนิคในการสร้างตารางสถิติ

1. จะต้องนำเสนอเนื้อหาดิจิทัลในลักษณะที่เมื่อวิเคราะห์ตาราง สาระสำคัญของปรากฏการณ์จะถูกเปิดเผยโดยการอ่านบรรทัดจากซ้ายไปขวาและจากบนลงล่าง
2. ชื่อตารางและชื่อของคอลัมน์และแถวจะต้องมีความชัดเจน กระชับ และแสดงถึงความครบถ้วนสมบูรณ์ที่เข้ากับเนื้อหาของข้อความโดยธรรมชาติ ชื่อของตารางควรสะท้อนถึงวัตถุ ป้าย เวลา และสถานที่จัดงาน
3. ข้อมูลที่อยู่ในคอลัมน์ (คอลัมน์) ของตารางจะลงท้ายด้วยบรรทัดสรุป
4. หากชื่อของแต่ละคอลัมน์ซ้ำกัน มีคำศัพท์ซ้ำ หรือมีโหลดความหมายเดียว จะต้องกำหนดส่วนหัวแบบรวม
5. มีประโยชน์ในการนับจำนวนคอลัมน์และบรรทัด คอลัมน์ทางด้านซ้ายซึ่งเต็มไปด้วยชื่อของบรรทัด มักจะถูกกำหนดด้วยตัวพิมพ์ใหญ่ของตัวอักษร (A), (B) ฯลฯ และคอลัมน์ที่ตามมาทั้งหมด - ตามตัวเลขจากน้อยไปหามาก
6. ขอแนะนำให้วางข้อมูลที่เกี่ยวข้องกันซึ่งระบุลักษณะหนึ่งของปรากฏการณ์ที่กำลังวิเคราะห์ในคอลัมน์ที่อยู่ติดกัน
7. คอลัมน์และเส้นจะต้องมีหน่วยการวัดที่สอดคล้องกับตัวชี้วัดที่ตั้งไว้ในหัวเรื่องและภาคแสดง ในกรณีนี้จะใช้ตัวย่อที่ยอมรับโดยทั่วไปของหน่วยการวัด (rub., kWh ฯลฯ )
8. ควรปัดเศษตัวเลขทุกครั้งที่เป็นไปได้ ตัวเลขภายในคอลัมน์หรือบรรทัดเดียวกันควรปัดเศษด้วยความแม่นยำเท่ากัน
9. หากจำเป็น ข้อมูลเพิ่มเติม(คำอธิบายในตาราง) อาจให้หมายเหตุก็ได้

การปฏิบัติตามกฎที่กำหนดสำหรับการสร้างและการออกแบบตารางสถิติทำให้เป็นวิธีการหลักในการนำเสนอประมวลผลและสรุปข้อมูลทางสถิติเกี่ยวกับสถานะและการพัฒนาปรากฏการณ์ทางเศรษฐกิจและสังคมที่วิเคราะห์แล้ว

การวิเคราะห์ตารางสถิติดำเนินการในสองทิศทาง: โครงสร้างและเนื้อหา

การวิเคราะห์โครงสร้าง เกี่ยวข้องกับการวิเคราะห์โครงสร้างของตารางและการกำหนดลักษณะ:

จำนวนทั้งสิ้นและหน่วยการสังเกตที่ก่อตัวขึ้น
เครื่องหมายและการรวมกันที่ก่อให้เกิดหัวเรื่องและภาคแสดงของตาราง
ประเภทโต๊ะ;
งานที่จะแก้ไข

การวิเคราะห์แต่ละกลุ่มของวิชาตามลักษณะที่สอดคล้องกันของภาคแสดง
การระบุความสัมพันธ์และสัดส่วนระหว่างกลุ่มปรากฏการณ์ตามลักษณะ
การวิเคราะห์เปรียบเทียบและการกำหนดข้อสรุป การสร้างรูปแบบ และการกำหนดปริมาณสำรองเพื่อการพัฒนาวัตถุที่กำลังศึกษา

การวิเคราะห์ลักษณะเฉพาะบุคคลและกลุ่มจะต้องเริ่มต้นด้วยการศึกษาค่าสัมบูรณ์จากนั้น - ค่าสัมพัทธ์ที่เกี่ยวข้องกับค่าเหล่านั้น

หากวัตถุประสงค์การวิจัยต้องการสิ่งนี้ การวิเคราะห์ตารางสามารถเสริมด้วยค่าสัมพัทธ์และค่าเฉลี่ยที่คำนวณได้ กราฟ ไดอะแกรม ฯลฯ

การวิเคราะห์ตารางเหล่านี้ดำเนินการสำหรับแต่ละลักษณะแยกกัน จากนั้นจึงรวมลักษณะเชิงตรรกะและเศรษฐกิจเข้าด้วยกัน

การปฏิบัติตามกฎและความสม่ำเสมอในการทำงานกับตารางสถิติจะช่วยให้ผู้วิจัยสามารถดำเนินการวิเคราะห์ทางเศรษฐศาสตร์และสถิติเชิงวิทยาศาสตร์ที่ครอบคลุมของวัตถุและกระบวนการที่กำลังศึกษาอยู่

แยกแยะกลุ่มได้:

หลักรวบรวมบนพื้นฐานของวัสดุปฐมภูมิที่รวบรวมระหว่างการสังเกต
รองรวบรวมบนพื้นฐานของหลักใช้ในสองกรณี:
- เมื่อจำเป็นต้องจัดกลุ่มอย่างเป็นทางการขนาดเล็กให้เป็นกลุ่มใหญ่
- เมื่อจะให้ การประเมินเปรียบเทียบรวบรวมวัสดุจากสถานที่ต่าง ๆ และใช้วิธีการที่แตกต่างกัน

การจัดกลุ่มตามลักษณะตั้งแต่สองลักษณะขึ้นไปเรียกว่า - รวมกัน.
ลักษณะที่เรียกว่ากลุ่มหรือประเภทของปรากฏการณ์ การจัดกลุ่มหรือพื้นฐานการจัดกลุ่ม- พื้นฐานอาจเป็นเชิงปริมาณหรือเชิงประกอบก็ได้ แอตทริบิวต์– นี่คือสัญลักษณ์ที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า, ครู ฯลฯ )

ตัวอย่างหมายเลข 1 ข้อมูลต่อไปนี้มีอยู่ในการกระจายของบริษัทการค้าตามจำนวนพนักงานในสองภูมิภาค

สร้างกลุ่มรองของข้อมูลการกระจายของบริษัทโดยการคำนวณข้อมูลจากภูมิภาค 1 ใหม่ตามการจัดกลุ่มของภูมิภาค 2 จำนวนพนักงานโดยเฉลี่ยในภูมิภาคใดมากกว่า

สารละลาย:
กลุ่มแรก “น้อยกว่า 5” จะรวม 4/5 ของกลุ่ม “1-5” จากนั้นจำนวนบริษัทจะเป็น: 6*4/5 = 4.8 µm 5
กลุ่ม "5-10" รวมกลุ่ม "6-10" อย่างสมบูรณ์และเป็นส่วนหนึ่งของกลุ่ม "1-5" เช่น บริษัทเลขจะเป็น 4 + (6-5) = 5
ในกลุ่ม "11-20" อย่างสมบูรณ์ กลุ่มจะเข้า“11-15” และส่วนหนึ่งของกลุ่ม “16-20” คือ ¼*50 = 12.5 data 13
กลุ่ม "21-30" ประกอบด้วยกลุ่ม "16-20" และกลุ่ม "21-25" และกลุ่ม "มากกว่า 25" โดยสมบูรณ์ เราได้: (50-13) + 20 + 15 = 72

ค้นหาจำนวนพนักงานโดยเฉลี่ย:
สำหรับภาคแรก

ค่าเฉลี่ยถ่วงน้ำหนัก: x av = 1960/105 = 18.67

สำหรับภูมิภาคที่สอง

ค่าเฉลี่ยถ่วงน้ำหนัก: x av = 3502.5/117 = 29.94
ดังนั้นในภูมิภาคที่สอง จำนวนพนักงานโดยเฉลี่ยจึงสูงขึ้น

ตัวอย่างหมายเลข 2
การแบ่งคนงานตามระยะเวลาการทำงาน

หมายเลขกลุ่ม	กลุ่มคนงาน จำแนกตามอายุงาน ปี	จำนวนคนงานคน	จำนวนคนงานคิดเป็นเปอร์เซ็นต์ของทั้งหมด
ฉัน	2-6	6	30,0
ครั้งที่สอง	6-10	6	30,0
III	10-14	5	25,0
IV	14-18	3	15,0
ทั้งหมด		20	100,0

ในชุดการแจกแจง เพื่อความชัดเจน คุณลักษณะที่กำลังศึกษาจะคำนวณเป็นเปอร์เซ็นต์ ผลการจัดกลุ่มเบื้องต้นพบว่า 60.0% ของคนงานมีประสบการณ์มากถึง 10 ปี โดยแบ่งเป็น 2-6 ปีเท่ากัน - 30% และจาก 6-10 ปี - 30% และ 40% ของคนงานมีประสบการณ์จาก 10 ถึง 18 ปี
เพื่อศึกษาความสัมพันธ์ระหว่างประสบการณ์การทำงานและผลลัพธ์ จำเป็นต้องสร้างกลุ่มการวิเคราะห์ ที่ฐานเราจะใช้กลุ่มเดียวกับในชุดการแจกจ่าย เรานำเสนอผลลัพธ์การจัดกลุ่มในตารางที่ 2

ตารางที่ 2 - การจัดกลุ่มคนงานตามระยะเวลาการทำงาน

หมายเลขกลุ่ม	กลุ่มคนงานตามประสบการณ์	จำนวนคนงานคน	ประสบการณ์การทำงานโดยเฉลี่ยปี	ผลลัพธ์ของผลิตภัณฑ์ถู
หมายเลขกลุ่ม	กลุ่มคนงานตามประสบการณ์	จำนวนคนงานคน	ประสบการณ์การทำงานโดยเฉลี่ยปี	ทั้งหมด	เพื่อทาสคนหนึ่ง
ฉัน	2-6	6	3,25	1335,0	222,5
ครั้งที่สอง	6-10	6	7,26	1613,0	268,8
III	10-14	5	11,95	1351,0	270,2
IV	14-18	3	16,5	965,0	321,6
ทั้งหมด:		20	8,62	5264	236

ในการกรอกตารางที่ 2 คุณต้องสร้างแผ่นงาน 3

ตารางที่ 3.

เลขที่	กลุ่มคนงาน จำแนกตามอายุงาน ปี	หมายเลขคนงาน	ประสบการณ์	ส่งออกเป็นถู
1	2	3	4	5
1	2-6	1, 2, 3, 4,	2,0; 2,3; 3,0; 5,0; 4,5; 2,7	205, 200, 205, 250, 225, 250
รวมสำหรับกลุ่ม:		6	19,5	1335
2	6-10	5, 6, 8, 13, 17, 19	6,2; 8,0; 6,9; 7,0; 9,0; 6,5	208, 290, 270, 250, 270, 253
รวมสำหรับกลุ่ม		6	43,6	1613
3	10-14	9, 12, 15, 16, 18	12,5; 13,0; 11,0; 10,5; 12,8	230, 300, 287, 276, 258
รวมสำหรับกลุ่ม		5	59,8	1351
4	14-18	11, 20, 14	16, 18, 15,5	295, 320, 350
รวมสำหรับกลุ่ม		3	49,5	965
ทั้งหมด		20	172.4	5264,0

การแบ่งคอลัมน์ (4:3); (5:3) แท็บ 3 เราได้รับข้อมูลที่เกี่ยวข้องเพื่อกรอกตารางที่ 2 นอกจากนี้สำหรับทุกกลุ่ม โดยการกรอกตารางที่ 2 เราจะได้ตารางการวิเคราะห์
เมื่อคำนวณตารางงานแล้วเราจะเปรียบเทียบผลลัพธ์สุดท้ายของตารางกับข้อมูลของเงื่อนไขปัญหาที่ต้องตรงกัน ดังนั้น นอกเหนือจากการสร้างกลุ่มและการค้นหาค่าเฉลี่ยแล้ว เรายังจะตรวจสอบการควบคุมทางคณิตศาสตร์ด้วย
จากการวิเคราะห์ตารางวิเคราะห์ที่ 2 เราสามารถสรุปได้ว่าลักษณะที่ศึกษา (ตัวชี้วัด) ขึ้นอยู่กับแต่ละอื่น ๆ ด้วยประสบการณ์การทำงานที่เพิ่มขึ้น ผลผลิตต่อพนักงานก็เพิ่มขึ้นอย่างต่อเนื่อง ผลลัพธ์ของคนงานกลุ่มที่สี่คือ 99.1 รูเบิล สูงกว่าครั้งแรกหรือ 44.5% เราพิจารณาตัวอย่างการจัดกลุ่มตามลักษณะหนึ่ง แต่ในหลายกรณี การจัดกลุ่มดังกล่าวไม่เพียงพอที่จะแก้ไขปัญหาที่ได้รับมอบหมาย ในกรณีเช่นนี้ จะดำเนินการจัดกลุ่มตามลักษณะตั้งแต่สองลักษณะขึ้นไป ได้แก่ เพื่อการรวมกัน ให้เราจัดกลุ่มข้อมูลรองตามผลผลิตเฉลี่ย
เรากำหนดลักษณะแต่ละกลุ่มตามจำนวนคนงาน ประสบการณ์การทำงานโดยเฉลี่ย ผลลัพธ์เฉลี่ย - รวมและการคำนวณต่อพนักงานแสดงไว้ในตารางที่ 4

ตารางที่ 4 - การจัดกลุ่มคนงานตามระยะเวลาการให้บริการและผลผลิตเฉลี่ย

เลขที่	กลุ่มคนงาน		จำนวนคนงานคน	เฉลี่ย ประสบการณ์การทำงานปี	ผลผลิตเฉลี่ยถู
เลขที่	โดยประสบการณ์	ตามการผลิตโดยเฉลี่ย ต่อ ในถู	จำนวนคนงานคน	เฉลี่ย ประสบการณ์การทำงานปี	ทั้งหมด	ต่อคนงานหนึ่งคน
1	2-6	200,0-250,0	4	2,5	835,0	208,75
รวมสำหรับกลุ่ม			6	3,25	1335,0	222,5
2	6-10	200,0-250,0	-	-	-	-
3	10-14	200,0-250,0	1	12,5	230,0	230,0
รวมสำหรับกลุ่ม			5	11,96	1351,0	270,2
4	14-18	200,0-250,0	-	-	-	-
รวมสำหรับกลุ่ม			3	16,5	965,0	321,6
รวมเป็นรายกลุ่ม		200,0-250,0	5	3,0	1065,0	213,0
ทั้งหมด			20	8,62	5264	263,2

ในการสร้างการจัดกลุ่มเชิงวิเคราะห์รองตามผลผลิตผลิตภัณฑ์โดยเฉลี่ยภายในกลุ่มที่สร้างขึ้นครั้งแรก เราจะกำหนดช่วงเวลาของการจัดกลุ่มรองโดยเน้นสามกลุ่ม ได้แก่ น้อยกว่าในกลุ่มเดิมหนึ่งรายการ
จากนั้น i=(350-200)/3 = 50 ถู
ไม่มีประโยชน์ที่จะรับหลายกลุ่ม จะมีช่วงเวลาสั้นมาก เป็นไปได้น้อย ข้อมูลสุดท้ายของกลุ่มคำนวณจากผลรวมของประสบการณ์ของกลุ่ม ส่ง 19.5 ปีแรก หารด้วยจำนวนคนงาน - 6 คน เราได้ 3.25 ปี
ข้อมูลในตารางแสดงให้เห็นว่าผลผลิตของผลิตภัณฑ์ขึ้นอยู่กับประสบการณ์การทำงานโดยตรง

บางครั้งการจัดกลุ่มเริ่มแรกไม่ได้ระบุลักษณะของการกระจายหน่วยประชากรอย่างชัดเจน หรือเพื่อนำการจัดกลุ่มไปเป็นประเภทที่เทียบเคียงได้เพื่อวัตถุประสงค์ในการวิเคราะห์เชิงเปรียบเทียบ จำเป็นต้องเปลี่ยนการจัดกลุ่มที่มีอยู่เล็กน้อย: การรวมกลุ่มที่ระบุก่อนหน้านี้มีขนาดค่อนข้างเล็ก จัดกลุ่มเป็นกลุ่มเล็ก ๆ ทั่วไปหรือเปลี่ยนขอบเขตของกลุ่มก่อนหน้าเพื่อให้กลุ่มสามารถเปรียบเทียบกับกลุ่มอื่นได้

กำลังโหลด...

แบ่งปันกับเพื่อนของคุณ:

เพิ่มบทความนี้ในรายการโปรดของคุณเพื่อไม่ให้พลาด!