ซีรี่ส์การจัดจำหน่ายและประเภทของพวกเขา ชุดการกระจายทางสถิติ
รูปทรงพิเศษการจัดกลุ่มข้อมูลเป็นตัวแทนของสิ่งที่เรียกว่า ชุดสถิติหรือ ค่าตัวเลขคุณลักษณะที่จัดเรียงตามลำดับที่แน่นอน ชุดข้อมูลทางสถิติจะแบ่งออกเป็นชุดข้อมูลเชิงอนุพันธ์ การเปลี่ยนแปลง ไดนามิก ชุดการถดถอย ชุดของค่าคุณลักษณะที่ได้รับการจัดอันดับ และชุดความถี่สะสม ทั้งนี้ขึ้นอยู่กับคุณลักษณะที่กำลังศึกษาอยู่ ส่วนใหญ่มักใช้ในด้านจิตวิทยา แปรผันแถว, แถว การถดถอยและแถว จัดอันดับค่าคุณสมบัติ
ชุดรูปแบบของการแจกแจงคือชุดตัวเลขคู่ที่แสดงว่าค่าตัวเลขของคุณลักษณะสัมพันธ์กับความถี่ในตัวอย่างที่กำหนดให้อย่างไร ตัวอย่างเช่น นักจิตวิทยาได้ทำการทดสอบสติปัญญาโดยใช้การทดสอบ Wechsler กับเด็กนักเรียน 25 คน และคะแนนดิบสำหรับการทดสอบย่อยครั้งที่สองกลายเป็นดังนี้: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. อย่างที่คุณเห็น ตัวเลขบางตัวตกอยู่ใน ชุดนี้หลายครั้ง ดังนั้น เมื่อคำนึงถึงจำนวนการทำซ้ำ ซีรี่ส์เหล่านี้จึงสามารถนำเสนอในรูปแบบที่สะดวกและกะทัดรัดยิ่งขึ้น:
นี่คือซีรี่ส์รูปแบบต่างๆ ตัวเลขที่แสดงจำนวนครั้งที่แต่ละตัวเลือกเกิดขึ้นในประชากรที่กำหนดเรียกว่าความถี่หรือน้ำหนักของตัวเลือก ถูกกำหนดด้วยอักษรตัวพิมพ์เล็กของอักษรละติน ฉ ฉันและมีดัชนี “i” ตรงกับจำนวนตัวแปรในชุดรูปแบบ
เปอร์เซ็นต์การแสดงความถี่มีประโยชน์ในกรณีที่จำเป็นต้องเปรียบเทียบอนุกรมรูปแบบต่างๆ ที่มีปริมาตรแตกต่างกันมาก เช่น เมื่อทำการทดสอบ ความพร้อมของโรงเรียนตรวจสอบเด็กในเมือง ชุมชนเมือง และหมู่บ้าน ตัวอย่างเด็กจำนวน 1,000, 300 และ 100 คน ตามลำดับ ขนาดตัวอย่างต่างกันอย่างเห็นได้ชัด ดังนั้นจึงควรเปรียบเทียบผลการทดสอบโดยใช้เปอร์เซ็นต์ความถี่จะดีกว่า
ซีรีส์ด้านบน (3.1) สามารถแสดงได้แตกต่างกัน หากองค์ประกอบของอนุกรมถูกจัดเรียงจากน้อยไปมาก ก็จะได้อนุกรมการเปลี่ยนแปลงอันดับที่เรียกว่า:
รูปแบบการนำเสนอนี้ (3.3) เป็นที่นิยมมากกว่า (3.1) เนื่องจากจะแสดงรูปแบบของการเปลี่ยนแปลงของคุณลักษณะได้ดีกว่า
สามารถเพิ่มหรือสะสมความถี่ที่แสดงถึงซีรีย์รูปแบบการจัดอันดับได้ ความถี่สะสมจะได้มาโดยการรวมค่าความถี่ตามลำดับจากความถี่แรกไปสุดท้าย
เป็นตัวอย่าง ลองดูอีกครั้งที่แถว 3.3 มาแปลงเป็นซีรีย์ 3.4 โดยที่เราแนะนำบรรทัดเพิ่มเติมและเรียกมันว่า "ความถี่สะสม":
มาดูกันว่าบรรทัดสุดท้ายเป็นอย่างไร ที่จุดเริ่มต้นของอนุกรมความถี่จะมี 1 ในอนุกรมสะสม 2 อยู่ในอันดับที่สอง - นี่คือผลรวมของความถี่ที่หนึ่งและที่สองนั่นคือ 1 + 1 ในอันดับที่สามคือ 4 นี่คือผลรวมของความถี่ที่สอง (ความถี่สะสมแล้ว) และความถี่ที่สามคือ 2 + 2 ในวันที่ 8 = 4 + 4 เป็นต้น
ขอบเขต(บางครั้งเรียกว่าปริมาณนี้ การแพร่กระจาย)ตัวอย่างจะถูกระบุด้วยตัวอักษร ร.นี่เป็นตัวบ่งชี้ที่ง่ายที่สุดที่สามารถหาได้สำหรับตัวอย่าง - ความแตกต่างระหว่างค่าสูงสุดและค่าต่ำสุดของชุดรูปแบบที่กำหนดโดยเฉพาะเช่น
เป็นที่ชัดเจนว่ายิ่งคุณลักษณะที่วัดได้แตกต่างกันมากเท่าใด ค่าก็จะยิ่งมากขึ้นเท่านั้น อาร์และในทางกลับกัน
อย่างไรก็ตาม อาจเกิดขึ้นได้ว่าชุดตัวอย่างสองชุดมีทั้งค่าเฉลี่ยและพิสัยเท่ากัน แต่ลักษณะของการเปลี่ยนแปลงของชุดเหล่านี้จะแตกต่างกัน ตัวอย่างเช่น ให้สองตัวอย่าง:
หากค่าเฉลี่ยและสเปรดเท่ากันสำหรับชุดตัวอย่างทั้งสองชุดนี้ ธรรมชาติของการแปรผันจะแตกต่างกัน เพื่อให้เข้าใจธรรมชาติของการแปรผันในกลุ่มตัวอย่างได้ชัดเจนยิ่งขึ้น เราควรอ้างอิงถึงการแจกแจงของพวกมัน
ตารางและกราฟการแจกแจงความถี่
ตามกฎแล้วการวิเคราะห์ข้อมูลเริ่มต้นด้วยการศึกษาว่าค่าบางอย่างของคุณลักษณะ (ตัวแปร) ที่ผู้วิจัยสนใจนั้นเกิดขึ้นบ่อยเพียงใดในชุดการสังเกตที่มีอยู่ เพื่อจุดประสงค์นี้พวกเขากำลังสร้าง ตารางและกราฟการแจกแจงความถี่สิ่งเหล่านี้มักเป็นพื้นฐานสำหรับการได้รับผลการวิจัยที่มีคุณค่าและมีความหมาย
หากคุณลักษณะใช้ค่าที่เป็นไปได้เพียงไม่กี่ค่า (มากถึง 10-15) ตารางการแจกแจงความถี่จะแสดงความถี่ของการเกิดค่าคุณลักษณะแต่ละค่า หากมีการระบุว่าค่าคุณลักษณะแต่ละค่าเกิดขึ้นกี่ครั้ง แสดงว่าเป็นตาราง แน่นอนการกระจายความถี่หากมีการระบุสัดส่วนของการสังเกตที่ตกลงกับค่าเฉพาะของคุณลักษณะเราจะพูดถึง ญาติความถี่การกระจาย
ในหลายกรณี ลักษณะเฉพาะอาจใช้ค่าที่แตกต่างกันมากมาย เช่น หากเราวัดเวลาในการแก้ไขปัญหาการทดสอบ ในกรณีนี้สามารถตัดสินการกระจายคุณลักษณะได้ ตารางความถี่ที่จัดกลุ่มซึ่งความถี่จะถูกจัดกลุ่มตามอันดับหรือช่วงของค่าแอตทริบิวต์
ตารางการแจกจ่ายอีกประเภทหนึ่งคือตารางการแจกจ่าย สะสมความถี่ แสดงให้เห็นว่าความถี่สะสมอย่างไรเมื่อค่าคุณสมบัติเพิ่มขึ้น ตรงข้ามแต่ละค่า (ช่วงเวลา) จะระบุผลรวมของความถี่ของการเกิดขึ้นของการสังเกตทั้งหมดซึ่งค่าของคุณลักษณะไม่เกินค่านี้ (น้อยกว่าขีดจำกัดบนของช่วงเวลานี้) ความถี่สะสมจะอยู่ในคอลัมน์ด้านขวาของตาราง 3.2 และ 3.3
เพื่อให้เห็นภาพมากขึ้น กราฟการกระจายความถี่หรือกราฟความถี่สะสมจะถูกสร้างขึ้น - ฮิสโตแกรมหรือเส้นโค้งการกระจายแบบเรียบ
ฮิสโตแกรมการแจกแจงความถี่คือแผนภูมิแท่ง ซึ่งแต่ละคอลัมน์จะขึ้นอยู่กับค่าคุณลักษณะเฉพาะหรือช่วงบิต (สำหรับความถี่ที่จัดกลุ่ม) ความสูงของคอลัมน์เป็นสัดส่วนกับความถี่ของการเกิดค่าที่สอดคล้องกัน ในรูป 3.1 แสดงฮิสโตแกรมของการแจกแจงความถี่ตามตัวอย่างจากตาราง 3.2.
ฮิสโตแกรมของความถี่เบ้แตกต่างจากฮิสโตแกรมการแจกแจงตรงที่ความสูงของแต่ละแท่งจะเป็นสัดส่วนกับความถี่สะสมตามค่าที่กำหนด (ช่วง) ในรูป 3.2 แสดงฮิสโตแกรมความถี่สะสมของข้อมูลในตาราง 3.2.
การก่อสร้าง รูปหลายเหลี่ยมการกระจายความถี่คล้ายกับการสร้างฮิสโตแกรม ในฮิสโตแกรม ด้านบนของแต่ละคอลัมน์ซึ่งสอดคล้องกับความถี่ของการเกิดค่าที่กำหนด (ช่วงเวลา) ของจุดสนใจ คือส่วนของเส้นตรง และสำหรับรูปหลายเหลี่ยมนั้นจะมีการทำเครื่องหมายจุดที่ตรงกับกึ่งกลางของส่วนนี้ ถัดไปทุกจุดเชื่อมต่อกันด้วยเส้นประ (รูปที่ 3.3) แทนที่จะเป็นฮิสโตแกรมหรือรูปหลายเหลี่ยม มักจะแสดงเส้นโค้งการกระจายความถี่ที่เรียบขึ้น ในรูป รูปที่ 3.4 แสดงฮิสโตแกรมการแจกแจงตามตัวอย่างจากตาราง 3.3 (บาร์) และเส้นโค้งเรียบของการกระจายความถี่เดียวกัน
ตารางและกราฟการกระจายความถี่ให้ข้อมูลเบื้องต้นที่สำคัญเกี่ยวกับ รูปแบบการกระจายลักษณะ:เกี่ยวกับค่าใดที่พบได้น้อยกว่าและบ่อยกว่าและความแปรปรวนของคุณลักษณะนั้นเด่นชัดเพียงใด โดยทั่วไปแล้ว แบบฟอร์มการแจกจ่ายทั่วไปต่อไปนี้จะมีความโดดเด่น การกระจายเครื่องแบบ –เมื่อความหมายทั้งหมดเกิดขึ้นเท่าๆ กัน (หรือเกือบเท่ากัน) บ่อยครั้ง การกระจายแบบสมมาตร -เมื่อค่าสุดขั้วเกิดขึ้นบ่อยเท่าๆ กัน การกระจายแบบปกติ- การกระจายแบบสมมาตร ซึ่งค่าสุดขั้วนั้นหาได้ยาก และความถี่จะค่อยๆ เพิ่มขึ้นจากค่าสุดขีดไปจนถึงค่ากลางของลักษณะเฉพาะ การกระจายแบบเบ้- ถนัดซ้าย(ด้วยความเด่นของความถี่ที่มีค่าต่ำ) ด้านขวา(โดยมีความเด่นของความถี่ที่มีค่าสูง)
ตารางและกราฟของการกระจายตัวของลักษณะนั้นช่วยให้เราสามารถสรุปผลที่มีความหมายเมื่อเปรียบเทียบกลุ่มของวิชาระหว่างกัน ด้วยการเปรียบเทียบการแจกแจง เราไม่เพียงแต่สามารถตัดสินได้ว่าค่าใดที่พบได้ทั่วไปในกลุ่มใดกลุ่มหนึ่งเท่านั้น แต่ยังเปรียบเทียบกลุ่มตามความรุนแรงของความแตกต่างระหว่างบุคคลได้ด้วย - ความแปรปรวนบนพื้นฐานนี้
ตารางและกราฟความถี่สะสมช่วยให้คุณรับได้อย่างรวดเร็ว ข้อมูลเพิ่มเติมเกี่ยวกับจำนวนวิชา (หรือสัดส่วนเท่าใด) ที่มีคุณสมบัติความรุนแรงไม่สูงกว่าค่าที่กำหนด
หมวดที่ 4 สถิติเชิงพรรณนา
(การกระจายทางสถิติและลักษณะเชิงตัวเลข)
ตัวแปรสามารถรับค่าได้หลายค่า บน ระยะเริ่มแรกการประมวลผลข้อมูล แทนที่จะพิจารณาค่าทั้งหมดของตัวแปร ขอแนะนำให้วิเคราะห์สถิติเชิงพรรณนา พวกเขาให้แนวคิดทั่วไปเกี่ยวกับค่าหรือช่วงของค่าที่ตัวแปรใช้
ไปที่สถิติเชิงพรรณนาหลัก ( สถิติเชิงพรรณนา)มักจะหมายถึงคุณลักษณะเชิงตัวเลขของการแจกแจงคุณลักษณะที่วัดได้ในตัวอย่าง ลักษณะดังกล่าวแต่ละอย่างสะท้อนให้เห็น อยู่ในค่าตัวเลขเดียวทรัพย์สินการกระจาย ชุดผลการวัด:จากมุมมองของพวกเขา ที่ตั้งบนแกนจำนวนหรือในแง่ของมัน ความแปรปรวนวัตถุประสงค์หลักของสถิติเชิงพรรณนาหลักแต่ละค่าคือการแทนที่ค่าหลายค่าของคุณลักษณะที่วัดในตัวอย่างด้วยตัวเลขเพียงตัวเดียว (เช่น ค่าเฉลี่ยเป็นตัวชี้วัดแนวโน้มศูนย์กลาง) คำอธิบายแบบย่อของกลุ่มโดยใช้สถิติปฐมภูมิทำให้สามารถตีความผลการวัดได้ โดยเฉพาะโดยการเปรียบเทียบสถิติปฐมภูมิของกลุ่มต่างๆ
ขั้นตอนที่สำคัญที่สุดในการศึกษาปรากฏการณ์และกระบวนการทางเศรษฐกิจและสังคมคือการจัดระบบข้อมูลปฐมภูมิและการได้มาบนพื้นฐานนี้ ลักษณะสรุปวัตถุทั้งหมดโดยใช้ตัวบ่งชี้ทั่วไป ซึ่งทำได้โดยการสรุปและจัดกลุ่มเนื้อหาทางสถิติหลัก
สรุปทางสถิติ - นี่เป็นการดำเนินการที่ซับซ้อนตามลำดับเพื่อสรุปข้อเท็จจริงเฉพาะของแต่ละบุคคลซึ่งก่อตัวเป็นชุดเพื่อระบุคุณลักษณะและรูปแบบทั่วไปที่มีอยู่ในปรากฏการณ์ที่กำลังศึกษาโดยรวม การจัดทำสรุปทางสถิติประกอบด้วยขั้นตอนดังต่อไปนี้ :
- การเลือกลักษณะการจัดกลุ่ม
- การกำหนดลำดับการก่อตัวของกลุ่ม
- การพัฒนาระบบตัวบ่งชี้ทางสถิติเพื่อระบุลักษณะกลุ่มและวัตถุโดยรวม
- การพัฒนาโครงร่างตารางสถิติเพื่อนำเสนอผลสรุป
การจัดกลุ่มทางสถิติ เรียกว่าการแบ่งหน่วยของประชากรที่กำลังศึกษาออกเป็นกลุ่มเนื้อเดียวกันตามลักษณะเฉพาะที่จำเป็นต่อพวกเขา การจัดกลุ่มเป็นวิธีการทางสถิติที่สำคัญที่สุดในการวางนัยทั่วไป ข้อมูลทางสถิติซึ่งเป็นพื้นฐานในการคำนวณตัวบ่งชี้ทางสถิติที่ถูกต้อง
แยกแยะ ประเภทต่อไปนี้การจัดกลุ่ม: ประเภท, โครงสร้าง, การวิเคราะห์ การจัดกลุ่มทั้งหมดนี้รวมกันโดยข้อเท็จจริงที่ว่าหน่วยของวัตถุถูกแบ่งออกเป็นกลุ่มตามลักษณะบางอย่าง
คุณลักษณะการจัดกลุ่ม เป็นลักษณะที่หน่วยประชากรถูกแบ่งออกเป็นกลุ่มต่างๆ จากทางเลือกที่เหมาะสม
ลักษณะการจัดกลุ่มจะเป็นตัวกำหนดข้อสรุปของการศึกษาทางสถิติ เป็นพื้นฐานสำหรับการจัดกลุ่ม จำเป็นต้องใช้คุณลักษณะที่มีนัยสำคัญตามทฤษฎี (เชิงปริมาณหรือเชิงคุณภาพ) ลักษณะเชิงปริมาณของการจัดกลุ่ม มีการแสดงตัวเลข (ปริมาณการซื้อขาย อายุของบุคคล รายได้ของครอบครัว ฯลฯ) และ สัญญาณเชิงคุณภาพของการจัดกลุ่ม สะท้อนถึงสถานะของหน่วยประชากร (เพศ,สถานภาพการสมรส
, ความเกี่ยวข้องในอุตสาหกรรมขององค์กร, รูปแบบการเป็นเจ้าของ ฯลฯ )
หลังจากกำหนดพื้นฐานของการจัดกลุ่มแล้ว จะต้องตัดสินใจคำถามเกี่ยวกับจำนวนกลุ่มที่ควรแบ่งประชากรภายใต้การศึกษา จำนวนกลุ่มขึ้นอยู่กับวัตถุประสงค์ของการศึกษาและประเภทของตัวบ่งชี้ที่เป็นพื้นฐานของการจัดกลุ่ม ปริมาณของประชากร และระดับของการเปลี่ยนแปลงของลักษณะเฉพาะตัวอย่างเช่น การจัดกลุ่มวิสาหกิจตามประเภทความเป็นเจ้าของจะคำนึงถึงทรัพย์สินของเทศบาล รัฐบาลกลาง และของรัฐบาลกลาง หากดำเนินการจัดกลุ่มตามปริมาณ ก็จำเป็นต้องกลับรายการ
ความสนใจเป็นพิเศษ จำนวนหน่วยของวัตถุที่กำลังศึกษาและระดับความผันผวนของลักษณะการจัดกลุ่ม เมื่อกำหนดจำนวนกลุ่มแล้ว จะต้องกำหนดช่วงเวลาการจัดกลุ่ม
ช่วงเวลา - นี่คือค่าของคุณลักษณะที่แตกต่างกันซึ่งอยู่ภายในขอบเขตที่กำหนด แต่ละช่วงเวลามีค่าของตัวเอง ขอบเขตบนและล่าง หรืออย่างน้อยหนึ่งขอบเขต ขีดจำกัดล่างของช่วงเวลา เรียกว่าค่าที่น้อยที่สุดของคุณลักษณะในช่วงเวลา และ
ช่วงเวลาการจัดกลุ่ม ขึ้นอยู่กับขนาด คือ เท่ากันและไม่เท่ากัน หากการแปรผันของคุณลักษณะปรากฏภายในขอบเขตที่ค่อนข้างแคบและมีการกระจายสม่ำเสมอ แสดงว่ากลุ่มจะถูกสร้างขึ้นในช่วงเวลาที่เท่ากัน ค่าของช่วงเวลาที่เท่ากันถูกกำหนดโดยสูตรต่อไปนี้ :
โดยที่ Xmax, Xmin - สูงสุด และ ค่าต่ำสุดลักษณะโดยรวม n - จำนวนกลุ่ม
การจัดกลุ่มที่ง่ายที่สุด ซึ่งแต่ละกลุ่มที่เลือกจะมีตัวบ่งชี้หนึ่งตัว แสดงถึงชุดการแจกแจง
ชุดการกระจายทางสถิติ - นี่คือการกระจายหน่วยประชากรออกเป็นกลุ่มตามลำดับตามลักษณะเฉพาะ ขึ้นอยู่กับคุณลักษณะที่เป็นรากฐานของการก่อตัวของอนุกรมการแจกแจง ซีรีส์การแจกแจงแบบระบุแหล่งที่มาและแบบแปรผันจะมีความโดดเด่น
แอตทริบิวต์ เรียกว่าชุดการจัดจำหน่ายที่สร้างขึ้นตามลักษณะเชิงคุณภาพ กล่าวคือ ลักษณะที่ไม่มีการแสดงออกทางตัวเลข (การกระจายตามประเภทแรงงาน ตามเพศ ตามอาชีพ เป็นต้น) ชุดการแจกแจงแบบระบุลักษณะองค์ประกอบของประชากรตามที่กำหนด คุณสมบัติที่สำคัญ- ข้อมูลเหล่านี้ใช้เวลาหลายช่วงเวลาทำให้สามารถศึกษาการเปลี่ยนแปลงโครงสร้างได้
ซีรี่ส์รูปแบบต่างๆ เรียกว่าชุดการแจกจ่ายที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดรูปแบบต่างๆ ประกอบด้วยสององค์ประกอบ: ตัวเลือกและความถี่ ตัวเลือก ค่าแต่ละค่าของคุณลักษณะที่ใช้ในชุดรูปแบบเรียกว่าค่าเฉพาะของคุณลักษณะที่แตกต่างกัน
ความถี่ จะมีการเรียกหมายเลขของตัวแปรแต่ละตัวหรือแต่ละกลุ่มของอนุกรมของตัวแปร นั่นคือตัวเลขเหล่านี้ที่แสดงว่าตัวแปรบางตัวเกิดขึ้นในซีรีย์การแจกจ่ายบ่อยแค่ไหน ผลรวมของความถี่ทั้งหมดจะกำหนดขนาดของประชากรทั้งหมดและปริมาตรของมัน ความถี่ เรียกว่าความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมด ดังนั้นผลรวมของความถี่จึงเท่ากับ 1 หรือ 100%
ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงของคุณลักษณะ ซีรีส์รูปแบบต่างๆ สามรูปแบบจะมีความโดดเด่น: ซีรีส์อันดับ ซีรีส์ไม่ต่อเนื่องและอนุกรมช่วง
จัดอันดับซีรีส์รูปแบบต่างๆ - นี่คือการกระจายของแต่ละหน่วยของประชากรโดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปหาน้อยของลักษณะที่กำลังศึกษา การจัดอันดับช่วยให้คุณแบ่งข้อมูลเชิงปริมาณออกเป็นกลุ่มๆ ได้อย่างง่ายดาย ตรวจจับข้อมูลที่เล็กที่สุดและทันที มูลค่าสูงสุดลักษณะเด่นเน้นค่าที่ซ้ำกันบ่อยที่สุด
ซีรี่ส์รูปแบบที่ไม่ต่อเนื่อง ระบุลักษณะการกระจายของหน่วยประชากรตามลักษณะเฉพาะที่ไม่ต่อเนื่องซึ่งรับเฉพาะค่าจำนวนเต็ม ตัวอย่างเช่น หมวดหมู่ภาษี จำนวนลูกในครอบครัว จำนวนพนักงานในองค์กร เป็นต้น
หากคุณลักษณะมีการเปลี่ยนแปลงอย่างต่อเนื่องซึ่งภายในขอบเขตที่กำหนดสามารถรับค่าใด ๆ (“จาก - ถึง”) ได้ดังนั้นสำหรับคุณลักษณะนี้จำเป็นต้องสร้าง อนุกรมการเปลี่ยนแปลงช่วงเวลา - ตัวอย่างเช่น จำนวนรายได้ ระยะเวลาการให้บริการ ต้นทุนสินทรัพย์ถาวรขององค์กร เป็นต้น
ตัวอย่างการแก้ปัญหาในหัวข้อ “สรุปทางสถิติ และการจัดกลุ่ม”
ปัญหาที่ 1 - มีข้อมูลเกี่ยวกับจำนวนหนังสือที่นักเรียนได้รับจากการสมัครสมาชิกในปีการศึกษาที่ผ่านมา
สร้างซีรีส์การแจกแจงรูปแบบการจัดอันดับและแยกส่วน โดยกำหนดองค์ประกอบของซีรีส์
สารละลาย
ชุดนี้แสดงถึงตัวเลือกมากมายสำหรับจำนวนหนังสือที่นักเรียนได้รับ ลองนับจำนวนตัวเลือกดังกล่าวแล้วจัดเรียงในรูปแบบของซีรีส์การแจกแจงแบบแยกส่วนแบบจัดอันดับแบบผันแปรและแบบแปรผัน
ปัญหาที่ 2 - มีข้อมูลเกี่ยวกับต้นทุนของสินทรัพย์ถาวรสำหรับ 50 องค์กรพันรูเบิล
สร้างชุดการแจกจ่ายโดยเน้นกลุ่มวิสาหกิจ 5 กลุ่ม (ในช่วงเวลาเท่ากัน)
สารละลาย
ในการแก้ปัญหาเราจะเลือกมูลค่าที่ใหญ่ที่สุดและเล็กที่สุดของมูลค่าสินทรัพย์ถาวรขององค์กร
เหล่านี้คือ 30.0 และ 10.2 พันรูเบิล
มาหาขนาดของช่วงเวลา: h = (30.0-10.2):5= 3.96 พันรูเบิล
จากนั้นกลุ่มแรกจะรวมองค์กรที่มีสินทรัพย์ถาวรจำนวน 10.2 พันรูเบิล สูงถึง 10.2+3.96=14.16 พันรูเบิล จะมี 9 องค์กรดังกล่าว กลุ่มที่สองจะรวมองค์กรที่มีสินทรัพย์ถาวรจำนวน 14.16 พันรูเบิล มากถึง 14.16+3.96=18.12 พันรูเบิล จะมีวิสาหกิจดังกล่าวจำนวน 16 แห่ง เราจะพบจำนวนวิสาหกิจที่รวมอยู่ในกลุ่มที่สาม สี่ และห้า
เราวางซีรีย์การแจกจ่ายผลลัพธ์ลงในตาราง ปัญหา 3
- ข้อมูลต่อไปนี้ได้รับจากองค์กรอุตสาหกรรมเบาจำนวนหนึ่ง:
จัดกลุ่มวิสาหกิจตามจำนวนคนงาน โดยแบ่งเป็น 6 กลุ่มในช่วงเวลาเท่ากัน
คำนวณสำหรับแต่ละกลุ่ม:
1. จำนวนวิสาหกิจ
2. จำนวนคนงาน
3.ปริมาณสินค้าที่ผลิตต่อปี
6. 4. ผลผลิตจริงโดยเฉลี่ยต่อคนงาน 5.ปริมาณสินทรัพย์ถาวร
ขนาดกลาง
สินทรัพย์ถาวรของวิสาหกิจแห่งหนึ่ง
สารละลาย
7. มูลค่าเฉลี่ยของผลิตภัณฑ์ที่ผลิตโดยองค์กรเดียว
นำเสนอผลการคำนวณเป็นตาราง วาดข้อสรุป
จากนั้นกลุ่มแรกจะรวมวิสาหกิจที่มีจำนวนคนงานโดยเฉลี่ยอยู่ระหว่าง 43 ถึง 43 + 35.5 = 78.5 คน
จะมีวิสาหกิจดังกล่าวจำนวน 5 แห่ง กลุ่มที่สองจะรวมวิสาหกิจที่มีจำนวนคนงานโดยเฉลี่ยตั้งแต่ 78.5 ถึง 78.5+35.5=114 คน จะมีวิสาหกิจดังกล่าวอยู่ 12 แห่ง ในทำนองเดียวกัน เราจะพบจำนวนวิสาหกิจที่รวมอยู่ในกลุ่มที่สาม สี่ ห้า และหก
เราวางชุดการแจกแจงผลลัพธ์ลงในตารางและคำนวณตัวบ่งชี้ที่จำเป็นสำหรับแต่ละกลุ่ม: บทสรุป
: ดังที่เห็นจากตาราง วิสาหกิจกลุ่มที่ 2 มีจำนวนมากที่สุด ประกอบด้วย 12 รัฐวิสาหกิจ กลุ่มที่เล็กที่สุดคือกลุ่มที่ห้าและหก (กลุ่มละ 2 แห่ง) เหล่านี้เป็นองค์กรที่ใหญ่ที่สุด (ในแง่ของจำนวนคนงาน)
เนื่องจากกลุ่มที่สองเป็นกลุ่มที่ใหญ่ที่สุดปริมาณผลิตภัณฑ์ที่ผลิตต่อปีโดยองค์กรของกลุ่มนี้และปริมาณสินทรัพย์ถาวรจึงสูงกว่ากลุ่มอื่นอย่างมาก ในขณะเดียวกัน ผลผลิตจริงโดยเฉลี่ยต่อคนงานในองค์กรในกลุ่มนี้ก็ไม่ได้สูงที่สุด องค์กรของกลุ่มที่สี่กำลังเป็นผู้นำที่นี่ กลุ่มนี้ยังคิดเป็นปริมาณสินทรัพย์ถาวรที่ค่อนข้างใหญ่
โดยสรุป เราทราบว่าขนาดเฉลี่ยของสินทรัพย์ถาวรและจำนวนผลผลิตเฉลี่ยที่ผลิตโดยองค์กรหนึ่งนั้นเป็นสัดส่วนโดยตรงกับขนาดขององค์กร (ในแง่ของจำนวนคนงาน) ค่าส่วนบุคคลของลักษณะตัวแปรที่กำลังศึกษาซึ่งบันทึกจากการสังเกตก่อให้เกิดสิ่งที่เรียกว่า.
แถวหลัก ขั้นตอนแรกในการจัดระเบียบซีรีส์หลักคือการจัดอันดับ โดยการจัดเรียงค่าของคุณลักษณะอนุกรมหลัก เช่น ตามลำดับจากน้อยไปหามากที่เราได้รับ.
อันดับซีรีส์
พิจารณาซีรี่ส์หลักที่ได้รับเมื่อลงทะเบียนระดับทักษะของคนงาน
ซีรีส์จัดอันดับจะมีลักษณะดังนี้:
เมื่อพิจารณาจากการจัดอันดับนี้ เราจะเห็นว่าค่าลักษณะเฉพาะบางอย่างถูกทำซ้ำระหว่างคนงานที่แตกต่างกัน (หน่วยประชากร)
ขอให้เรากำหนดผลการสังเกตให้กระชับยิ่งขึ้นโดยการกำหนดค่าแอตทริบิวต์แต่ละค่าให้กับจำนวนหน่วยประชากรที่มีค่าแอตทริบิวต์เดียวกัน สำหรับตัวอย่างของเรา เรามี: เราได้รับซีรีส์จัดอันดับ (สั่ง) ที่แสดงลักษณะเฉพาะการกระจาย ลักษณะที่ศึกษาโดยหน่วยประชากร ในทางสถิติมักจะเรียกว่าอนุกรมดังกล่าว.
แถวการกระจาย เมื่อเพียงพอหน่วยของประชากร แม้ว่าการสังเกตแบบไม่ต่อเนื่องก็ตาม การเรียงลำดับข้อมูลการสังเกตข้างต้นอาจเป็นเรื่องยุ่งยากได้ ดังนั้นการจัดอันดับดังกล่าวมักจะมาพร้อมกับการจัดกลุ่มและการสรุป คุณลักษณะที่ศึกษาในกรณีนี้คือการจัดกลุ่ม
จากที่นี่ คำจำกัดความทั่วไป:
ชุดการแจกแจงทางสถิติเป็นการจัดเรียงหน่วยประชากรภายใต้การศึกษาตามลำดับตามลักษณะการจัดกลุ่ม
ชุดการแจกแจงทางสถิติใดๆ ประกอบด้วยสององค์ประกอบ:
ก) จากค่าเรียงลำดับของคุณลักษณะหรือตัวเลือก
B) จำนวนหน่วยในประชากรที่ให้ค่าเรียกว่า ความถี่- ความถี่ที่แสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของทั้งหมดเรียกว่า ความถี่.
ดังนั้นตัวเลือก– นี่คือค่าที่แยกจากกัน (หรือตัวแปรของกลุ่มที่แยกจากกัน) ของคุณลักษณะตัวแปร ซึ่งใช้ในอนุกรมการแจกแจง เมื่อพูดถึงความถี่ เราต้องจำไว้ว่าผลรวมของความถี่ประกอบขึ้นเป็นปริมาตรของประชากรที่กำลังศึกษา (หรืออีกนัยหนึ่งคือปริมาตรของอนุกรมการแจกแจง)
ตัวอักษร "X" มักจะแสดงถึงความแปรปรวนของคุณลักษณะ และตัวอักษร f แสดงถึงความถี่
ตามเนื้อหาของมันลักษณะสามารถระบุแหล่งที่มาหรือเชิงปริมาณได้
ชุดการจัดจำหน่ายที่สร้างขึ้นตามลักษณะเฉพาะ (หรือเชิงคุณภาพ) เรียกว่า ชุดการกระจายคุณลักษณะ.
เช่น การกระจายตัวของนักศึกษาตามรูปแบบการศึกษา, ตามคณะ, ตามสาขาวิชาเฉพาะ เป็นต้น
ชุดการจัดจำหน่ายที่สร้างขึ้นตามลักษณะเชิงปริมาณเรียกว่า ซีรีย์การเปลี่ยนแปลง.
เช่น การกระจายพนักงานตามระยะเวลาการทำงาน ตามระดับเงินเดือน ตามผลิตภาพแรงงาน เป็นต้น
ลักษณะที่ศึกษาในสถิติมีการเปลี่ยนแปลง
โดยธรรมชาติของการเปลี่ยนแปลง (รูปแบบ) ของค่านิยมสัญญาณมีความโดดเด่น:
ก) สัญญาณที่มีการเปลี่ยนแปลงอย่างต่อเนื่อง
B) สัญญาณที่มีการเปลี่ยนแปลงอย่างต่อเนื่อง
สัญญาณที่มีการเปลี่ยนแปลงไม่ต่อเนื่องสามารถรับค่าเฉพาะจำนวนจำกัดเท่านั้น (เช่น ประเภทอัตราค่าไฟฟ้าของคนงาน จำนวนเครื่องจักร เป็นต้น)
สัญญาณที่มีการเปลี่ยนแปลงอย่างต่อเนื่องสามารถใช้ค่าใด ๆ ภายในขอบเขตที่กำหนด (เช่น ระยะเวลาในการให้บริการ เงินเดือน ระยะทางของยานพาหนะ ฯลฯ )
ตามวิธีการก่อสร้างจะแยกแยะได้ชุดการแปรผันแบบไม่ต่อเนื่อง (ไม่ต่อเนื่อง) ขึ้นอยู่กับการแปรผันที่ไม่ต่อเนื่องของคุณลักษณะ และชุดช่วงเวลา (ต่อเนื่อง) ขึ้นอยู่กับค่าที่เปลี่ยนแปลงอย่างต่อเนื่องของคุณลักษณะ
เมื่อสร้างซีรีย์รูปแบบที่ไม่ต่อเนื่องในคอลัมน์แรก (บรรทัด) จะมีการระบุค่าเฉพาะของแต่ละค่าของแอตทริบิวต์ (เช่นแต่ละตัวเลือก) และในคอลัมน์ที่สอง (บรรทัด) - ความถี่หรือความถี่
ตัวอย่างเช่น ชุดข้อมูลที่แสดงลักษณะการกระจายตัวของคนงานตามประเภทภาษี
เมื่อสร้างอนุกรมความแปรผันตามช่วงเวลาค่าส่วนบุคคลของตัวเลือกจะถูกระบุในค่า "จาก - ถึง"
ช่วงเวลาอาจเท่ากันหรือไม่เท่ากันก็ได้ สำหรับแต่ละความถี่จะมีการระบุความถี่และความถี่ (เช่นสัมบูรณ์หรือ ตัวเลขสัมพัทธ์หน่วยของประชากรซึ่งค่าของตัวเลือกอยู่ภายในช่วงเวลานี้)
ช่วงแรกและช่วงสุดท้ายของชุดข้อมูลมักถูกเปิดไว้ เช่น สำหรับช่วงแรกจะระบุเฉพาะขีด จำกัด บน (“ ถึง ... ) เท่านั้นและสำหรับช่วงสุดท้ายจะแสดงเฉพาะขีด จำกัด ล่าง (“ จาก ... และสูงกว่า”,“ เหนือ ... ”) การใช้ช่วงเวลาที่เปิดนั้นสะดวกเมื่อโดยรวมแล้วมีจำนวนหน่วยน้อยที่มีค่าแอตทริบิวต์ที่เล็กมากหรือใหญ่มากซึ่งแตกต่างอย่างมากจากค่าอื่น ๆ ทั้งหมด
เมื่อสร้างอนุกรมความแปรผันตามช่วงเวลา คำถามจะเกิดขึ้นเกี่ยวกับจำนวนกลุ่มที่ควรแบ่งวัสดุการสังเกตทางสถิติ และคำถามเกี่ยวกับขนาดของช่วงเวลาของแต่ละกลุ่ม
ปัญหาเหล่านี้ได้รับการสำรวจแล้วในวิธีการจัดกลุ่ม (ดูหัวข้อที่ 3) มีการพูดคุยถึงประเด็นที่สำคัญสำหรับการรวบรวมอนุกรมช่วงเวลา เช่น:
1) การกำหนดจุดเริ่มต้นของช่วงเวลา
2) การนับความถี่
โปรดทราบว่าสามารถสร้างอนุกรมความแปรผันตามช่วงเวลาสำหรับคุณลักษณะที่มีความแปรผันแบบไม่ต่อเนื่องได้ บ่อยครั้งในการศึกษาทางสถิติ ไม่เหมาะสมที่จะระบุค่าแยกต่างหากของคุณลักษณะที่ไม่ต่อเนื่อง เนื่องจาก สิ่งนี้มีแนวโน้มที่จะทำให้ยากต่อการพิจารณาการเปลี่ยนแปลงในลักษณะ ดังนั้นค่าแยกที่เป็นไปได้ของแอตทริบิวต์จะถูกกระจายออกเป็นกลุ่มและคำนวณความถี่ (ความถี่) ที่สอดคล้องกัน
เมื่อสร้างชุดช่วงเวลาตามคุณลักษณะที่ไม่ต่อเนื่อง ขอบเขตของช่วงเวลาที่อยู่ติดกันจะไม่ทำซ้ำกัน: ช่วงถัดไปจะเริ่มต้นด้วยช่วงถัดไปตามลำดับ (หลัง ค่าบนช่วงก่อนหน้า) ค่าที่ไม่ต่อเนื่องของแอ็ตทริบิวต์
ในการคำนวณลักษณะทั่วไปของอนุกรมการแจกแจง คุณสามารถใช้ทั้งความถี่และความถี่ได้
ความถี่ที่เป็นเศษส่วนของความสามัคคี: w1=f1/∑f, w2=f2/∑f เป็นต้น
ความถี่เป็นเปอร์เซ็นต์ w1=(f1/∑f)*100, w2=(f2/∑f)*100 เป็นต้น
ข้อมูลที่เกี่ยวข้อง.
แนวคิดของอนุกรมทางสถิติ จากการประมวลผลและการจัดระบบวัสดุทางสถิติปฐมภูมิ ทำให้ได้รับชุดตัวบ่งชี้ดิจิทัลที่ระบุลักษณะเฉพาะของปรากฏการณ์ที่กำลังศึกษาหรือการเปลี่ยนแปลงเมื่อเวลาผ่านไป แถวเหล่านี้เรียกว่า เชิงสถิติ
- 1) ซีรีส์ไดนามิกด้วยความช่วยเหลือซึ่งสามารถระบุลักษณะการเปลี่ยนแปลงขนาดของปรากฏการณ์ทางสังคมเมื่อเวลาผ่านไป
- 2) อนุกรมการแจกแจง ซึ่งระบุลักษณะการกระจายหน่วยประชากรตามลักษณะอย่างใดอย่างหนึ่ง
ใกล้กระจายการกระจายตัวตามลำดับของหน่วยประชากรตามลักษณะที่แตกต่างกันบางประการเรียกว่า ในกรณีส่วนใหญ่ การสร้างอนุกรมการแจกจ่ายจะไม่มีความหมายที่เป็นอิสระ แต่เป็น ส่วนสำคัญการดำเนินการประมวลผลข้อมูลตามการจัดกลุ่ม
การสร้างซีรีย์การจัดจำหน่ายเป็นไปตามหลักการ การจัดกลุ่มทางสถิติ- ในกรณีส่วนใหญ่ ชุดการแจกแจงคือการจัดกลุ่มที่ง่ายที่สุดตามคุณลักษณะเดียว ซึ่งแต่ละค่าของคุณลักษณะหรือกลุ่มที่เลือกจะมีลักษณะเป็นตัวบ่งชี้เดียว: จำนวนหน่วยหรือ ความถ่วงจำเพาะแต่ละกลุ่มในจำนวนประชากรทั้งหมด
มีองค์ประกอบโครงสร้างสององค์ประกอบในชุดการแจกจ่าย:
- 1) ตัวเลือก - ค่าต่าง ๆ ของลักษณะการจัดกลุ่ม โดยปกติจะแสดงด้วยตัวอักษร เอ็กซ์ตัวเลือกสามารถกำหนดลักษณะด้วยคำ (เช่น ประชากรในเมืองและในชนบท) หรือตัวเลข (เช่น การจัดกลุ่มคนงานตามคุณสมบัติ: 1, 2, 3, 4, 5, 6 หมวดหมู่)
- 2) จำนวนหน่วยในกลุ่มหรือของพวกเขา ความถ่วงจำเพาะทั้งหมด ตัวเลขที่แสดงความถี่ในการเรียกตัวแปรเฉพาะที่เกิดขึ้นในชุดการแจกจ่าย ความถี่กำหนด อักษรละติน- ความถี่จะเป็นจำนวนบวกเสมอ เพราะแม้จะระบุจำนวนครั้งที่ตัวแปรเกิดขึ้น แต่โดยธรรมชาติแล้วค่าเหล่านี้จะต้องไม่ต่ำกว่าศูนย์ ความถี่จะแสดงทั้งในค่าสัมบูรณ์ - จำนวนหน่วยในประชากรและค่าสัมพัทธ์ - ในรูปแบบของหุ้นหรือเปอร์เซ็นต์ของทั้งหมด
ความถี่ที่แสดงเป็นค่าสัมพัทธ์เรียกว่า ความถี่และถูกกำหนดโดยจดหมาย ง.ผลรวมของความถี่จะเท่ากับ 1 เสมอหากแสดงเป็นเศษส่วนของ 1 หรือ 100% หากแสดงเป็นเปอร์เซ็นต์ โดยทั่วไปแล้ว ทั้งความถี่และความถี่จะใช้ในการคำนวณลักษณะทั่วไป
ความถี่และความถี่ได้ สะสม (สะสม),เมื่อแสดงเป็นจำนวนเงินสะสมตามลำดับ
ผลรวมของความถี่ของซีรีย์การแจกแจงเรียกว่า ปริมาณประชากรและเขียนแทนด้วยอักษรละติน พี
ตัวอย่างการกระจายคนงาน ค่าจ้างนำเสนอในตาราง 2.20.
ตารางที่ 2.20
การแบ่งพนักงานตามเงินเดือน
มุมมองพิเศษแถวการกระจาย - ซีรีย์อันดับ,เมื่อมีการวางอันดับแทนความถี่หรือความถี่ อันดับ -นี่คือตัวเลขที่แสดงหมายเลขซีเรียลของตัวเลือกแอตทริบิวต์โดยเรียงลำดับจากน้อยไปหามากหรือจากมากไปน้อย
ประเภทของซีรีย์การจำหน่าย ชุดการจัดจำหน่ายแตกต่างกันไปตามประเภทและลักษณะของการเปลี่ยนแปลงลักษณะ (รูปที่ 2.4)
- 1. ตามประเภทของคุณลักษณะชุดการแจกจ่ายสามารถระบุแหล่งที่มาและแปรผันได้ ชุดคุณลักษณะ -เหล่านี้เป็นชุดที่แสดงลักษณะเฉพาะโดยใช้คำเฉพาะที่จับคุณสมบัติหรือคุณภาพของวัตถุหรือปรากฏการณ์ ซีรี่ส์รูปแบบต่างๆ- เหล่านี้เป็นชุดที่แสดงคุณลักษณะที่แตกต่างกันเป็นตัวเลข
- 2. ขึ้นอยู่กับลักษณะของการเปลี่ยนแปลงแยกความแตกต่างระหว่างอนุกรมความแปรผันแบบไม่ต่อเนื่องและช่วง
การเปลี่ยนแปลงแบบไม่ต่อเนื่องอนุกรมคืออนุกรมที่แสดงคุณลักษณะเป็นตัวเลขจำนวนหนึ่งโดยมีระดับความแม่นยำที่กำหนด การแปรผันของช่วงเวลาแถวคือแถวที่
ตัวเลือกจะได้รับเป็นช่วงเวลา ซีรีส์รูปแบบช่วงต่างๆ ผสมผสานรูปแบบต่างๆ ที่มีลักษณะต่อเนื่องหรือลักษณะเฉพาะที่ไม่ต่อเนื่องซึ่งมีอยู่ในช่วงกว้าง
ในรูปแบบกราฟิก สามารถพรรณนาชุดข้อมูลแบบแปรผันได้ เช่นเดียวกับชุดข้อมูลอาร์กิวเมนต์และค่าฟังก์ชันใดๆ โดยใช้ ระบบสี่เหลี่ยมพิกัด การแสดงภาพธรรมชาติของการเปลี่ยนแปลงความถี่ของอนุกรมความแปรผันนั้นกำหนดโดยรูปหลายเหลี่ยมและฮิสโตแกรมการแจกแจง
การแสดงแบบกราฟิกของชุดรูปแบบที่แยกจากกันจะถูกสร้างขึ้นในรูปแบบ สนามทดสอบการแจกแจง ซึ่งเป็นการแจกแจงตามคุณลักษณะ เอ็กซ์ในการสร้างมัน ค่าอันดับของคุณลักษณะที่แตกต่างกันจะถูกพล็อตตามแกน abscissa ในระดับเดียวกัน และค่าความถี่ (หรือความถี่) จะถูกพล็อตไปตามแกนกำหนด (รูปที่ 2.5) บางครั้งการปิดรูปหลายเหลี่ยม จุดสูงสุดเชื่อมต่อกับจุดบนแกน x และรับรูปหลายเหลี่ยม
การแสดงแบบกราฟิกของชุดการแปรผันช่วงเวลาจะถูกสร้างขึ้นในรูปแบบ ฮิสโตแกรมการแจกแจง เมื่อสร้างมันสำหรับซีรีย์รูปแบบที่มีช่วงเวลาที่เท่ากัน ขอบเขตของช่วงเวลาจะถูกพล็อตบนแกน Abscissa และโดยใช้ส่วนที่เป็นตัวแทนของช่วงเวลาเป็นฐาน สี่เหลี่ยมจะถูกสร้างขึ้นบนพวกมันด้วยความสูงเท่ากับความถี่ของช่วงเวลาที่กำหนด ผลลัพธ์ที่ได้คือการกระจายที่แสดงเป็นแถบที่อยู่ติดกัน ฮิสโตแกรมของการกระจายตัวของคนงานตามค่าจ้างรายเดือนแสดงไว้ในรูปที่ 1 2.6.
ข้าว. 2.5.
ข้าว. 2.6. ฮิสโตแกรมการกระจายสำหรับชุดรูปแบบที่เท่ากัน
เป็นระยะ
สำหรับอนุกรมช่วงเวลาที่มีช่วงเวลาที่ไม่เท่ากัน ฮิสโตแกรมของความหนาแน่นของการแจกแจงจะถูกสร้างขึ้น เนื่องจากในชุดที่มีช่วงเวลาที่ไม่เท่ากัน ความหนาแน่นของการแจกแจงจะให้แนวคิดเกี่ยวกับการครอบครองของแต่ละช่วงเวลา ความหนาแน่นของการกระจายถูกกำหนดโดยสูตร
พื้นที่ของสี่เหลี่ยมฮิสโตแกรมเท่ากับผลคูณของความหนาแน่นและค่าของช่วงเวลานั่นคือ ความถี่ ดังนั้นพื้นที่ของฮิสโตแกรมทั้งหมดจึงเป็นตัวเลขเท่ากับผลรวมของความถี่หรือจำนวนหน่วยประชากร
พิจารณาการกระจายตัวของประชากรในภูมิภาคเมืองตามอายุ (ตาราง 2.21) และพรรณนาเป็นภาพกราฟิก
ตารางที่ 2.21
การกระจายตัวของประชากรในภูมิภาคตามอายุ
กราฟการกระจายตัวของประชากรในภูมิภาคตามอายุแสดงไว้ในรูปที่ 1 2.7.
ข้าว. 2.7.
อนุกรมการแปรผันใดๆ สามารถแสดงเป็นกราฟในรูปแบบของเส้นโค้งความถี่สะสมตามฟังก์ชันของคุณลักษณะนั้น ตัวแปรหรือขอบเขตของช่วงเวลาจะถูกพล็อตบนแกน Abscissa และความถี่สะสมที่สอดคล้องกันจะถูกพล็อตบนแกนกำหนด จุดผลลัพธ์จะเชื่อมต่อกันด้วยเส้นต่อเนื่องซึ่งก็คือ สะสมการแสดงชุดรูปแบบต่างๆ เป็นการสะสมจะมีประสิทธิภาพมากกว่าหากแสดงความถี่เป็นความถี่ กราฟเส้นโค้งสะสมจะแสดงในรูป 2.8.
หากเมื่อแสดงชุดความแปรผันในรูปแบบกราฟิกสะสม แกนจะถูกสลับ เราก็จะได้ โอกิวาคำว่า "ogiva" สำหรับกราฟของเส้นโค้งสะสมของอนุกรมการแจกแจงถูกนำมาใช้ในปี พ.ศ. 2418 โดย
ข้าว. 2.8.
เอฟ. กัลตัน. เขาวางรากฐานสำหรับการใช้วิธีการแบบกราฟิกเพื่อกำหนดลักษณะทางสถิติทั่วไปของการแจกแจง เนื่องจากเขาพบค่ามัธยฐานและควอไทล์ตามทฤษฎี
การเปลี่ยนแปลงของซีรีย์รูปแบบต่างๆ อนุกรมรูปแบบสามารถแปลงได้: อนุกรมแยกเป็นอนุกรมช่วง และอนุกรมช่วงเป็นอนุกรมแยก
การแปลงอนุกรมแยกเป็นอนุกรมช่วงให้เรานำเสนอชุดการกระจายตัวของคนงานตามค่าจ้างแบบไม่ต่อเนื่องในรูปแบบของช่วงที่ 1 ในการทำเช่นนี้จำเป็นต้องคำนวณค่าของช่วงเวลาโดยใช้สูตร 2.1: ชั่วโมง =(9000 - 4000): 3 = 1,667 ถู (2,000 ถู.)
เราได้รับ:
การแปลงอนุกรมช่วงให้เป็นอนุกรมแบบไม่ต่อเนื่องหากต้องการแปลงอนุกรมช่วงเวลาที่มีช่วงเวลาที่ปิดให้เป็นอนุกรมที่ไม่ต่อเนื่อง ก็เพียงพอแล้วที่จะแทนที่ช่วงเวลาด้วยช่วงกึ่งกลาง
เราได้รับ:
ชุดการจัดจำหน่ายมีความหมายดังต่อไปนี้:
- 1) ซีรีย์รูปแบบทำหน้าที่เป็นวิธีการยุบหรือบีบอัดความหลากหลาย สื่อมวลชนในรูปแบบกะทัดรัดเป็นไปได้ที่จะตัดสินอย่างเป็นธรรมเกี่ยวกับธรรมชาติของการแปรผันเพื่อศึกษาความแตกต่างเฉพาะในลักษณะของปรากฏการณ์ที่รวมอยู่ในชุดที่กำลังศึกษา
- 2) ขึ้นอยู่กับชุดการแจกแจง ลักษณะทั่วไปพิเศษของประชากรจะถูกคำนวณ (ค่าเฉลี่ย รูปแบบ ค่ามัธยฐาน การกระจายตัว ฯลฯ) ซึ่งใช้สำหรับการวิเคราะห์เชิงลึกมากขึ้นของปรากฏการณ์และกระบวนการทางเศรษฐกิจและสังคม