วิธีหาค่ามัธยฐานของข้อมูลทางสถิติ การคำนวณค่ามัธยฐานของกลุ่มตัวเลข
4. แฟชั่น. ค่ามัธยฐาน ค่าเฉลี่ยทั่วไปและตัวอย่าง
โหมดจะอยู่บนหน้าจอ ค่ามัธยฐานอยู่ในสามเหลี่ยม และค่าเฉลี่ยคืออุณหภูมิในโรงพยาบาลและในวอร์ด เราดำเนินหลักสูตรภาคปฏิบัติของเราต่อไป สถิติที่น่าสนใจ (บทที่ 1)กำลังเรียน ลักษณะกลาง ประชากรทางสถิติซึ่งมีชื่อที่คุณเห็นในชื่อเรื่อง และเราจะเริ่มต้นจากจุดสิ้นสุดเพราะโอ้ ค่าเฉลี่ยบทสนทนาเริ่มต้นเกือบตั้งแต่ย่อหน้าแรกของหัวข้อ สำหรับผู้อ่านขั้นสูง สารบัญ:
- ค่าเฉลี่ยทั่วไปและตัวอย่าง– การคำนวณตามข้อมูลปฐมภูมิและสำหรับชุดความแปรผันแบบไม่ต่อเนื่องที่สร้างขึ้น
- แฟชั่น– คำจำกัดความและการพิจารณาคดีแยก
- ค่ามัธยฐาน – คำจำกัดความทั่วไปวิธีหาค่ามัธยฐาน
- ค่าเฉลี่ย โหมด และค่ามัธยฐานของอนุกรมการแปรผันช่วง– การคำนวณตามข้อมูลปฐมภูมิและอนุกรมที่เสร็จสิ้นแล้ว โหมดและสูตรมัธยฐาน
- ควอร์ไทล์ เดซิล เปอร์เซ็นไทล์ - สั้น ๆ เกี่ยวกับสิ่งสำคัญ
สำหรับ "หุ่นเชิด" ควรทำความคุ้นเคยกับเนื้อหาตามลำดับ:
ลองสำรวจดูบ้าง ประชากรปริมาตรคือคุณลักษณะเชิงตัวเลขไม่สำคัญ ไม่ต่อเนื่องหรือ อย่างต่อเนื่อง (บทที่ 2, 3).
มัธยมศึกษาตอนต้น
เรียกว่า ค่าเฉลี่ยเลขคณิตค่าทั้งหมดของชุดนี้:
หากในบรรดาตัวเลขมีเหมือนกัน (ซึ่งเป็นเรื่องปกติสำหรับ ซีรีส์ไม่ต่อเนื่อง)
จากนั้นสามารถเขียนสูตรให้อยู่ในรูปแบบที่กะทัดรัดยิ่งขึ้นได้:
, ที่ไหน
ตัวเลือกทำซ้ำหนึ่งครั้ง;
ตัวเลือก - หนึ่งครั้ง;
ตัวเลือก - หนึ่งครั้ง;
…
ตัวเลือก - หนึ่งครั้ง
ตัวอย่างการคำนวณสด มัธยมศึกษาทั่วไปพบกันใน ตัวอย่างที่ 2แต่เพื่อไม่ให้น่าเบื่อ ฉันจะไม่จำเนื้อหาด้วยซ้ำ
ต่อไป. อย่างที่เราจำได้กำลังประมวลผลทั้งหมด ประชากรมักจะยากหรือเป็นไปไม่ได้จึงจัดระบบ ตัวแทนตัวอย่าง ปริมาณและจากการศึกษาตัวอย่างนี้ จะได้ข้อสรุปเกี่ยวกับประชากรทั้งหมด
ค่าเฉลี่ยตัวอย่าง
เรียกว่า ค่าเฉลี่ยเลขคณิตค่าตัวอย่างทั้งหมด:
และหากมีตัวเลือกเหมือนกัน สูตรก็จะเขียนให้กระชับมากขึ้น:
– เป็นผลรวมของผลิตภัณฑ์ของตัวเลือกตามลำดับที่เกี่ยวข้อง ความถี่ .
ค่าเฉลี่ยตัวอย่างช่วยให้คุณประมาณมูลค่าที่แท้จริงได้อย่างแม่นยำ ซึ่งเพียงพอสำหรับการศึกษาหลายๆ เรื่อง นอกจากนี้ ยิ่งตัวอย่างมีขนาดใหญ่ การประมาณค่านี้ก็จะมีความแม่นยำมากขึ้นเท่านั้น
มาเริ่มฝึกกันดีกว่าหรือทำต่อด้วย ซีรีย์รูปแบบที่ไม่ต่อเนื่องและเงื่อนไขที่คุ้นเคย:
ตัวอย่างที่ 8
จากผลการศึกษาตัวอย่างของพนักงานเวิร์คช็อป ได้มีการกำหนดประเภทคุณสมบัติของพวกเขา: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3.
ยังไง ตัดสินใจงาน? หากเราได้รับ ข้อมูลหลัก(ค่าดิบดั้งเดิม) จากนั้นสามารถสรุปง่ายๆ และผลลัพธ์หารด้วยขนาดตัวอย่าง:
– หมวดหมู่คุณสมบัติทางสถิติโดยเฉลี่ยของพนักงานเวิร์คช็อป
แต่ในหลาย ๆ ปัญหาจำเป็นต้องเขียนชุดรูปแบบต่างๆ (ซม. ตัวอย่างที่ 4)
:
– หรือชุดนี้ถูกเสนอในตอนแรก (ซึ่งเกิดขึ้นบ่อยกว่า) และแน่นอนว่าเราใช้สูตร "อารยะ":
แฟชั่น
- โหมดของซีรีย์รูปแบบที่ไม่ต่อเนื่องคือ ตัวเลือกด้วยความถี่สูงสุด ในกรณีนี้. แฟชั่นนี้หาได้ง่ายบนโต๊ะและยังง่ายกว่าอีกด้วย ช่วงความถี่- นี่คือแอบซิสซานั่นเอง จุดสูงสุด:
บางครั้งมีค่าดังกล่าวหลายค่า (ที่มีความถี่สูงสุดเท่ากัน) จากนั้นแต่ละค่าจะถือเป็นโหมด
ถ้าทั้งหมดหรือเกือบทั้งหมด ตัวเลือกแตกต่าง (ซึ่งเป็นเรื่องปกติสำหรับ ซีรีย์ช่วงเวลา) จากนั้นค่าโมดอลจะถูกกำหนดในลักษณะที่แตกต่างออกไปเล็กน้อย ซึ่งจะกล่าวถึงในส่วนที่ 2 ของบทเรียน
ค่ามัธยฐาน - ค่ามัธยฐานของอนุกรมรูปแบบต่างๆ * – นี่คือค่าที่แบ่งออกเป็นสองส่วนเท่า ๆ กัน (ตามจำนวนตัวเลือก)
แต่ตอนนี้เราจำเป็นต้องหาค่าเฉลี่ย รูปแบบ และค่ามัธยฐาน
สารละลาย: เพื่อค้นหา เฉลี่ยตามข้อมูลหลัก เป็นการดีที่สุดที่จะสรุปตัวเลือกทั้งหมดและหารผลลัพธ์ตามปริมาณประชากร:
ถ้ำ หน่วย
อย่างไรก็ตามการคำนวณเหล่านี้จะใช้เวลาไม่นานนักเมื่อใช้เครื่องคิดเลขออฟไลน์ แต่ถ้าคุณมี Excel แน่นอน ตอกเข้าไปในเซลล์อิสระใดๆ =ผลรวม(ให้เลือกตัวเลขทั้งหมดด้วยเมาส์ ปิดวงเล็บ ) ,ใส่ป้ายแบ่ง / ให้ใส่ตัวเลข 30 แล้วกด เข้า- พร้อม.
ในส่วนของแฟชั่น การประเมินตามข้อมูลเบื้องต้นนั้นใช้ไม่ได้ แม้ว่าเราจะเห็นตัวเลขที่เหมือนกันในหมู่ตัวเลขเหล่านั้น อาจมีห้าหรือหกหรือเจ็ดรูปแบบที่มีความถี่สูงสุดเท่ากัน เช่น ความถี่ 2 นอกจากนี้ ราคาอาจถูกปัดเศษ ดังนั้นค่าโมดอลจึงคำนวณโดยใช้ชุดช่วงเวลาที่สร้างขึ้น (เพิ่มเติมในภายหลังเล็กน้อย).
สิ่งที่ไม่สามารถพูดเกี่ยวกับค่ามัธยฐานได้: เข้าสู่ Excel =ค่ามัธยฐาน(ให้เลือกตัวเลขทั้งหมดด้วยเมาส์ ปิดวงเล็บ ) และกด เข้า- ยิ่งกว่านั้นคุณไม่จำเป็นต้องเรียงลำดับอะไรที่นี่ด้วยซ้ำ
แต่ใน ตัวอย่างที่ 6เรียงตามลำดับจากน้อยไปหามาก (จำและจัดเรียง – ลิงค์ด้านบน)และสิ่งนี้ โอกาสที่ดีทำซ้ำอัลกอริทึมอย่างเป็นทางการเพื่อค้นหาค่ามัธยฐาน แบ่งขนาดตัวอย่างลงครึ่งหนึ่ง:
และเนื่องจากประกอบด้วยตัวเลือกจำนวนคู่ ค่ามัธยฐานจึงเท่ากับค่าเฉลี่ยเลขคณิตของตัวเลือกที่ 15 และ 16 เป็นระเบียบเรียบร้อย(!) ซีรี่ส์รูปแบบต่างๆ:
ถ้ำ หน่วย
สถานการณ์ที่สอง- เมื่อได้รับชุดช่วงเวลาสำเร็จรูป (งานการศึกษาทั่วไป)
เรายังคงวิเคราะห์ตัวอย่างเดียวกันกับบูทต่อไป โดยอ้างอิงจากข้อมูลเบื้องต้น IVR ได้รับการเรียบเรียงแล้ว- เพื่อคำนวณ เฉลี่ยจะต้องมีจุดกึ่งกลางของช่วงเวลา:
– เพื่อใช้สูตรกรณีไม่ต่อเนื่องที่คุ้นเคย:
- ผลลัพธ์ดีเยี่ยม! ความคลาดเคลื่อนกับค่าที่แม่นยำยิ่งขึ้น () ที่คำนวณจากข้อมูลหลักคือ 0.04 เท่านั้น
โดยพื้นฐานแล้ว ที่นี่เราได้ประมาณอนุกรมช่วงเวลาแบบไม่ต่อเนื่อง และการประมาณนี้กลับกลายเป็นว่ามีประสิทธิผลมาก อย่างไรก็ตาม ไม่มีประโยชน์ใดเป็นพิเศษที่นี่ เนื่องจาก... ด้วยความทันสมัย ซอฟต์แวร์การคำนวณค่าที่แน่นอนไม่ใช่เรื่องยากแม้จะมาจากข้อมูลหลักที่มีอาร์เรย์จำนวนมากก็ตาม แต่นี่เป็นเงื่อนไขว่าเรารู้จักพวกเขา :)
ด้วยตัวชี้วัดกลางอื่นๆ ทุกอย่างจะน่าสนใจยิ่งขึ้น
หากต้องการค้นหาแฟชั่นคุณต้องค้นหา ช่วงเวลากิริยา
(มีความถี่สูงสุด)– ในปัญหานี้ นี่คือช่วงที่มีความถี่ 11 และใช้สูตรที่น่ากลัวต่อไปนี้:
, ที่ไหน:
– ขีดจำกัดล่างของช่วงเวลาโมดอล
– ความยาวของช่วงเวลาโมดอล
– ความถี่ของช่วงเวลากิริยา;
– ความถี่ของช่วงเวลาก่อนหน้า
– ความถี่ของช่วงเวลาถัดไป
ดังนั้น:
ถ้ำ หน่วย อย่างที่คุณเห็นราคารองเท้าบู๊ตที่ "ทันสมัย" นั้นแตกต่างอย่างเห็นได้ชัดจากค่าเฉลี่ยเลขคณิต
ฉันจะให้โดยไม่ต้องคำนึงถึงเรขาคณิตของสูตร ฮิสโตแกรมความถี่สัมพัทธ์และฉันจะสังเกต:
ซึ่งจะเห็นได้อย่างชัดเจนว่าโหมดถูกเลื่อนโดยสัมพันธ์กับจุดศูนย์กลางของช่วงโมดอลไปทางช่วงซ้ายด้วยความถี่ที่สูงกว่า ตรรกะ
ให้ฉันดูบางกรณีที่หายาก:
– หากช่วงเวลาโมดอลสุดขีด ดังนั้น ;
– ถ้าเราพบช่วงเวลาโมดอล 2 ช่วงที่อยู่ใกล้เคียง และ จากนั้นเราจะพิจารณาช่วงโมดอล และถ้าเป็นไปได้ เราก็จะขยายช่วงเวลาใกล้เคียง (ทางด้านซ้ายและด้านขวา) ขึ้น 2 เท่า
– หากมีระยะห่างระหว่างช่วงโมดอล เราจะใช้สูตรกับแต่ละช่วง ดังนั้นจึงได้โหมด 2 โหมดขึ้นไป
นี่คือโหมดการจัดส่ง :)
และมีค่ามัธยฐาน หากให้อนุกรมช่วงเวลาสำเร็จรูป ค่ามัธยฐานจะถูกคำนวณโดยใช้สูตรที่น่ากลัวน้อยกว่าเล็กน้อย แต่ก่อนอื่นจะพบว่าน่าเบื่อ (พิมพ์ผิดของฟรอยด์ :)) ช่วงเวลามัธยฐาน – นี่คือช่วงที่มีตัวเลือก (หรือ 2 ตัวเลือก) ซึ่งแบ่งชุดรูปแบบออกเป็นสองส่วนเท่าๆ กัน
ข้างต้นฉันบอกคุณถึงวิธีกำหนดค่ามัธยฐานโดยเน้นที่ ความถี่สะสมสัมพัทธ์ที่นี่สะดวกกว่าในการคำนวณความถี่สะสม "ปกติ" อัลกอริธึมการคำนวณเหมือนกันทุกประการ - เราย้ายค่าแรกไปทางซ้าย (ลูกศรสีแดง)และแต่ละอันถัดไปจะได้มาเป็นผลรวมของอันก่อนหน้าด้วยความถี่ปัจจุบันจากคอลัมน์ด้านซ้าย (สัญลักษณ์สีเขียวเป็นตัวอย่าง):
ทุกคนเข้าใจความหมายของตัวเลขในคอลัมน์ด้านขวาหรือไม่? – นี่คือจำนวนของตัวเลือกที่สามารถ "สะสม" ในช่วง "ผ่าน" ทั้งหมด รวมถึงช่วงปัจจุบันด้วย
เนื่องจากเรามีตัวเลือกจำนวนเท่ากัน (30 ชิ้น) ค่ามัธยฐานจะเป็นช่วงที่ประกอบด้วย 30/2 = ตัวเลือกที่ 15 และ 16 และขึ้นอยู่กับความถี่ที่สะสมจึงเป็นเรื่องง่ายที่จะสรุปได้ว่าตัวเลือกเหล่านี้มีอยู่ในช่วงเวลานั้น
สูตรมัธยฐาน:
, ที่ไหน:
– ปริมาณประชากรทางสถิติ
– ขีดจำกัดล่างของช่วงค่ามัธยฐาน
– ความยาวของช่วงค่ามัธยฐาน
– ความถี่ช่วงเวลามัธยฐาน;
– ความถี่สะสม ก่อนหน้าช่วงเวลา
ดังนั้น:
ถ้ำ หน่วย – โปรดทราบว่าค่ามัธยฐานกลับกลายเป็นว่าเลื่อนไปทางขวาเพราะว่า โดย มือขวามีตัวเลือกจำนวนมาก:
และสำหรับการอ้างอิงเป็นกรณีพิเศษ
ตัวเลือกที่อยู่ตรงกลางของแถวจัดอันดับเรียกว่า
ค่ามัธยฐานแบ่งอนุกรมออกเป็นสองส่วนเท่า ๆ กันในลักษณะที่มีทั้งสองด้าน จำนวนเท่ากันหน่วยของประชากร ในเวลาเดียวกันในครึ่งหนึ่งของหน่วยประชากรค่าของลักษณะที่แตกต่างกันจะไม่เกินค่ามัธยฐานและอีกครึ่งหนึ่งก็ไม่น้อย -
สำหรับซีรีย์แยก
เราค้นหาค่ามัธยฐานโดยใช้อัลกอริทึมต่อไปนี้:
เราจัดอันดับซีรีส์
หากตัวอย่างมีจำนวนองค์ประกอบเป็นเลขคี่ ค่ามัธยฐานจะเป็นดังนี้ (n+1)/2-องค์ประกอบที่
หากตัวอย่างมีจำนวนองค์ประกอบเป็นเลขคู่ ค่ามัธยฐานจะอยู่ระหว่างองค์ประกอบตรงกลางสององค์ประกอบของตัวอย่าง และเท่ากับค่าเฉลี่ยเลขคณิตที่คำนวณจากองค์ประกอบทั้งสองนี้
ตัวอย่างที่ 1- หาค่ามัธยฐาน ซีรีส์ไม่ต่อเนื่อง
16,13,15,10,19,22,25,12,18,14,19,14,16,10.
สารละลาย.เราจัดอันดับอนุกรม: 10,10,12,13,14,14,15,16,16,18,19,19,22,25 ตัวอย่างมีจำนวนองค์ประกอบเป็นเลขคู่ n=14 ดังนั้นค่ามัธยฐานจึงอยู่ระหว่าง องค์ประกอบตรงกลางสองรายการของตัวอย่าง - ระหว่าง 7 องค์ประกอบและ 8 องค์ประกอบ:
10,10,12,13,14,14,15,16, 16,18,19,19,22,25
และเท่ากับค่าเฉลี่ยเลขคณิตขององค์ประกอบเหล่านี้:
ฉัน=(15+16)/2=15.5
คุณสามารถหาค่ามัธยฐานของอนุกรมแยกกันทางออนไลน์ได้โดยใช้เครื่องคิดเลขนี้ เครื่องคิดเลขจะจัดอันดับอนุกรมและคำนวณค่ามัธยฐานโดยอัตโนมัติ
เมื่อคำนวณค่ามัธยฐาน สำหรับอนุกรมความแปรผันตามช่วงเวลาขั้นแรก ให้กำหนดช่วงค่ามัธยฐานซึ่งค่ามัธยฐานตั้งอยู่ จากนั้นจึงกำหนดค่าของค่ามัธยฐานโดยใช้สูตร:
ตัวอย่าง 2. ค้นหาค่ามัธยฐานของอนุกรมช่วงเวลา:
สารละลาย:
ช่วงมัธยฐานอยู่ใน กลุ่มอายุ 25-30 ปี เนื่องจากภายในช่วงเวลานี้มีตัวเลือกที่แบ่งประชากรออกเป็นสองส่วนเท่า ๆ กัน
(Σf ผม /2 = 3462/2 = 1731)
ซึ่งหมายความว่าครึ่งหนึ่งของนักเรียนมีอายุต่ำกว่า 27.4 ปี และอีกครึ่งหนึ่งมีอายุมากกว่า 27.4 ปี
ลักษณะเฉพาะ
- ค่ามัธยฐานก็มี มีความทนทานสูงนั่นคือความไม่รู้สึกตัวต่อความไม่เป็นเนื้อเดียวกันและข้อผิดพลาดในการสุ่มตัวอย่าง
- ผลรวมของความแตกต่างระหว่างสมาชิกของชุดตัวอย่างและค่ามัธยฐานน้อยกว่าผลรวมของความแตกต่างเหล่านี้กับค่าอื่น ๆ รวมถึงค่าเฉลี่ยเลขคณิตด้วย
โหมดและค่ามัธยฐาน– ค่าเฉลี่ยชนิดพิเศษที่ใช้ศึกษาโครงสร้างของอนุกรมความแปรผัน บางครั้งเรียกว่าค่าเฉลี่ยเชิงโครงสร้าง ตรงกันข้ามกับค่าเฉลี่ยกำลังที่กล่าวถึงก่อนหน้านี้
แฟชั่น– นี่คือค่าของคุณลักษณะ (ตัวแปร) ที่พบบ่อยที่สุดในประชากรที่กำหนด เช่น มีความถี่สูงสุด
แฟชั่นมีการนำไปประยุกต์ใช้ในทางปฏิบัติได้เป็นอย่างดี และในบางกรณี เฉพาะแฟชั่นเท่านั้นที่สามารถกำหนดลักษณะเฉพาะของปรากฏการณ์ทางสังคมได้
ค่ามัธยฐาน- นี่คือตัวแปรที่อยู่ตรงกลางของซีรีย์รูปแบบที่เรียงลำดับ
ค่ามัธยฐานแสดงขีดจำกัดเชิงปริมาณของค่าของคุณลักษณะที่แตกต่างกัน ซึ่งถึงครึ่งหนึ่งของหน่วยในประชากร แนะนำให้ใช้ค่ามัธยฐานร่วมกับค่าเฉลี่ยหรือแทนค่านั้นหากมีช่วงเปิดในชุดรูปแบบต่างๆ เนื่องจาก ในการคำนวณค่ามัธยฐานไม่จำเป็นต้องมีการกำหนดขอบเขตของช่วงเวลาเปิดแบบมีเงื่อนไขดังนั้นการขาดข้อมูลเกี่ยวกับสิ่งเหล่านั้นจึงไม่ส่งผลกระทบต่อความแม่นยำของการคำนวณค่ามัธยฐาน
ค่ามัธยฐานยังใช้เมื่อไม่ทราบตัวบ่งชี้ที่จะใช้เป็นน้ำหนัก ค่ามัธยฐานจะใช้แทนค่าเฉลี่ยเลขคณิตในวิธีการทางสถิติของการควบคุมคุณภาพผลิตภัณฑ์ ผลรวมของการเบี่ยงเบนสัมบูรณ์ของตัวเลือกจากค่ามัธยฐานน้อยกว่าจำนวนอื่นใด
ลองพิจารณาการคำนวณโหมดและค่ามัธยฐานในชุดรูปแบบที่แยกจากกัน :
กำหนดโหมดและค่ามัธยฐาน
แฟชั่นโม = 4 ปี เนื่องจากค่านี้สอดคล้องกับความถี่สูงสุด f = 5
เหล่านั้น. จำนวนมากที่สุดคนงานมีประสบการณ์ 4 ปี
ในการคำนวณค่ามัธยฐาน อันดับแรกเราจะหาผลรวมครึ่งหนึ่งของความถี่ก่อน หากผลรวมของความถี่เป็นเลขคี่ เราจะบวกหนึ่งเข้ากับผลรวมนี้ก่อนแล้วจึงหารครึ่ง:
ค่ามัธยฐานจะเป็นตัวเลือกที่แปด
เพื่อหาว่าตัวเลือกใดจะเป็นตัวที่ 8 ตามจำนวน เราจะสะสมความถี่จนกว่าเราจะได้ผลรวมของความถี่เท่ากับหรือมากกว่าครึ่งหนึ่งของผลรวมของความถี่ทั้งหมด ตัวเลือกที่เกี่ยวข้องจะเป็นค่ามัธยฐาน
เอิ่ม. = 4 ปี
เหล่านั้น. ครึ่งหนึ่งของคนงานมีประสบการณ์น้อยกว่าสี่ปี และอีกครึ่งหนึ่ง
หากผลรวมของความถี่สะสมต่อตัวเลือกหนึ่งเท่ากับครึ่งหนึ่งของผลรวมของความถี่ ค่ามัธยฐานจะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตของตัวเลือกนี้และตัวเลือกถัดไป
การคำนวณโหมดและค่ามัธยฐานในชุดการแปรผันช่วงเวลา
โหมดในชุดการเปลี่ยนแปลงช่วงเวลาคำนวณโดยสูตร
ที่ไหน เอ็กซ์ M0- ขอบเขตเริ่มต้นของช่วงเวลากิริยา
ชม.ม 0 – ค่าของช่วงเวลากิริยา
ฉม 0 , ฉม 0-1 , ฉม 0+1 – ความถี่ของช่วงโมดอลก่อนและหลังช่วงโมดอล ตามลำดับ
เป็นกิริยาช่วยเรียกว่าช่วงเวลาที่ความถี่สูงสุดสอดคล้องกัน
ตัวอย่างที่ 1
กลุ่มตามประสบการณ์ |
จำนวนคนงานคน |
ความถี่สะสม |
กำหนดโหมดและค่ามัธยฐาน
ช่วงเวลากิริยาเพราะ มันสอดคล้องกับความถี่สูงสุด f = 35 จากนั้น:
อืม 0 =6, เอฟเอ็ม 0 =35
ทฤษฎีสั้น ๆ
วิธีทางสถิติที่ใช้กันอย่างแพร่หลายที่สุดคือ วิธีเชิงโครงสร้าง ซึ่งรวมถึงโหมดและค่ามัธยฐาน (วิธีแบบไม่มีพารามิเตอร์)
แฟชั่น- ค่าของคุณลักษณะ (ตัวแปร) ที่เกิดขึ้นในชุดการแจกแจงที่มีความถี่สูงสุด (น้ำหนัก) แฟชั่น (Mo) ใช้เพื่อระบุมูลค่าของคุณลักษณะที่แพร่หลายมากที่สุด (ราคาในตลาดที่มียอดขายสูงสุดของผลิตภัณฑ์ที่กำหนด จำนวนรองเท้าที่ใช้ เป็นที่ต้องการมากที่สุดจากผู้ซื้อ ฯลฯ) โหมดนี้ใช้กับประชากรจำนวนมากเท่านั้น ในซีรีย์แยกกัน โหมดนี้จะพบเป็นตัวแปรที่มีความถี่สูงสุด ในซีรีย์ช่วงเวลา ขั้นแรกจะมีช่วงเวลาโมดอล นั่นคือช่วงเวลาที่มีความถี่สูงสุด จากนั้น - ค่าโดยประมาณของค่าโมดอลของแอตทริบิวต์ตามสูตร:
– ขีดจำกัดล่างของช่วงเวลาโมดอล
- ค่าของช่วงเวลากิริยา
– ความถี่ของช่วงเวลาก่อนโมดอล
– ความถี่ช่วงกิริยาช่วย
– ความถี่ของช่วงเวลาตามกิริยา
ควอนไทล์- ปริมาณที่แบ่งเซตออกเป็นองค์ประกอบจำนวนหนึ่งที่มีส่วนเท่ากัน ควอนไทล์ที่มีชื่อเสียงที่สุดคือค่ามัธยฐาน ซึ่งแบ่งประชากรออกเป็นสองส่วนเท่าๆ กัน นอกจากค่ามัธยฐานแล้ว ยังมักใช้ควอไทล์ โดยแบ่งอนุกรมที่ได้รับการจัดอันดับออกเป็น 4 ส่วนเท่าๆ กัน เดซิล - 10 ส่วน และเปอร์เซ็นไทล์ - ออกเป็น 100 ส่วน
ค่ามัธยฐาน- ค่าของแอตทริบิวต์สำหรับหน่วยที่อยู่ตรงกลางของซีรีส์อันดับ (เรียงลำดับ) หากชุดการแจกแจงแสดงด้วยค่าเฉพาะของคุณลักษณะ ค่ามัธยฐาน (Me) จะถูกพบเป็นค่ากลางของคุณลักษณะ
หากชุดการแจกแจงไม่ต่อเนื่องกัน ค่ามัธยฐานจะพบเป็นค่ากลางของแอตทริบิวต์ (เช่น หากจำนวนค่าเป็นเลขคี่ - 45 ก็จะสอดคล้องกับค่าที่ 23 ของแอตทริบิวต์ในชุดค่า จัดเรียงจากน้อยไปหามากหากจำนวนค่าเป็นเลขคู่ - 44 ค่ามัธยฐานจะสอดคล้องกับครึ่งหนึ่งของผลรวมของค่าคุณลักษณะ 22 และ 23 ค่า)
หากอนุกรมการแจกแจงเป็นช่วง ให้ค้นหาช่วงค่ามัธยฐานซึ่งมีหน่วยที่อยู่ตรงกลางของอนุกรมการจัดอันดับ ในการกำหนดช่วงเวลานี้ ผลรวมของความถี่จะถูกแบ่งออกเป็นครึ่งหนึ่ง และขึ้นอยู่กับการสะสมตามลำดับ (ผลรวม) ของความถี่ช่วงเวลา โดยเริ่มจากช่วงแรก ซึ่งเป็นช่วงเวลาที่พบค่ามัธยฐาน ค่ามัธยฐานใน ซีรีย์ช่วงเวลาคำนวณโดยสูตร:
- ขีดจำกัดล่างของช่วงค่ามัธยฐาน
- ค่าของช่วงมัธยฐาน
ผลรวมของอนุกรมความถี่
– ผลรวมของความถี่สะสมในช่วงก่อนค่ามัธยฐาน
– ความถี่ของช่วงมัธยฐาน
ควอไทล์- นี่คือค่าของคุณลักษณะในชุดอันดับ โดยเลือกในลักษณะที่ 25% ของหน่วยในประชากรจะน้อยกว่าค่า 25% ของหน่วยจะอยู่ระหว่าง และ; 25% อยู่ระหว่าง และ ส่วนที่เหลืออีก 25% เกิน ควอไทล์ถูกกำหนดโดยใช้สูตรที่คล้ายกับสูตรในการคำนวณค่ามัธยฐาน สำหรับอนุกรมช่วงเวลา:
เดซิลเป็นตัวแปรโครงสร้างที่แบ่งการแจกแจงออกเป็น 10 ส่วนเท่าๆ กันตามจำนวนหน่วยในประชากร มี 9 เดซิล และ 10 กลุ่มเดซิลถูกกำหนดโดยใช้สูตรที่คล้ายกับสูตรคำนวณค่ามัธยฐานและควอไทล์
โดยทั่วไป สูตรทั่วไปสำหรับการคำนวณควอนไทล์ในชุดช่วงเวลามีดังนี้
– เลขลำดับของควอนไทล์
– มิติเชิงปริมาณ (ควอร์ไทล์เหล่านี้แบ่งประชากรออกเป็นกี่ส่วน)
– ขีดจำกัดล่างของช่วงควอไทล์
– ความกว้างของช่วงควอนไทล์
ความถี่สะสมของช่วงก่อนควอนไทล์
สำหรับอนุกรมที่ไม่ต่อเนื่อง สามารถหาจำนวนควอนไทล์ได้โดยใช้สูตร:
ตัวอย่างการแก้ปัญหา
เงื่อนไขของภารกิจที่ 1 (ซีรีส์จัดอันดับแยก)
จากผลการวิจัยพบว่ามีรายได้เฉลี่ยต่อเดือนของผู้อยู่อาศัยในทางเข้าเดียว:
กำหนด:
รายได้กิริยาและค่ามัธยฐาน ปริมาณและเดซิลของรายได้
การแก้ปัญหา
เรามีซีรี่ส์จัดอันดับอยู่แล้ว - มูลค่ารายได้ของผู้อยู่อาศัยจะกระจายตามลำดับจากน้อยไปหามาก
แฟชั่นเป็นความหมายที่พบบ่อยที่สุด ในกรณีนี้ เรามีซีรีส์ที่มีสองโหมด
ค่ามัธยฐานคือค่าของแอตทริบิวต์ที่แบ่งชุดข้อมูลที่เรียงลำดับไว้ครึ่งหนึ่ง
ควอร์ไทล์คือค่าของคุณลักษณะในชุดจัดอันดับ โดยเลือกในลักษณะที่ 25% ของหน่วยในประชากรจะน้อยกว่าค่า ; 25% ของหน่วยจะอยู่ระหว่าง และ ; 25% - ระหว่าง และ ; ส่วนที่เหลืออีก 25% นั้นเหนือกว่า
Dicili แบ่งแถวออกเป็น 10 ส่วนเท่า ๆ กัน:
หากคุณไม่ต้องการความช่วยเหลือในตอนนี้ แต่อาจต้องการความช่วยเหลือในอนาคต เพื่อไม่ให้ขาดการติดต่อ เข้าร่วมกลุ่มวีเค.
เงื่อนไขปัญหา 2 (อนุกรมช่วง)
เพื่อกำหนดขนาดเงินฝากเฉลี่ยของสถาบันสินเชื่อ ข้อมูลต่อไปนี้ได้รับ:
คำนวณค่าเฉลี่ยโครงสร้าง (โหมด, ค่ามัธยฐาน, ควอร์ไทล์)
การแก้ปัญหา
ให้เราคำนวณโหมดของขนาดการบริจาค:
Mode คือตัวเลือกที่สอดคล้องกับความถี่สูงสุด
โหมดนี้คำนวณโดยสูตร:
จุดเริ่มต้นของช่วงเวลาโมดอล
ขนาดช่วง
ความถี่ช่วงโมดอล
ความถี่ของช่วงเวลาก่อนโมดอล
ความถี่ของช่วงเวลาตามโมดอล
ดังนั้นจำนวนเงินฝากที่ใหญ่ที่สุดคือ 30.7 พันรูเบิล
ค่ามัธยฐานคือตัวเลือกที่อยู่ตรงกลางของชุดการแจกจ่าย
ค่ามัธยฐานคำนวณโดยใช้สูตร:
เริ่มต้น (ขีดจำกัดล่าง) ของช่วงค่ามัธยฐาน
ขนาดช่วง
ผลรวมของความถี่ทั้งหมดของซีรีย์
ความถี่ช่วงมัธยฐาน
ผลรวมของความถี่สะสมของตัวแปรต่อค่ามัธยฐาน
ดังนั้นเงินฝากครึ่งหนึ่งจึงมีมากถึง 28,000 รูเบิล และอีกครึ่งหนึ่งมีมากกว่า 28,000 รูเบิล
มาคำนวณควอไทล์กัน:
ดังนั้นเงินฝาก 25% น้อยกว่า 20.8 พันรูเบิล 25% ของเงินฝากอยู่ในช่วง 20.8 พันรูเบิล มากถึง 28,000 รูเบิล 25% อยู่ในช่วง 28,000 รูเบิล มากถึง 33,000 รูเบิล มากกว่ามูลค่า 33,000 รูเบิล 25%
เงื่อนไขปัญหา 3
สร้างกราฟสำหรับชุดรูปแบบต่างๆ แสดงโหมด ค่ามัธยฐาน ค่าเฉลี่ย และควอไทล์บนกราฟ
วิธีแก้ปัญหา 3
มาคำนวณค่าเฉลี่ยกัน: เมื่อต้องการทำสิ่งนี้ ให้รวมผลคูณของจุดกึ่งกลางของช่วงเวลาและความถี่ที่สอดคล้องกัน แล้วหารผลรวมผลลัพธ์ด้วยผลรวมของความถี่
โหมดและค่ามัธยฐาน– ค่าเฉลี่ยชนิดพิเศษที่ใช้ศึกษาโครงสร้างของอนุกรมความแปรผัน บางครั้งเรียกว่าค่าเฉลี่ยเชิงโครงสร้าง ตรงกันข้ามกับค่าเฉลี่ยกำลังที่กล่าวถึงก่อนหน้านี้
แฟชั่น– นี่คือค่าของคุณลักษณะ (ตัวแปร) ที่พบบ่อยที่สุดในประชากรที่กำหนด เช่น มีความถี่สูงสุด
แฟชั่นมีการนำไปประยุกต์ใช้ในทางปฏิบัติได้เป็นอย่างดี และในบางกรณี เฉพาะแฟชั่นเท่านั้นที่สามารถกำหนดลักษณะเฉพาะของปรากฏการณ์ทางสังคมได้
ค่ามัธยฐาน- นี่คือตัวแปรที่อยู่ตรงกลางของซีรีย์รูปแบบที่เรียงลำดับ
ค่ามัธยฐานแสดงขีดจำกัดเชิงปริมาณของค่าของคุณลักษณะที่แตกต่างกัน ซึ่งถึงครึ่งหนึ่งของหน่วยในประชากร แนะนำให้ใช้ค่ามัธยฐานร่วมกับค่าเฉลี่ยหรือแทนค่านั้นหากมีช่วงเปิดในชุดรูปแบบต่างๆ เนื่องจาก ในการคำนวณค่ามัธยฐานไม่จำเป็นต้องมีการกำหนดขอบเขตของช่วงเวลาเปิดแบบมีเงื่อนไขดังนั้นการขาดข้อมูลเกี่ยวกับสิ่งเหล่านั้นจึงไม่ส่งผลกระทบต่อความแม่นยำของการคำนวณค่ามัธยฐาน
ค่ามัธยฐานยังใช้เมื่อไม่ทราบตัวบ่งชี้ที่จะใช้เป็นน้ำหนัก ค่ามัธยฐานจะใช้แทนค่าเฉลี่ยเลขคณิตในวิธีการทางสถิติของการควบคุมคุณภาพผลิตภัณฑ์ ผลรวมของการเบี่ยงเบนสัมบูรณ์ของตัวเลือกจากค่ามัธยฐานน้อยกว่าจำนวนอื่นใด
ลองพิจารณาการคำนวณโหมดและค่ามัธยฐานในชุดรูปแบบที่แยกจากกัน :
กำหนดโหมดและค่ามัธยฐาน
แฟชั่นโม = 4 ปี เนื่องจากค่านี้สอดคล้องกับความถี่สูงสุด f = 5
เหล่านั้น. คนงานจำนวนมากที่สุดมีประสบการณ์ 4 ปี
ในการคำนวณค่ามัธยฐาน อันดับแรกเราจะหาผลรวมครึ่งหนึ่งของความถี่ก่อน หากผลรวมของความถี่เป็นเลขคี่ เราจะบวกหนึ่งเข้ากับผลรวมนี้ก่อนแล้วจึงหารครึ่ง:
ค่ามัธยฐานจะเป็นตัวเลือกที่แปด
เพื่อหาว่าตัวเลือกใดจะเป็นตัวที่ 8 ตามจำนวน เราจะสะสมความถี่จนกว่าเราจะได้ผลรวมของความถี่เท่ากับหรือมากกว่าครึ่งหนึ่งของผลรวมของความถี่ทั้งหมด ตัวเลือกที่เกี่ยวข้องจะเป็นค่ามัธยฐาน
เอิ่ม. = 4 ปี
เหล่านั้น. ครึ่งหนึ่งของคนงานมีประสบการณ์น้อยกว่าสี่ปี และอีกครึ่งหนึ่ง
หากผลรวมของความถี่สะสมต่อตัวเลือกหนึ่งเท่ากับครึ่งหนึ่งของผลรวมของความถี่ ค่ามัธยฐานจะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตของตัวเลือกนี้และตัวเลือกถัดไป
การคำนวณโหมดและค่ามัธยฐานในชุดการแปรผันช่วงเวลา
โหมดในชุดการเปลี่ยนแปลงช่วงเวลาคำนวณโดยสูตร
ที่ไหน เอ็กซ์ M0- ขอบเขตเริ่มต้นของช่วงเวลากิริยา
ชม.ม 0 – ค่าของช่วงเวลากิริยา
ฉม 0 , ฉม 0-1 , ฉม 0+1 – ความถี่ของช่วงโมดอลก่อนและหลังช่วงโมดอล ตามลำดับ
เป็นกิริยาช่วยเรียกว่าช่วงเวลาที่ความถี่สูงสุดสอดคล้องกัน
ตัวอย่างที่ 1
กลุ่มตามประสบการณ์ |
จำนวนคนงานคน |
ความถี่สะสม |
กำหนดโหมดและค่ามัธยฐาน
ช่วงเวลากิริยาเพราะ มันสอดคล้องกับความถี่สูงสุด f = 35 จากนั้น:
อืม 0 =6, เอฟเอ็ม 0 =35
ชม.ม 0 =2, เอฟเอ็ม 0-1 =20
เอฟเอ็ม 0+1 =11
สรุป: คนงานจำนวนมากที่สุดมีประสบการณ์ประมาณ 6.7 ปี
สำหรับอนุกรมช่วงเวลา Me จะถูกคำนวณโดยใช้สูตรต่อไปนี้:
ที่ไหน อืม จ– ขอบล่างของช่วงตรงกลาง
อืม จ– ขนาดของช่วงตรงกลาง
– ครึ่งหนึ่งของผลรวมของความถี่
เอฟเอ็ม จ– ความถี่ของช่วงมัธยฐาน
เอสเอ็ม อี-1– ผลรวมของความถี่สะสมของช่วงก่อนค่ามัธยฐาน
ช่วงมัธยฐานคือช่วงเวลาที่สอดคล้องกับความถี่สะสมเท่ากับหรือมากกว่าครึ่งหนึ่งของผลรวมของความถี่
ลองหาค่ามัธยฐานสำหรับตัวอย่างของเรากัน
เนื่องจาก 82>50 ดังนั้นช่วงค่ามัธยฐานคือ
อืม จ =6, เอฟเอ็ม จ =35,
อืม จ =2, เอสเอ็ม อี-1 =47,
สรุป: ครึ่งหนึ่งของคนงานมีประสบการณ์น้อยกว่า 6.16 ปี และครึ่งหนึ่งมีประสบการณ์มากกว่า 6.16 ปี