ค่าเฉลี่ยจะถูกระบุด้วยตัวอักษรตัวใด ค่าเฉลี่ยเลขคณิต
ประเภทของค่าเฉลี่ยที่พบบ่อยที่สุดคือค่าเฉลี่ยเลขคณิต
ค่าเฉลี่ยเลขคณิตอย่างง่าย
ค่าเฉลี่ยเลขคณิตอย่างง่ายคือระยะเฉลี่ยในการพิจารณาว่าปริมาตรรวมของคุณลักษณะที่กำหนดในข้อมูลใดมีการกระจายเท่ากันในทุกหน่วยที่รวมอยู่ในประชากรที่กำหนด ดังนั้นผลผลิตเฉลี่ยต่อปีต่อพนักงานคือจำนวนผลผลิตที่พนักงานแต่ละคนจะผลิตได้หากปริมาณผลผลิตทั้งหมดมีการกระจายอย่างเท่าเทียมกันในหมู่พนักงานทุกคนขององค์กร ค่าง่าย ๆ ของค่าเฉลี่ยเลขคณิตคำนวณโดยใช้สูตร:
ตัวอย่างที่ 1 - ทีมงาน 6 คนได้รับ 3 3.2 3.3 3.5 3.8 3.1 พันรูเบิลต่อเดือนค่าเฉลี่ยเลขคณิตอย่างง่าย— เท่ากับอัตราส่วนของผลรวมของค่าแต่ละค่าของคุณลักษณะต่อจำนวนคุณลักษณะในการรวม
ค้นหาเงินเดือนโดยเฉลี่ย
วิธีแก้ปัญหา: (3 + 3.2 + 3.3 +3.5 + 3.8 + 3.1) / 6 = 3.32,000 รูเบิล
ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก
ถ้าปริมาตรของชุดข้อมูลมีขนาดใหญ่และแสดงถึงอนุกรมการแจกแจง ค่าเฉลี่ยเลขคณิตแบบถ่วงน้ำหนักจะถูกคำนวณ นี่คือวิธีการกำหนดราคาเฉลี่ยถ่วงน้ำหนักต่อหน่วยการผลิต: ต้นทุนการผลิตทั้งหมด (ผลรวมของผลิตภัณฑ์ของปริมาณตามราคาของหน่วยการผลิต) หารด้วยปริมาณการผลิตทั้งหมด
ลองจินตนาการถึงสิ่งนี้ในรูปแบบของสูตรต่อไปนี้:
ตัวอย่างที่ 2 - ค้นหาเงินเดือนเฉลี่ยของพนักงานเวิร์คช็อปต่อเดือนค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก— เท่ากับอัตราส่วนของ (ผลรวมของผลคูณของมูลค่าของจุดสนใจต่อความถี่ของการทำซ้ำของจุดสนใจนี้) ต่อ (ผลรวมของความถี่ของจุดสนใจทั้งหมด) ใช้เมื่อมีความแปรปรวนของประชากรภายใต้การศึกษา จำนวนครั้งไม่เท่ากัน
สามารถรับค่าจ้างเฉลี่ยได้โดยการหารค่าจ้างทั้งหมดด้วยจำนวนคนงานทั้งหมด:
คำตอบ: 3.35 พันรูเบิล
ค่าเฉลี่ยเลขคณิตสำหรับอนุกรมช่วงเวลา
เมื่อคำนวณค่าเฉลี่ยเลขคณิตสำหรับอนุกรมการแปรผันช่วงเวลา ขั้นแรกให้หาค่าเฉลี่ยสำหรับแต่ละช่วงเวลาเป็นผลบวกครึ่งหนึ่งของขีดจำกัดบนและล่าง จากนั้นจึงหาค่าเฉลี่ยของอนุกรมทั้งหมด ในกรณีของช่วงเวลาที่เปิด ค่าของช่วงเวลาที่ต่ำกว่าหรือบนจะถูกกำหนดโดยขนาดของช่วงเวลาที่อยู่ติดกัน
ค่าเฉลี่ยที่คำนวณจากอนุกรมช่วงเวลานั้นเป็นค่าโดยประมาณ
ตัวอย่างที่ 3- กำหนดอายุเฉลี่ยของนักเรียนภาคค่ำ
ค่าเฉลี่ยที่คำนวณจากอนุกรมช่วงเวลานั้นเป็นค่าโดยประมาณ ระดับของการประมาณค่าขึ้นอยู่กับขอบเขตที่การกระจายที่แท้จริงของหน่วยประชากรภายในช่วงนั้นเข้าใกล้การกระจายแบบสม่ำเสมอ
เมื่อคำนวณค่าเฉลี่ย ไม่เพียงแต่ค่าสัมบูรณ์ แต่ยังรวมถึงค่าสัมพัทธ์ (ความถี่) ที่สามารถใช้เป็นน้ำหนักได้:
ค่าเฉลี่ยเลขคณิตมีคุณสมบัติหลายประการที่เปิดเผยสาระสำคัญได้ครบถ้วนยิ่งขึ้นและทำให้การคำนวณง่ายขึ้น:
1. ผลคูณของค่าเฉลี่ยด้วยผลรวมของความถี่จะเท่ากับผลรวมของผลิตภัณฑ์ของตัวแปรตามความถี่เสมอ เช่น
2. ค่าเฉลี่ยเลขคณิตของผลรวมของปริมาณที่แตกต่างกันเท่ากับผลรวมของค่าเฉลี่ยเลขคณิตของปริมาณเหล่านี้:
3. ผลรวมพีชคณิตของการเบี่ยงเบนของแต่ละค่าของคุณลักษณะจากค่าเฉลี่ยเท่ากับศูนย์:
4. ผลรวมของการเบี่ยงเบนกำลังสองของตัวเลือกจากค่าเฉลี่ยน้อยกว่าผลรวมของการเบี่ยงเบนกำลังสองจากค่าที่กำหนดเองอื่น ๆ เช่น
ในกรณีส่วนใหญ่ ข้อมูลจะกระจุกตัวอยู่ที่จุดศูนย์กลางบางแห่ง ดังนั้นเพื่ออธิบายชุดข้อมูลใด ๆ ก็เพียงพอที่จะระบุค่าเฉลี่ยแล้ว ให้เราพิจารณาคุณลักษณะตัวเลขสามประการตามลำดับที่ใช้ในการประมาณค่าเฉลี่ยของการแจกแจง: ค่าเฉลี่ยเลขคณิต ค่ามัธยฐาน และโหมด
ค่าเฉลี่ยเลขคณิต
ค่าเฉลี่ยเลขคณิต (มักเรียกง่ายๆ ว่าค่าเฉลี่ย) คือการประมาณค่าเฉลี่ยของการแจกแจงที่พบบ่อยที่สุด เป็นผลมาจากการหารผลรวมของค่าตัวเลขที่สังเกตทั้งหมดด้วยตัวเลข สำหรับตัวอย่างที่ประกอบด้วยตัวเลข X 1, X 2, …, Xn, ค่าเฉลี่ยตัวอย่าง (แสดงโดย ) เท่ากับ = (X 1 + X 2 + … + Xn) / n, หรือ
ค่าเฉลี่ยตัวอย่างอยู่ที่ไหน n- ขนาดตัวอย่าง เอ็กซ์ฉัน– องค์ประกอบที่ i ของกลุ่มตัวอย่าง
ดาวน์โหลดบันทึกในรูปแบบหรือตัวอย่างในรูปแบบ
พิจารณาคำนวณค่าเฉลี่ยเลขคณิตของผลตอบแทนเฉลี่ย 5 ปีต่อปีของกองทุนรวมที่มีความเสี่ยงสูงมากจำนวน 15 กองทุน (รูปที่ 1)
ข้าว. 1. ผลตอบแทนเฉลี่ยต่อปีของ 15 กองทุนรวมที่มีความเสี่ยงสูงมาก
ค่าเฉลี่ยตัวอย่างคำนวณดังนี้:
ซึ่งเป็นผลตอบแทนที่ดี โดยเฉพาะเมื่อเทียบกับผลตอบแทน 3-4% ที่ธนาคารหรือผู้ฝากเครดิตยูเนี่ยนได้รับในช่วงเวลาเดียวกัน หากเราจัดเรียงผลตอบแทน จะสังเกตได้ง่ายว่าแปดกองทุนมีผลตอบแทนสูงกว่าค่าเฉลี่ย และเจ็ดกองทุนมีผลตอบแทนต่ำกว่าค่าเฉลี่ย ค่าเฉลี่ยเลขคณิตทำหน้าที่เป็นจุดสมดุล ดังนั้นกองทุนที่มีผลตอบแทนต่ำจะสมดุลกับกองทุนที่มีผลตอบแทนสูง องค์ประกอบทั้งหมดของกลุ่มตัวอย่างเกี่ยวข้องกับการคำนวณค่าเฉลี่ย ค่าประมาณอื่นของค่าเฉลี่ยการกระจายตัวไม่มีคุณสมบัตินี้
เมื่อใดที่คุณควรคำนวณค่าเฉลี่ยเลขคณิต?เนื่องจากค่าเฉลี่ยเลขคณิตขึ้นอยู่กับองค์ประกอบทั้งหมดในกลุ่มตัวอย่าง การมีค่าสุดขั้วจึงส่งผลกระทบอย่างมากต่อผลลัพธ์ ในสถานการณ์เช่นนี้ ค่าเฉลี่ยเลขคณิตสามารถบิดเบือนความหมายของข้อมูลตัวเลขได้ ดังนั้นเมื่ออธิบายชุดข้อมูลที่มีค่าสุดขั้ว จำเป็นต้องระบุค่ามัธยฐานหรือค่าเฉลี่ยเลขคณิตและค่ามัธยฐาน ตัวอย่างเช่น ถ้าเราลบผลตอบแทนของกองทุน RS Emerging Growth ออกจากตัวอย่าง ค่าเฉลี่ยตัวอย่างของผลตอบแทนของกองทุนทั้ง 14 กองทุนจะลดลงเกือบ 1% เหลือ 5.19%
ค่ามัธยฐาน
ค่ามัธยฐานแสดงถึงค่าตรงกลางของอาร์เรย์ของตัวเลขที่เรียงลำดับ ถ้าอาร์เรย์ไม่มีตัวเลขซ้ำกัน ครึ่งหนึ่งขององค์ประกอบจะน้อยกว่าและครึ่งหนึ่งจะมากกว่าค่ามัธยฐาน หากตัวอย่างมีค่ามาก ควรใช้ค่ามัธยฐานแทนค่าเฉลี่ยเลขคณิตในการประมาณค่าเฉลี่ย หากต้องการคำนวณค่ามัธยฐานของกลุ่มตัวอย่าง จะต้องเรียงลำดับก่อน
สูตรนี้ไม่ชัดเจน ผลลัพธ์ขึ้นอยู่กับว่าตัวเลขเป็นคู่หรือคี่ n:
- หากตัวอย่างมีจำนวนองค์ประกอบเป็นเลขคี่ ค่ามัธยฐานจะเป็นดังนี้ (n+1)/2-องค์ประกอบที่
- หากตัวอย่างมีจำนวนองค์ประกอบเป็นเลขคู่ ค่ามัธยฐานจะอยู่ระหว่างองค์ประกอบตรงกลางสององค์ประกอบของตัวอย่าง และเท่ากับค่าเฉลี่ยเลขคณิตที่คำนวณจากองค์ประกอบทั้งสองนี้
ในการคำนวณค่ามัธยฐานของกลุ่มตัวอย่างที่มีผลตอบแทนของกองทุนรวมที่มีความเสี่ยงสูงมากจำนวน 15 กองทุน คุณต้องเรียงลำดับข้อมูลดิบก่อน (รูปที่ 2) จากนั้นค่ามัธยฐานจะอยู่ตรงข้ามกับจำนวนองค์ประกอบตรงกลางของกลุ่มตัวอย่าง ในตัวอย่างของเราหมายเลข 8 Excel มีฟังก์ชันพิเศษ =MEDIAN() ที่ใช้ได้กับอาร์เรย์ที่ไม่ได้เรียงลำดับด้วย
ข้าว. 2. กองทุนเฉลี่ย 15 กองทุน
ดังนั้นค่ามัธยฐานคือ 6.5 ซึ่งหมายความว่าผลตอบแทนจากครึ่งหนึ่งของกองทุนที่มีความเสี่ยงสูงมากจะไม่เกิน 6.5 และผลตอบแทนจากอีกครึ่งหนึ่งจะเกินกว่านั้น โปรดทราบว่าค่ามัธยฐานของ 6.5 ไม่ได้มากกว่าค่าเฉลี่ยของ 6.08 มากนัก
หากเราลบผลตอบแทนของกองทุน RS Emerging Growth ออกจากกลุ่มตัวอย่าง ค่ามัธยฐานของกองทุนที่เหลืออีก 14 กองทุนจะลดลงเหลือ 6.2% นั่นคือไม่มีนัยสำคัญเท่ากับค่าเฉลี่ยเลขคณิต (รูปที่ 3)
ข้าว. 3. มัธยฐาน 14 กองทุน
แฟชั่น
คำนี้บัญญัติขึ้นครั้งแรกโดยเพียร์สันในปี พ.ศ. 2437 แฟชั่นคือตัวเลขที่เกิดขึ้นบ่อยที่สุดในกลุ่มตัวอย่าง (ที่ทันสมัยที่สุด) แฟชั่นอธิบายได้ดี เช่น ปฏิกิริยาโดยทั่วไปของผู้ขับขี่ต่อสัญญาณไฟจราจรให้หยุดเคลื่อนไหว ตัวอย่างคลาสสิกของการใช้แฟชั่นคือการเลือกขนาดรองเท้าหรือสีวอลเปเปอร์ หากการแจกแจงมีหลายโหมด ก็เรียกว่า multimodal หรือ multimodal (มี "ยอด" สองค่าขึ้นไป) การกระจายหลายรูปแบบให้ข้อมูลที่สำคัญเกี่ยวกับลักษณะของตัวแปรที่กำลังศึกษา ตัวอย่างเช่น ในการสำรวจทางสังคมวิทยา หากตัวแปรแสดงถึงความชอบหรือทัศนคติต่อสิ่งใดสิ่งหนึ่ง ความหลากหลายหลายรูปแบบอาจหมายความว่ามีความคิดเห็นที่แตกต่างกันหลายประการอย่างชัดเจน ความหลากหลายหลายรูปแบบยังทำหน้าที่เป็นตัวบ่งชี้ว่าตัวอย่างไม่เป็นเนื้อเดียวกัน และการสังเกตอาจเกิดจากการแจกแจงแบบ "ทับซ้อนกัน" สองครั้งขึ้นไป ต่างจากค่าเฉลี่ยเลขคณิต ค่าผิดปกติจะไม่ส่งผลต่อโหมด สำหรับตัวแปรสุ่มที่กระจายอย่างต่อเนื่อง เช่น ผลตอบแทนเฉลี่ยต่อปีของกองทุนรวม บางครั้งโหมดนี้ไม่มีอยู่ (หรือไม่มีเหตุผล) เลย เนื่องจากตัวบ่งชี้เหล่านี้สามารถรับค่าที่แตกต่างกันมาก ค่าที่ซ้ำกันจึงหายากมาก
ควอไทล์
ควอไทล์เป็นหน่วยเมตริกที่มักใช้ในการประเมินการกระจายตัวของข้อมูลเมื่ออธิบายคุณสมบัติของตัวอย่างตัวเลขขนาดใหญ่ แม้ว่าค่ามัธยฐานจะแบ่งอาร์เรย์ที่เรียงลำดับไว้ครึ่งหนึ่ง (50% ขององค์ประกอบของอาร์เรย์จะน้อยกว่าค่ามัธยฐานและมากกว่า 50%) ควอร์ไทล์จะแบ่งชุดข้อมูลที่เรียงลำดับออกเป็นสี่ส่วน ค่าของ Q 1 , ค่ามัธยฐาน และ Q 3 คือเปอร์เซ็นไทล์ที่ 25, 50 และ 75 ตามลำดับ ควอไทล์แรก Q 1 คือตัวเลขที่แบ่งตัวอย่างออกเป็นสองส่วน: องค์ประกอบ 25% น้อยกว่า และ 75% มากกว่าควอไทล์แรก
ควอไทล์ที่สาม Q 3 คือตัวเลขที่แบ่งตัวอย่างออกเป็นสองส่วนด้วย โดย 75% ขององค์ประกอบมีค่าน้อยกว่า และ 25% มากกว่าควอร์ไทล์ที่สาม
หากต้องการคำนวณควอไทล์ใน Excel เวอร์ชันก่อนปี 2007 ให้ใช้ฟังก์ชัน =QUARTILE(array,part) เริ่มต้นจาก Excel 2010 จะใช้สองฟังก์ชัน:
- =QUARTILE.ON(อาร์เรย์,บางส่วน)
- =QUARTILE.EXC(อาร์เรย์,บางส่วน)
ฟังก์ชันทั้งสองนี้ให้ค่าที่แตกต่างกันเล็กน้อย (รูปที่ 4) ตัวอย่างเช่น เมื่อคำนวณควอไทล์ของกลุ่มตัวอย่างที่มีผลตอบแทนเฉลี่ยต่อปีของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน Q 1 = 1.8 หรือ –0.7 สำหรับ QUARTILE.IN และ QUARTILE.EX ตามลำดับ อย่างไรก็ตาม ฟังก์ชัน QUARTILE ที่เคยใช้ก่อนหน้านี้จะสอดคล้องกับฟังก์ชัน QUARTILE.ON สมัยใหม่ หากต้องการคำนวณควอร์ไทล์ใน Excel โดยใช้สูตรข้างต้น ไม่จำเป็นต้องเรียงลำดับอาร์เรย์ข้อมูล
ข้าว. 4. การคำนวณควอร์ไทล์ใน Excel
เรามาเน้นอีกครั้ง Excel สามารถคำนวณควอร์ไทล์สำหรับตัวแปรเดียวได้ ซีรีส์ไม่ต่อเนื่องที่มีค่าของตัวแปรสุ่ม การคำนวณควอไทล์สำหรับการแจกแจงตามความถี่มีดังต่อไปนี้ในส่วนนี้
ค่าเฉลี่ยเรขาคณิต
ค่าเฉลี่ยเรขาคณิตต่างจากค่าเฉลี่ยเลขคณิตตรงที่ทำให้คุณสามารถประมาณระดับการเปลี่ยนแปลงของตัวแปรเมื่อเวลาผ่านไปได้ ค่าเฉลี่ยเรขาคณิตคือราก nปริญญาจากการทำงาน nปริมาณ (ใน Excel จะใช้ฟังก์ชัน =SRGEOM):
ช= (X 1 * X 2 * … * Xn) 1/n
พารามิเตอร์ที่คล้ายกัน - ค่าเฉลี่ยทางเรขาคณิตของอัตรากำไร - ถูกกำหนดโดยสูตร:
G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,
ที่ไหน ร. ฉัน– อัตรากำไรสำหรับ ฉันช่วงเวลาที่.
ตัวอย่างเช่น สมมติว่าการลงทุนเริ่มแรกคือ 100,000 ดอลลาร์ ภายในสิ้นปีแรก ลดลงเหลือ 50,000 ดอลลาร์ และภายในสิ้นปีที่สองจะฟื้นตัวเป็นระดับเริ่มต้นที่ 100,000 ดอลลาร์ -ปีเท่ากับ 0 เนื่องจากจำนวนเงินเริ่มต้นและครั้งสุดท้ายมีค่าเท่ากัน อย่างไรก็ตาม ค่าเฉลี่ยเลขคณิตของอัตรากำไรประจำปีคือ = (–0.5 + 1) / 2 = 0.25 หรือ 25% เนื่องจากอัตรากำไรในปีแรก R 1 = (50,000 – 100,000) / 100,000 = –0.5 และใน R 2 ที่สอง = (100,000 – 50,000) / 50,000 = 1 ในเวลาเดียวกันค่าเฉลี่ยทางเรขาคณิตของอัตรากำไรเป็นเวลาสองปีเท่ากับ: G = [(1–0.5) * (1+1 ) ] 1/2 – 1 = ½ – 1 = 1 – 1 = 0 ดังนั้นค่าเฉลี่ยเรขาคณิตจึงสะท้อนการเปลี่ยนแปลงได้แม่นยำยิ่งขึ้น (แม่นยำยิ่งขึ้นคือไม่มีการเปลี่ยนแปลง) ในปริมาณการลงทุนในช่วงระยะเวลาสองปีมากกว่าการคำนวณทางคณิตศาสตร์ หมายถึง.
ข้อเท็จจริงที่น่าสนใจประการแรก ค่าเฉลี่ยเรขาคณิตจะน้อยกว่าค่าเฉลี่ยเลขคณิตของตัวเลขเดียวกันเสมอ ยกเว้นกรณีที่ตัวเลขที่นำมาเท่ากันทั้งหมด ประการที่สอง เมื่อพิจารณาคุณสมบัติของสามเหลี่ยมมุมฉาก คุณจะเข้าใจว่าทำไมค่าเฉลี่ยจึงเรียกว่าเรขาคณิต ความสูงของรูปสามเหลี่ยมมุมฉากซึ่งลดลงถึงด้านตรงข้ามมุมฉากคือสัดส่วนเฉลี่ยระหว่างส่วนที่ยื่นของขาไปยังด้านตรงข้ามมุมฉาก และแต่ละขาคือสัดส่วนเฉลี่ยระหว่างด้านตรงข้ามมุมฉากและส่วนยื่นของด้านตรงข้ามมุมฉาก (รูปที่ 5) นี่เป็นวิธีทางเรขาคณิตในการสร้างค่าเฉลี่ยเรขาคณิตของสองส่วน (ความยาว): คุณต้องสร้างวงกลมโดยผลรวมของทั้งสองส่วนนี้เป็นเส้นผ่านศูนย์กลาง จากนั้นความสูงจะกลับคืนมาจากจุดที่เชื่อมต่อกับจุดตัดกับวงกลม จะให้ค่าที่ต้องการ:
ข้าว. 5. ลักษณะทางเรขาคณิตของค่าเฉลี่ยเรขาคณิต (รูปจากวิกิพีเดีย)
คุณสมบัติที่สำคัญประการที่สองของข้อมูลตัวเลขคือคุณสมบัติเหล่านั้น การเปลี่ยนแปลงซึ่งแสดงลักษณะระดับการกระจายตัวของข้อมูล ตัวอย่างสองตัวอย่างที่แตกต่างกันอาจแตกต่างกันทั้งในด้านวิธีการและความแปรปรวน อย่างไรก็ตาม ดังแสดงในรูปที่. 6 และ 7 สองตัวอย่างอาจมีความแปรผันเหมือนกัน แต่มีค่าเฉลี่ยต่างกัน หรือค่าเฉลี่ยเท่ากันและต่างกันโดยสิ้นเชิง ข้อมูลที่สอดคล้องกับรูปหลายเหลี่ยม B ในรูป 7 เปลี่ยนแปลงน้อยกว่าข้อมูลที่สร้างรูปหลายเหลี่ยม A มาก
ข้าว. 6. การแจกแจงรูประฆังสมมาตรสองแบบซึ่งมีค่าสเปรดเท่ากันและค่าเฉลี่ยต่างกัน
ข้าว. 7. การแจกแจงรูประฆังสมมาตรสองแบบโดยมีค่าเฉลี่ยเท่ากันและค่าสเปรดต่างกัน
การประมาณค่าความแปรผันของข้อมูลมีห้าแบบ:
- ขอบเขต,
- พิสัยระหว่างควอไทล์,
- การกระจายตัว,
- ส่วนเบี่ยงเบนมาตรฐาน
- ค่าสัมประสิทธิ์ของการแปรผัน
ขอบเขต
ช่วงคือความแตกต่างระหว่างองค์ประกอบที่ใหญ่ที่สุดและเล็กที่สุดของตัวอย่าง:
พิสัย = Xแม็กซ์-เอ็กซ์นาที
ช่วงตัวอย่างที่มีผลตอบแทนเฉลี่ยต่อปีของกองทุนรวมที่มีความเสี่ยงสูงมากจำนวน 15 กองทุน สามารถคำนวณได้โดยใช้ลำดับลำดับ (ดูรูปที่ 4) ช่วง = 18.5 – (–6.1) = 24.6 ซึ่งหมายความว่าความแตกต่างระหว่างผลตอบแทนรายปีเฉลี่ยสูงสุดและต่ำสุดของกองทุนที่มีความเสี่ยงสูงมากคือ 24.6%
ช่วงวัดการแพร่กระจายของข้อมูลโดยรวม แม้ว่าช่วงตัวอย่างจะเป็นค่าประมาณง่ายๆ ของการแพร่กระจายของข้อมูลโดยรวม แต่จุดอ่อนของมันคือไม่ได้คำนึงถึงวิธีการกระจายข้อมูลระหว่างองค์ประกอบขั้นต่ำและสูงสุดอย่างชัดเจน เอฟเฟกต์นี้มองเห็นได้ชัดเจนในรูป 8 ซึ่งแสดงตัวอย่างที่มีช่วงเดียวกัน สเกล B แสดงให้เห็นว่าหากตัวอย่างมีค่าสูงสุดอย่างน้อยหนึ่งค่า ช่วงตัวอย่างคือการประมาณค่าการแพร่กระจายของข้อมูลที่ไม่แม่นยำมาก
ข้าว. 8. การเปรียบเทียบสามตัวอย่างที่มีช่วงเดียวกัน สามเหลี่ยมเป็นสัญลักษณ์ของการสนับสนุนของมาตราส่วน และตำแหน่งของมันสอดคล้องกับค่าเฉลี่ยของกลุ่มตัวอย่าง
พิสัยระหว่างควอไทล์
พิสัยระหว่างควอไทล์หรือค่าเฉลี่ยคือความแตกต่างระหว่างควอไทล์ที่สามและควอร์ไทล์ที่หนึ่งของตัวอย่าง:
พิสัยระหว่างควอไทล์ = Q 3 – Q 1
ค่านี้ช่วยให้เราประมาณการกระจายขององค์ประกอบได้ 50% และไม่คำนึงถึงอิทธิพลขององค์ประกอบที่รุนแรง ช่วงระหว่างควอไทล์ของกลุ่มตัวอย่างที่มีผลตอบแทนเฉลี่ยต่อปีของกองทุนรวมที่มีความเสี่ยงสูงมาก 15 กองทุน สามารถคำนวณได้โดยใช้ข้อมูลในรูปที่ 1 4 (เช่น สำหรับฟังก์ชัน QUARTILE.EXC): ช่วงระหว่างควอร์ไทล์ = 9.8 – (–0.7) = 10.5 ช่วงเวลาที่ล้อมรอบด้วยตัวเลข 9.8 และ -0.7 มักเรียกว่าครึ่งกลาง
ควรสังเกตว่าค่าของ Q 1 และ Q 3 และด้วยเหตุนี้ช่วงระหว่างควอไทล์จึงไม่ขึ้นอยู่กับการมีอยู่ของค่าผิดปกติเนื่องจากการคำนวณไม่ได้คำนึงถึงค่าใด ๆ ที่จะน้อยกว่า Q 1 หรือมากกว่า กว่า Q3 การวัดผลสรุป เช่น ค่ามัธยฐาน ควอไทล์ที่ 1 และ 3 และช่วงระหว่างควอร์ไทล์ที่ไม่ได้รับผลกระทบจากค่าผิดปกติ เรียกว่าการวัดแบบเข้มงวด
แม้ว่าช่วงและช่วงระหว่างควอไทล์จะให้ค่าประมาณของการแพร่กระจายโดยรวมและค่าเฉลี่ยของกลุ่มตัวอย่าง ตามลำดับ แต่ค่าประมาณเหล่านี้ไม่ได้คำนึงถึงวิธีการกระจายข้อมูลอย่างชัดเจน ความแปรปรวนและส่วนเบี่ยงเบนมาตรฐานปราศจากข้อเสียเปรียบนี้ ตัวบ่งชี้เหล่านี้ช่วยให้คุณประเมินระดับที่ข้อมูลมีความผันผวนรอบค่าเฉลี่ยได้ ความแปรปรวนตัวอย่างเป็นการประมาณค่าเฉลี่ยเลขคณิตที่คำนวณจากกำลังสองของความแตกต่างระหว่างแต่ละองค์ประกอบตัวอย่างและค่าเฉลี่ยตัวอย่าง สำหรับตัวอย่าง X 1, X 2, ... X n ความแปรปรวนตัวอย่าง (แสดงด้วยสัญลักษณ์ S 2 จะได้รับจากสูตรต่อไปนี้:
โดยทั่วไป ความแปรปรวนตัวอย่างคือผลรวมของกำลังสองของความแตกต่างระหว่างองค์ประกอบตัวอย่างและค่าเฉลี่ยตัวอย่าง หารด้วยค่าเท่ากับขนาดตัวอย่างลบด้วยหนึ่ง:
ที่ไหน - ค่าเฉลี่ยเลขคณิต n- ขนาดตัวอย่าง เอ็กซ์ ฉัน - ฉันองค์ประกอบที่หนึ่งของการเลือก เอ็กซ์- ใน Excel ก่อนเวอร์ชัน 2007 ฟังก์ชัน =VARP() ถูกใช้เพื่อคำนวณความแปรปรวนตัวอย่าง ตั้งแต่เวอร์ชัน 2010 ฟังก์ชัน =VARP.V() ถูกนำมาใช้
การประมาณการการแพร่กระจายของข้อมูลที่เป็นประโยชน์และเป็นที่ยอมรับอย่างกว้างขวางที่สุดคือ ตัวอย่างค่าเบี่ยงเบนมาตรฐาน- ตัวบ่งชี้นี้แสดงด้วยสัญลักษณ์ S และเท่ากับรากที่สองของความแปรปรวนตัวอย่าง:
ใน Excel ก่อนเวอร์ชัน 2007 ฟังก์ชัน =STDEV.() ถูกใช้เพื่อคำนวณค่าเบี่ยงเบนตัวอย่างมาตรฐาน ตั้งแต่เวอร์ชัน 2010 จะใช้ฟังก์ชัน =STDEV.V() ในการคำนวณฟังก์ชันเหล่านี้ อาร์เรย์ข้อมูลอาจไม่เรียงลำดับ
ความแปรปรวนตัวอย่างหรือส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างไม่สามารถเป็นลบได้ สถานการณ์เดียวที่ตัวบ่งชี้ S 2 และ S สามารถเป็นศูนย์ได้คือถ้าองค์ประกอบทั้งหมดของตัวอย่างเท่ากัน ในกรณีที่ไม่น่าจะเป็นไปได้โดยสิ้นเชิงนี้ พิสัยและพิสัยระหว่างควอไทล์จะเป็นศูนย์เช่นกัน
ข้อมูลตัวเลขมีความแปรผันโดยเนื้อแท้ ตัวแปรใดๆ ก็สามารถรับค่าที่แตกต่างกันได้มากมาย เช่น กองทุนรวมที่ต่างกันก็มีอัตราผลตอบแทนและขาดทุนต่างกัน เนื่องจากความแปรปรวนของข้อมูลตัวเลข จึงเป็นสิ่งสำคัญมากที่จะต้องศึกษาไม่เพียงแต่การประมาณค่าเฉลี่ยซึ่งเป็นการสรุปเท่านั้น แต่ยังรวมถึงการประมาณค่าความแปรปรวนซึ่งเป็นลักษณะการแพร่กระจายของข้อมูลด้วย
การกระจายตัวและส่วนเบี่ยงเบนมาตรฐานทำให้คุณสามารถประเมินการแพร่กระจายของข้อมูลรอบๆ ค่าเฉลี่ย หรืออีกนัยหนึ่งก็คือ กำหนดว่าองค์ประกอบตัวอย่างจำนวนเท่าใดที่น้อยกว่าค่าเฉลี่ยและมีจำนวนองค์ประกอบที่มากกว่า การกระจายตัวมีคุณสมบัติทางคณิตศาสตร์อันมีค่าบางอย่าง อย่างไรก็ตาม ค่าของมันคือกำลังสองของหน่วยการวัด - ตารางเปอร์เซ็นต์, ตารางดอลลาร์, ตารางนิ้ว ฯลฯ ดังนั้น การวัดการกระจายตามธรรมชาติคือค่าเบี่ยงเบนมาตรฐาน ซึ่งแสดงเป็นหน่วยทั่วไปของเปอร์เซ็นต์รายได้ ดอลลาร์ หรือนิ้ว
ค่าเบี่ยงเบนมาตรฐานทำให้คุณสามารถประมาณปริมาณความแปรผันขององค์ประกอบตัวอย่างรอบๆ ค่าเฉลี่ยได้ ในเกือบทุกสถานการณ์ ค่าที่สังเกตได้ส่วนใหญ่จะอยู่ในช่วงบวกหรือลบหนึ่งส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ด้วยเหตุนี้ เมื่อทราบค่าเฉลี่ยเลขคณิตขององค์ประกอบตัวอย่างและค่าเบี่ยงเบนมาตรฐานของตัวอย่าง จึงสามารถกำหนดช่วงเวลาที่มีข้อมูลจำนวนมากได้
ส่วนเบี่ยงเบนมาตรฐานผลตอบแทนของกองทุนรวมที่มีความเสี่ยงสูงมากทั้ง 15 กองทุนอยู่ที่ 6.6 (รูปที่ 9) ซึ่งหมายความว่าความสามารถในการทำกำไรของกองทุนจำนวนมากแตกต่างจากค่าเฉลี่ยไม่เกิน 6.6% (นั่นคือมีความผันผวนอยู่ในช่วงตั้งแต่ – ส= 6.2 – 6.6 = –0.4 ถึง +ส= 12.8) ในความเป็นจริงผลตอบแทนเฉลี่ยต่อปีห้าปีที่ 53.3% (8 จาก 15) ของกองทุนอยู่ในช่วงนี้
ข้าว. 9. ตัวอย่างค่าเบี่ยงเบนมาตรฐาน
โปรดทราบว่าเมื่อรวมผลต่างกำลังสอง รายการตัวอย่างที่อยู่ห่างจากค่าเฉลี่ยจะได้รับน้ำหนักมากกว่ารายการที่อยู่ใกล้กับค่าเฉลี่ยมากขึ้น คุณสมบัตินี้เป็นเหตุผลหลักว่าทำไมค่าเฉลี่ยเลขคณิตจึงถูกใช้บ่อยที่สุดในการประมาณค่าเฉลี่ยของการแจกแจง
ค่าสัมประสิทธิ์ของการแปรผัน
ต่างจากการประมาณค่ากระจายก่อนหน้านี้ ค่าสัมประสิทธิ์ของการแปรผันเป็นการประมาณค่าแบบสัมพันธ์ โดยจะวัดเป็นเปอร์เซ็นต์เสมอและไม่ได้อยู่ในหน่วยของข้อมูลต้นฉบับ ค่าสัมประสิทธิ์การแปรผันที่แสดงด้วยสัญลักษณ์ CV จะวัดการกระจายตัวของข้อมูลรอบๆ ค่าเฉลี่ย ค่าสัมประสิทธิ์ของการแปรผันเท่ากับค่าเบี่ยงเบนมาตรฐานหารด้วยค่าเฉลี่ยเลขคณิตแล้วคูณด้วย 100%:
ที่ไหน ส- ส่วนเบี่ยงเบนตัวอย่างมาตรฐาน - ค่าเฉลี่ยตัวอย่าง
ค่าสัมประสิทธิ์ของการแปรผันทำให้คุณสามารถเปรียบเทียบสองตัวอย่างที่มีองค์ประกอบต่างๆ แสดงในหน่วยการวัดที่ต่างกัน ตัวอย่างเช่น ผู้จัดการบริการจัดส่งทางไปรษณีย์ตั้งใจที่จะต่ออายุกองรถบรรทุกของเขา เมื่อโหลดบรรจุภัณฑ์ มีข้อจำกัดสองประการที่ต้องพิจารณา: น้ำหนัก (เป็นปอนด์) และปริมาตร (เป็นลูกบาศก์ฟุต) ของแต่ละบรรจุภัณฑ์ สมมติว่าตัวอย่างที่มีถุง 200 ถุง น้ำหนักเฉลี่ยคือ 26.0 ปอนด์ ค่าเบี่ยงเบนมาตรฐานของน้ำหนักคือ 3.9 ปอนด์ ปริมาตรถุงเฉลี่ยคือ 8.8 ลูกบาศก์ฟุต และค่าเบี่ยงเบนมาตรฐานของปริมาตรคือ 2.2 ลูกบาศก์ฟุต จะเปรียบเทียบความแปรผันของน้ำหนักและปริมาตรของบรรจุภัณฑ์ได้อย่างไร
เนื่องจากหน่วยวัดน้ำหนักและปริมาตรแตกต่างกัน ผู้จัดการจึงต้องเปรียบเทียบการกระจายสัมพัทธ์ของปริมาณเหล่านี้ ค่าสัมประสิทธิ์การเปลี่ยนแปลงของน้ำหนักคือ CV W = 3.9 / 26.0 * 100% = 15% และค่าสัมประสิทธิ์การเปลี่ยนแปลงของปริมาตรคือ CV V = 2.2 / 8.8 * 100% = 25% ดังนั้นความแปรผันสัมพัทธ์ในปริมาตรของแพ็กเก็ตจึงมากกว่าความแปรผันสัมพัทธ์ของน้ำหนักของมันมาก
แบบฟอร์มการจำหน่าย
คุณสมบัติที่สำคัญประการที่สามของกลุ่มตัวอย่างคือรูปร่างของการกระจายตัว การกระจายตัวนี้อาจสมมาตรหรือไม่สมมาตร ในการอธิบายรูปร่างของการแจกแจง จำเป็นต้องคำนวณค่าเฉลี่ยและค่ามัธยฐานของมัน หากทั้งสองค่าเท่ากัน ตัวแปรจะถือว่ามีการกระจายแบบสมมาตร หากค่าเฉลี่ยของตัวแปรมากกว่าค่ามัธยฐาน การกระจายตัวของตัวแปรจะมีความเบ้เป็นบวก (รูปที่ 10) หากค่ามัธยฐานมากกว่าค่าเฉลี่ย การกระจายตัวของตัวแปรจะเบี่ยงเบนไปในทางลบ ความเบ้เชิงบวกเกิดขึ้นเมื่อค่าเฉลี่ยเพิ่มขึ้นเป็นค่าที่สูงผิดปกติ ความเบ้เชิงลบเกิดขึ้นเมื่อค่าเฉลี่ยลดลงจนเหลือค่าที่น้อยผิดปกติ ตัวแปรจะถูกกระจายแบบสมมาตรหากไม่มีค่าที่มากเกินไปในทิศทางใดทิศทางหนึ่ง ดังนั้นค่าที่มากหรือน้อยของตัวแปรจะหักล้างกัน
ข้าว. 10. การแจกแจงสามประเภท
ข้อมูลที่แสดงในระดับ A มีความคลาดเคลื่อนในเชิงลบ ตัวเลขนี้แสดงหางยาวและเอียงไปทางซ้ายซึ่งเกิดจากการมีค่าที่น้อยผิดปกติ ค่าที่น้อยมากเหล่านี้จะเลื่อนค่าเฉลี่ยไปทางซ้ายทำให้มีค่าน้อยกว่าค่ามัธยฐาน ข้อมูลที่แสดงในระดับ B มีการกระจายแบบสมมาตร ครึ่งซ้ายและขวาของการกระจายเป็นภาพสะท้อนของตัวเอง ค่าสูงและค่าน้อยจะสมดุลกัน และค่ากลางและค่ามัธยฐานจะเท่ากัน ข้อมูลที่แสดงในระดับ B บิดเบือนไปในทางบวก ตัวเลขนี้แสดงหางยาวและเอียงไปทางขวาซึ่งเกิดจากการมีค่าที่สูงผิดปกติ ค่าที่มากเกินไปเหล่านี้จะเลื่อนค่าเฉลี่ยไปทางขวา ทำให้มีค่ามากกว่าค่ามัธยฐาน
ใน Excel สามารถรับสถิติเชิงพรรณนาได้โดยใช้ Add-in แพ็คเกจการวิเคราะห์- ผ่านเมนู ข้อมูล → การวิเคราะห์ข้อมูลในหน้าต่างที่เปิดขึ้น ให้เลือกเส้น สถิติเชิงพรรณนาและคลิก ตกลง- ในหน้าต่าง สถิติเชิงพรรณนาอย่าลืมระบุ ช่วงเวลาอินพุต(รูปที่ 11) หากคุณต้องการดูสถิติเชิงพรรณนาบนแผ่นงานเดียวกันกับข้อมูลต้นฉบับ ให้เลือกปุ่มตัวเลือก ช่วงเอาท์พุตและระบุเซลล์ที่ควรวางมุมซ้ายบนของสถิติที่แสดง (ในตัวอย่างของเรา $C$1) หากคุณต้องการส่งออกข้อมูลไปยังแผ่นงานใหม่หรือสมุดงานใหม่ คุณเพียงแค่ต้องเลือกปุ่มตัวเลือกที่เหมาะสม ทำเครื่องหมายที่ช่องถัดจาก สถิติสรุป- หากต้องการคุณสามารถเลือกได้เช่นกัน ระดับความยากk ที่เล็กที่สุดและใหญ่ที่สุดอันดับที่ 1.
ถ้าเป็นเงินฝาก ข้อมูลในพื้นที่ การวิเคราะห์คุณไม่เห็นไอคอน การวิเคราะห์ข้อมูลคุณต้องติดตั้งส่วนเสริมก่อน แพ็คเกจการวิเคราะห์(ดูตัวอย่าง)
ข้าว. 11. สถิติเชิงพรรณนาผลตอบแทนเฉลี่ยต่อปีของกองทุนที่มีระดับความเสี่ยงสูงมากในช่วง 5 ปี คำนวณโดยใช้ส่วนเสริม การวิเคราะห์ข้อมูลโปรแกรมเอ็กเซล
Excel คำนวณสถิติจำนวนหนึ่งที่กล่าวถึงข้างต้น: ค่าเฉลี่ย ค่ามัธยฐาน โหมด ค่าเบี่ยงเบนมาตรฐาน ความแปรปรวน ช่วง ( ช่วงเวลา) ต่ำสุด สูงสุด และขนาดตัวอย่าง ( ตรวจสอบ- นอกจากนี้ Excel ยังคำนวณสถิติบางอย่างที่ใหม่สำหรับเรา เช่น ข้อผิดพลาดมาตรฐาน ความโด่ง และความเบ้ ข้อผิดพลาดมาตรฐานเท่ากับค่าเบี่ยงเบนมาตรฐานหารด้วยรากที่สองของขนาดตัวอย่าง ความไม่สมมาตรระบุลักษณะความเบี่ยงเบนจากสมมาตรของการแจกแจงและเป็นฟังก์ชันที่ขึ้นอยู่กับกำลังสามของความแตกต่างระหว่างองค์ประกอบตัวอย่างและค่าเฉลี่ย Kurtosis คือการวัดความเข้มข้นสัมพัทธ์ของข้อมูลรอบๆ ค่าเฉลี่ยเมื่อเทียบกับส่วนท้ายของการแจกแจง และขึ้นอยู่กับความแตกต่างระหว่างองค์ประกอบตัวอย่างและค่าเฉลี่ยยกกำลัง 4
การคำนวณสถิติเชิงพรรณนาสำหรับประชากร
ค่าเฉลี่ย สเปรด และรูปร่างของการกระจายที่กล่าวถึงข้างต้นเป็นคุณลักษณะที่กำหนดจากตัวอย่าง อย่างไรก็ตาม หากชุดข้อมูลมีการวัดเชิงตัวเลขของประชากรทั้งหมด พารามิเตอร์ของชุดก็สามารถคำนวณได้ พารามิเตอร์ดังกล่าวรวมถึงค่าที่คาดหวัง การกระจายตัว และส่วนเบี่ยงเบนมาตรฐานของประชากร
ความคาดหวังเท่ากับผลรวมของค่าทั้งหมดในประชากรหารด้วยขนาดของประชากร:
ที่ไหน µ - ความคาดหวังทางคณิตศาสตร์ เอ็กซ์ฉัน- ฉันการสังเกตตัวแปร เอ็กซ์, เอ็น- ปริมาณประชากรทั่วไป ใน Excel เพื่อคำนวณความคาดหวังทางคณิตศาสตร์ ฟังก์ชันเดียวกันนี้จะถูกใช้เป็นค่าเฉลี่ยเลขคณิต: =AVERAGE()
ความแปรปรวนของประชากรเท่ากับผลรวมของกำลังสองของความแตกต่างระหว่างองค์ประกอบของประชากรทั่วไปและเสื่อ ความคาดหวังหารด้วยขนาดของประชากร:
ที่ไหน ซิ 2– การกระจายตัวของประชากรทั่วไป ใน Excel ก่อนเวอร์ชัน 2007 ฟังก์ชัน =VARP() ใช้ในการคำนวณความแปรปรวนของประชากร โดยเริ่มจากเวอร์ชัน 2010 =VARP()
ส่วนเบี่ยงเบนมาตรฐานประชากรเท่ากับรากที่สองของความแปรปรวนประชากร:
ใน Excel ก่อนเวอร์ชัน 2007 ฟังก์ชัน =STDEV() ใช้ในการคำนวณค่าเบี่ยงเบนมาตรฐานของประชากร ตั้งแต่เวอร์ชัน 2010 =STDEV.Y() โปรดทราบว่าสูตรสำหรับความแปรปรวนประชากรและส่วนเบี่ยงเบนมาตรฐานแตกต่างจากสูตรในการคำนวณความแปรปรวนตัวอย่างและส่วนเบี่ยงเบนมาตรฐาน เมื่อคำนวณสถิติตัวอย่าง เอส 2และ สตัวส่วนของเศษส่วนคือ n – 1และเมื่อคำนวณพารามิเตอร์ ซิ 2และ σ - ปริมาณประชากรทั่วไป เอ็น.
กฎง่ายๆ
ในสถานการณ์ส่วนใหญ่ การสังเกตส่วนใหญ่กระจุกตัวอยู่ที่ค่ามัธยฐานและก่อตัวเป็นกลุ่มก้อน ในชุดข้อมูลที่มีความเบ้เป็นบวก คลัสเตอร์นี้จะตั้งอยู่ทางด้านซ้าย (เช่น ด้านล่าง) ความคาดหวังทางคณิตศาสตร์ และในชุดที่มีความเบ้เป็นลบ คลัสเตอร์นี้จะตั้งอยู่ทางด้านขวา (เช่น ด้านบน) ความคาดหวังทางคณิตศาสตร์ สำหรับข้อมูลแบบสมมาตร ค่าเฉลี่ยและค่ามัธยฐานจะเท่ากัน และการสังเกตจะกระจุกอยู่รอบๆ ค่าเฉลี่ย ทำให้เกิดการกระจายตัวเป็นรูประฆัง หากการกระจายไม่เบ้อย่างชัดเจน และข้อมูลกระจุกตัวอยู่รอบจุดศูนย์ถ่วง กฎง่ายๆ ที่สามารถใช้ในการประมาณความแปรปรวนได้คือ หากข้อมูลมีการกระจายเป็นรูประฆัง ประมาณ 68% ของการสังเกต ภายในค่าเบี่ยงเบนมาตรฐานหนึ่งของค่าที่คาดไว้ ประมาณ 95% ของการสังเกตอยู่ห่างจากค่าคาดหวังทางคณิตศาสตร์ไม่เกิน 2 ส่วน และ 99.7% ของการสังเกตนั้นอยู่ห่างจากค่าคาดหวังทางคณิตศาสตร์ไม่เกิน 3 ค่า
ดังนั้น ค่าเบี่ยงเบนมาตรฐาน ซึ่งเป็นค่าประมาณของความแปรผันของค่าเฉลี่ยรอบๆ ค่าที่คาดหวัง ช่วยให้เข้าใจว่าการสังเกตมีการกระจายอย่างไร และระบุค่าผิดปกติได้ หลักทั่วไปคือ สำหรับการแจกแจงรูประฆัง มีเพียงค่าหนึ่งในยี่สิบเท่านั้นที่แตกต่างจากที่คาดไว้ทางคณิตศาสตร์ด้วยค่าเบี่ยงเบนมาตรฐานมากกว่าสองค่า ดังนั้นค่าที่อยู่นอกช่วงเวลา µ ± 2σถือได้ว่าเป็นค่าผิดปกติ นอกจากนี้ การสังเกตเพียงสามใน 1,000 รายการแตกต่างจากที่คาดหวังทางคณิตศาสตร์ด้วยค่าเบี่ยงเบนมาตรฐานมากกว่าสามค่า ดังนั้นค่าที่อยู่นอกช่วงเวลา µ ± 3σมักจะมีค่าผิดปกติอยู่เสมอ สำหรับการแจกแจงที่มีความเบ้มากหรือไม่มีรูประฆัง สามารถใช้กฎทั่วไปของ Bienamay-Chebyshev ได้
กว่าร้อยปีที่แล้ว นักคณิตศาสตร์ Bienamay และ Chebyshev ค้นพบคุณสมบัติที่เป็นประโยชน์ของค่าเบี่ยงเบนมาตรฐานอย่างอิสระ พวกเขาพบว่าสำหรับชุดข้อมูลใดๆ โดยไม่คำนึงถึงรูปร่างของการแจกแจง เปอร์เซ็นต์ของการสังเกตที่อยู่ในระยะห่าง เคส่วนเบี่ยงเบนมาตรฐานจากความคาดหวังทางคณิตศาสตร์ไม่น้อย (1 – 1/ เค 2)*100%.
ตัวอย่างเช่น ถ้า เค= 2 กฎเบียนนาเม-เชบีเชฟ ระบุว่าอย่างน้อย (1 – (1/2) 2) x 100% = 75% ของการสังเกตต้องอยู่ในช่วง µ ± 2σ- กฎข้อนี้เป็นจริงสำหรับใครก็ตาม เคเกินหนึ่ง กฎบีนาเมย์-เชบีเชฟเป็นกฎทั่วไปมากและใช้ได้กับการแจกแจงทุกประเภท โดยจะระบุจำนวนการสังเกตขั้นต่ำ ซึ่งระยะทางจากความคาดหวังทางคณิตศาสตร์จะไม่เกินค่าที่ระบุ อย่างไรก็ตาม หากการแจกแจงเป็นแบบระฆัง หลักทั่วไปจะประมาณความเข้มข้นของข้อมูลรอบค่าที่คาดหวังได้แม่นยำยิ่งขึ้น
การคำนวณสถิติเชิงพรรณนาสำหรับการแจกแจงตามความถี่
หากไม่มีข้อมูลต้นฉบับ การกระจายความถี่จะกลายเป็นแหล่งข้อมูลเพียงแหล่งเดียว ในสถานการณ์เช่นนี้สามารถคำนวณค่าโดยประมาณของตัวบ่งชี้เชิงปริมาณของการแจกแจงได้ เช่น ค่าเฉลี่ยเลขคณิต ส่วนเบี่ยงเบนมาตรฐาน และควอร์ไทล์
หากข้อมูลตัวอย่างแสดงเป็นการแจกแจงความถี่ การประมาณค่าเฉลี่ยเลขคณิตสามารถคำนวณได้โดยสมมติว่าค่าทั้งหมดภายในแต่ละคลาสมีความเข้มข้นที่จุดกึ่งกลางของคลาส:
ที่ไหน - ค่าเฉลี่ยตัวอย่าง n- จำนวนการสังเกตหรือขนาดตัวอย่าง กับ- จำนวนคลาสในการแจกแจงความถี่ มเจ- จุดกึ่งกลาง เจชั้นเรียน ฉเจ- ความถี่ที่สอดคล้องกัน เจ-ชั้น.
ในการคำนวณค่าเบี่ยงเบนมาตรฐานจากการแจกแจงความถี่ก็จะถือว่าค่าทั้งหมดภายในแต่ละคลาสนั้นเข้มข้นที่จุดกึ่งกลางของคลาส
เพื่อให้เข้าใจว่าควอร์ไทล์ของซีรีย์ถูกกำหนดตามความถี่อย่างไร ให้พิจารณาการคำนวณควอไทล์ที่ต่ำกว่าตามข้อมูลสำหรับปี 2013 เกี่ยวกับการกระจายตัวของประชากรรัสเซียตามรายได้ทางการเงินเฉลี่ยต่อหัว (รูปที่ 12)
ข้าว. 12. ส่วนแบ่งของประชากรรัสเซียโดยมีรายได้เงินสดต่อหัวเฉลี่ยต่อเดือนรูเบิล
ในการคำนวณควอร์ไทล์แรกของอนุกรมการเปลี่ยนแปลงช่วง คุณสามารถใช้สูตร:
โดยที่ Q1 คือค่าของควอไทล์แรก xQ1 คือขีดจำกัดล่างของช่วงที่มีควอไทล์แรก (ช่วงถูกกำหนดโดยความถี่สะสมที่เกิน 25% แรก) ผม – ค่าช่วงเวลา; Σf – ผลรวมของความถี่ของกลุ่มตัวอย่างทั้งหมด อาจจะเท่ากับ 100% เสมอ SQ1–1 – ความถี่สะสมของช่วงเวลาก่อนช่วงที่มีควอไทล์ต่ำกว่า fQ1 – ความถี่ของช่วงเวลาที่มีควอไทล์ล่าง สูตรสำหรับควอร์ไทล์ที่ 3 จะแตกต่างตรงที่ว่าในทุกตำแหน่งคุณต้องใช้ Q3 แทน Q1 และแทนที่ ⁴ แทน ⁴
ในตัวอย่างของเรา (รูปที่ 12) ควอไทล์ล่างจะอยู่ในช่วง 7000.1 – 10,000 โดยมีความถี่สะสมอยู่ที่ 26.4% ขีดจำกัดล่างของช่วงเวลานี้คือ 7,000 รูเบิล ค่าของช่วงเวลาคือ 3,000 รูเบิล ความถี่สะสมของช่วงเวลาก่อนช่วงเวลาที่มีควอไทล์ต่ำกว่าคือ 13.4% ความถี่ของช่วงเวลาที่มีควอร์ไทล์ต่ำกว่าคือ 13.0% ดังนั้น: Q1 = 7000 + 3000 * (¼ * 100 – 13.4) / 13 = 9677 rub
ข้อผิดพลาดที่เกี่ยวข้องกับสถิติเชิงพรรณนา
ในโพสต์นี้ เราได้ดูวิธีอธิบายชุดข้อมูลโดยใช้สถิติต่างๆ ที่ประเมินค่าเฉลี่ย สเปรด และการกระจายของชุดข้อมูล ขั้นตอนต่อไปคือการวิเคราะห์และตีความข้อมูล จนถึงขณะนี้ เราได้ศึกษาคุณสมบัติวัตถุประสงค์ของข้อมูลแล้ว และตอนนี้เราไปยังการตีความเชิงอัตนัยแล้ว ผู้วิจัยเผชิญกับข้อผิดพลาดสองประการ: หัวข้อการวิเคราะห์ที่เลือกไม่ถูกต้องและการตีความผลลัพธ์ที่ไม่ถูกต้อง
การวิเคราะห์ผลตอบแทนของกองทุนรวมที่มีความเสี่ยงสูงมากทั้ง 15 กองทุน ค่อนข้างเป็นกลาง เขานำไปสู่ข้อสรุปที่เป็นกลางอย่างสมบูรณ์: กองทุนรวมทั้งหมดมีผลตอบแทนที่แตกต่างกัน ส่วนต่างของผลตอบแทนของกองทุนอยู่ในช่วง -6.1 ถึง 18.5 และผลตอบแทนเฉลี่ยอยู่ที่ 6.08 ความเที่ยงธรรมของการวิเคราะห์ข้อมูลได้รับการรับรองโดยการเลือกตัวบ่งชี้การกระจายเชิงปริมาณสรุปที่ถูกต้อง มีการพิจารณาหลายวิธีในการประมาณค่าเฉลี่ยและการกระจายของข้อมูล พร้อมระบุข้อดีและข้อเสีย คุณจะเลือกสถิติที่เหมาะสมเพื่อให้การวิเคราะห์ที่เป็นกลางและเป็นกลางได้อย่างไร หากการกระจายข้อมูลบิดเบือนเล็กน้อย คุณควรเลือกค่ามัธยฐานมากกว่าค่าเฉลี่ยหรือไม่ ตัวบ่งชี้ใดที่อธิบายลักษณะการแพร่กระจายของข้อมูลได้แม่นยำยิ่งขึ้น: ส่วนเบี่ยงเบนมาตรฐานหรือช่วง เราควรชี้ให้เห็นว่าการกระจายตัวมีความเบ้ในเชิงบวกหรือไม่?
ในทางกลับกัน การตีความข้อมูลเป็นกระบวนการเชิงอัตวิสัย แต่ละคนจะได้ข้อสรุปที่แตกต่างกันเมื่อตีความผลลัพธ์เดียวกัน ทุกคนมีมุมมองของตัวเอง มีคนมองว่าผลตอบแทนเฉลี่ยต่อปีของ 15 กองทุนที่มีความเสี่ยงสูงมากนั้นดีและค่อนข้างพอใจกับรายได้ที่ได้รับ คนอื่นอาจรู้สึกว่ากองทุนเหล่านี้ให้ผลตอบแทนต่ำเกินไป ดังนั้นความเป็นส่วนตัวควรได้รับการชดเชยด้วยความซื่อสัตย์ ความเป็นกลาง และความชัดเจนของข้อสรุป
ประเด็นด้านจริยธรรม
การวิเคราะห์ข้อมูลเชื่อมโยงกับประเด็นด้านจริยธรรมอย่างแยกไม่ออก คุณควรวิพากษ์วิจารณ์ข้อมูลที่เผยแพร่ทางหนังสือพิมพ์ วิทยุ โทรทัศน์ และอินเทอร์เน็ต เมื่อเวลาผ่านไป คุณจะได้เรียนรู้ที่จะสงสัยไม่เพียงแต่ในผลลัพธ์เท่านั้น แต่ยังรวมถึงเป้าหมาย เนื้อหาสาระ และความเที่ยงธรรมของการวิจัยด้วย เบนจามิน ดิสเรลี นักการเมืองชื่อดังชาวอังกฤษกล่าวไว้ได้ดีที่สุด: “การโกหกมีสามประเภท: การโกหก การโกหกสาปแช่ง และสถิติ”
ตามที่ระบุไว้ในหมายเหตุ ประเด็นด้านจริยธรรมเกิดขึ้นเมื่อเลือกผลลัพธ์ที่ควรนำเสนอในรายงาน ควรเผยแพร่ผลลัพธ์ทั้งเชิงบวกและเชิงลบ นอกจากนี้ในการจัดทำรายงานหรือรายงานเป็นลายลักษณ์อักษรต้องนำเสนอผลด้วยความซื่อสัตย์ เป็นกลาง และเป็นกลาง มีความแตกต่างระหว่างการนำเสนอที่ไม่ประสบความสำเร็จและการนำเสนอที่ไม่ซื่อสัตย์ ในการดำเนินการนี้ จำเป็นต้องพิจารณาว่าผู้พูดมีเจตนาอะไร บางครั้งผู้พูดละเว้นข้อมูลสำคัญไปเพราะความไม่รู้ และบางครั้งก็เป็นการจงใจ (เช่น ถ้าเขาใช้ค่าเฉลี่ยเลขคณิตเพื่อประมาณค่าเฉลี่ยของข้อมูลที่บิดเบือนอย่างชัดเจนเพื่อให้ได้ผลลัพธ์ที่ต้องการ) นอกจากนี้ยังเป็นการไม่ซื่อสัตย์ที่จะระงับผลลัพธ์ที่ไม่สอดคล้องกับมุมมองของผู้วิจัย
มีการใช้สื่อจากหนังสือ Levin และคณะ สถิติสำหรับผู้จัดการ – อ.: วิลเลียมส์, 2004. – หน้า. 178–209
ฟังก์ชัน QUARTILE ยังคงอยู่เพื่อให้เข้ากันได้กับ Excel เวอร์ชันก่อนหน้า
ในทางคณิตศาสตร์ ค่าเฉลี่ยเลขคณิตของตัวเลข (หรือเพียงแค่ค่าเฉลี่ย) คือผลรวมของตัวเลขทั้งหมดในชุดที่กำหนดหารด้วยจำนวนตัวเลข นี่เป็นแนวคิดเรื่องค่าเฉลี่ยที่แพร่หลายและแพร่หลายที่สุด ดังที่คุณเข้าใจแล้ว หากต้องการหาค่าเฉลี่ย คุณต้องรวมตัวเลขทั้งหมดที่ให้ไว้ และหารผลลัพธ์ที่ได้ด้วยจำนวนเทอม
ค่าเฉลี่ยเลขคณิตคืออะไร?
ลองดูตัวอย่าง
ตัวอย่างที่ 1- ตัวเลขที่กำหนด: 6, 7, 11 คุณต้องค้นหาค่าเฉลี่ยของพวกเขา
สารละลาย.
ก่อนอื่น มาหาผลรวมของตัวเลขเหล่านี้กันก่อน
ตอนนี้หารผลรวมผลลัพธ์ด้วยจำนวนเทอม เนื่องจากเรามีเทอมสามเทอม เราก็เลยหารด้วยสามเทอม
ดังนั้นค่าเฉลี่ยของตัวเลข 6, 7 และ 11 คือ 8 ทำไมต้องเป็น 8? ใช่ เพราะผลรวมของ 6, 7 และ 11 จะเท่ากับสามแปด ดังจะเห็นได้ชัดเจนในภาพประกอบ
ค่าเฉลี่ยก็เหมือนกับ "ช่วงเย็น" ของชุดตัวเลข อย่างที่คุณเห็นกองดินสอก็อยู่ในระดับเดียวกัน
ลองดูอีกตัวอย่างหนึ่งเพื่อรวบรวมความรู้ที่ได้รับ
ตัวอย่างที่ 2ตัวเลขที่กำหนด: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29 คุณต้องค้นหาค่าเฉลี่ยเลขคณิตของพวกมัน
สารละลาย.
หาจำนวนเงิน.
3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330
หารด้วยจำนวนเทอม (ในกรณีนี้ - 15)
ดังนั้นค่าเฉลี่ยของชุดตัวเลขนี้คือ 22
ทีนี้ลองดูตัวเลขติดลบ จำไว้ว่าจะสรุปอย่างไร ตัวอย่างเช่น คุณมีตัวเลข 1 และ -4 สองตัว มาหาผลรวมของพวกเขากันดีกว่า
1 + (-4) = 1 – 4 = -3
เมื่อรู้อย่างนี้แล้วเรามาดูตัวอย่างอื่นกัน
ตัวอย่างที่ 3ค้นหาค่าเฉลี่ยของชุดตัวเลข: 3, -7, 5, 13, -2
สารละลาย.
หาผลรวมของตัวเลข
3 + (-7) + 5 + 13 + (-2) = 12
เนื่องจากมี 5 เทอม ให้หารผลรวมผลลัพธ์ด้วย 5
ดังนั้นค่าเฉลี่ยเลขคณิตของตัวเลข 3, -7, 5, 13, -2 คือ 2.4
ในยุคที่ความก้าวหน้าทางเทคโนโลยีของเรา การใช้โปรแกรมคอมพิวเตอร์เพื่อค้นหาค่าเฉลี่ยจะสะดวกกว่ามาก Microsoft Office Excel เป็นหนึ่งในนั้น การค้นหาค่าเฉลี่ยใน Excel ทำได้ง่ายและรวดเร็ว นอกจากนี้โปรแกรมนี้ยังรวมอยู่ในแพ็คเกจซอฟต์แวร์ Microsoft Office มาดูคำแนะนำสั้นๆ เกี่ยวกับวิธีการหาค่าเฉลี่ยเลขคณิตโดยใช้โปรแกรมนี้กัน
ในการคำนวณค่าเฉลี่ยของชุดตัวเลข คุณต้องใช้ฟังก์ชัน AVERAGE ไวยากรณ์สำหรับฟังก์ชันนี้คือ:
= ค่าเฉลี่ย(argument1, argument2, ... argument255)
โดยที่ argument1, argument2, ... argument255 เป็นตัวเลขหรือการอ้างอิงเซลล์ (โดยเซลล์ เราหมายถึงช่วงและอาร์เรย์)
เพื่อให้ชัดเจนยิ่งขึ้น เรามาลองใช้ความรู้ที่เราได้รับกันดีกว่า
- ป้อนตัวเลข 11, 12, 13, 14, 15, 16 ในเซลล์ C1 – C6
- เลือกเซลล์ C7 โดยคลิกที่มัน ในเซลล์นี้เราจะแสดงค่าเฉลี่ย
- คลิกที่แท็บสูตร
- เลือกฟังก์ชันเพิ่มเติม > เชิงสถิติ เพื่อเปิดรายการแบบเลื่อนลง
- เลือกค่าเฉลี่ย หลังจากนี้ กล่องโต้ตอบควรเปิดขึ้น
- เลือกและลากเซลล์ C1 ถึง C6 ไปที่นั่นเพื่อกำหนดช่วงในกล่องโต้ตอบ
- ยืนยันการกระทำของคุณด้วยปุ่ม "ตกลง"
- หากคุณทำทุกอย่างถูกต้อง คุณควรมีคำตอบในเซลล์ C7 - 13.7 เมื่อคุณคลิกที่เซลล์ C7 ฟังก์ชัน (=Average(C1:C6)) จะปรากฏในแถบสูตร
คุณลักษณะนี้มีประโยชน์มากสำหรับการบัญชี ใบแจ้งหนี้ หรือเมื่อคุณต้องการค้นหาค่าเฉลี่ยของชุดตัวเลขที่ยาวมาก ดังนั้นจึงมักใช้ในสำนักงานและบริษัทขนาดใหญ่ สิ่งนี้ช่วยให้คุณรักษาระเบียบในบันทึกของคุณและทำให้สามารถคำนวณบางสิ่งได้อย่างรวดเร็ว (เช่น รายได้เฉลี่ยต่อเดือน) คุณยังสามารถใช้ Excel เพื่อค้นหาค่าเฉลี่ยของฟังก์ชันได้
ค่าเฉลี่ยเลขคณิต
คำนี้มีความหมายอื่น ดูความหมายเฉลี่ยค่าเฉลี่ยเลขคณิต(ในคณิตศาสตร์และสถิติ) ชุดตัวเลข - ผลรวมของตัวเลขทั้งหมดหารด้วยตัวเลข เป็นหนึ่งในมาตรการที่ใช้กันทั่วไปมากที่สุดสำหรับแนวโน้มจากศูนย์กลาง
มันถูกเสนอโดยชาวพีทาโกรัส (พร้อมด้วยค่าเฉลี่ยเรขาคณิตและค่าเฉลี่ยฮาร์มอนิก)
กรณีพิเศษของค่าเฉลี่ยเลขคณิตคือค่าเฉลี่ย (ประชากรทั่วไป) และค่าเฉลี่ยตัวอย่าง (ตัวอย่าง)
การแนะนำ
ให้เราแสดงชุดของข้อมูล เอ็กซ์ = (x 1 , x 2 , …, x n) จากนั้นค่าเฉลี่ยตัวอย่างมักจะระบุด้วยแถบแนวนอนเหนือตัวแปร (x เวิร์ค (\displaystyle (\bar (x))) อ่านว่า " xด้วยเส้น")
ตัวอักษรกรีก μ ใช้เพื่อแสดงถึงค่าเฉลี่ยเลขคณิตของประชากรทั้งหมด สำหรับตัวแปรสุ่มที่กำหนดค่าเฉลี่ย μ คือ ค่าเฉลี่ยความน่าจะเป็นหรือความคาดหวังทางคณิตศาสตร์ของตัวแปรสุ่ม ถ้าเป็นชุด เอ็กซ์คือชุดของตัวเลขสุ่มที่มีค่าเฉลี่ยความน่าจะเป็น µ จากนั้นสำหรับตัวอย่างใดๆ x ฉันจากเซตนี้ μ = E( x ฉัน) คือความคาดหวังทางคณิตศาสตร์ของตัวอย่างนี้
ในทางปฏิบัติ ความแตกต่างระหว่าง μ และ x zel (\displaystyle (\bar (x))) ก็คือ μ เป็นตัวแปรทั่วไปเพราะคุณสามารถเห็นตัวอย่างมากกว่าจำนวนประชากรทั้งหมด ดังนั้น หากตัวอย่างถูกแสดงแบบสุ่ม (ในแง่ของทฤษฎีความน่าจะเป็น) ดังนั้น x mac (\displaystyle (\bar (x))) (แต่ไม่ใช่ μ) สามารถถือเป็นตัวแปรสุ่มที่มีการแจกแจงความน่าจะเป็นบนตัวอย่าง ( การกระจายความน่าจะเป็นของค่าเฉลี่ย)
ปริมาณทั้งสองนี้คำนวณในลักษณะเดียวกัน:
X mac = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)
ถ้า เอ็กซ์เป็นตัวแปรสุ่ม จากนั้นจึงเป็นความคาดหวังทางคณิตศาสตร์ เอ็กซ์ถือได้ว่าเป็นค่าเฉลี่ยเลขคณิตของค่าในการวัดปริมาณซ้ำ ๆ เอ็กซ์- นี่คือการสำแดงกฎแห่งคนจำนวนมาก ดังนั้นจึงใช้ค่าเฉลี่ยตัวอย่างเพื่อประมาณค่าที่คาดหวังที่ไม่ทราบ
ได้รับการพิสูจน์แล้วในพีชคณิตเบื้องต้นว่าค่าเฉลี่ย n+ 1 หมายเลขสูงกว่าค่าเฉลี่ย nตัวเลขก็ต่อเมื่อตัวเลขใหม่มากกว่าค่าเฉลี่ยเดิม น้อยลงก็ต่อเมื่อตัวเลขใหม่น้อยกว่าค่าเฉลี่ย และไม่เปลี่ยนแปลงหากและต่อเมื่อตัวเลขใหม่เท่ากับค่าเฉลี่ย ยิ่งมาก. nยิ่งความแตกต่างระหว่างค่าเฉลี่ยใหม่และเก่ายิ่งน้อยลง
โปรดทราบว่ายังมี “ค่าเฉลี่ย” อื่นๆ อีกหลายค่า รวมถึงค่าเฉลี่ยกำลัง ค่าเฉลี่ยโคลโมโกรอฟ ค่าเฉลี่ยฮาร์มอนิก ค่าเฉลี่ยเลขคณิต-เรขาคณิต และค่าเฉลี่ยถ่วงน้ำหนักต่างๆ (เช่น ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก ค่าเฉลี่ยเรขาคณิตถ่วงน้ำหนัก ค่าเฉลี่ยฮาร์มอนิกถ่วงน้ำหนัก)
ตัวอย่าง
- สำหรับตัวเลขสามตัว คุณต้องบวกและหารด้วย 3:
- สำหรับตัวเลขสี่ตัว คุณต้องบวกและหารด้วย 4:
หรือง่ายกว่านั้น 5+5=10, 10:2 เพราะเราบวกเลข 2 ตัว ซึ่งหมายถึงจำนวนที่เราบวก เราจึงหารด้วยจำนวนนั้น
ตัวแปรสุ่มต่อเนื่อง
สำหรับปริมาณที่กระจายอย่างต่อเนื่อง f (x) (\displaystyle f(x)) ค่าเฉลี่ยเลขคณิตในช่วงเวลา [ a ; b ] (\displaystyle ) ถูกกำหนดโดยอินทิกรัลจำกัดเขต:
F (x) Â [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x)))_()=(\frac (1)(b-a))\int _(a)^(b) เอฟ(x)ดีเอ็กซ์)
ปัญหาบางประการในการใช้ค่าเฉลี่ย
ขาดความแข็งแกร่ง
บทความหลัก: ความคงทนในด้านสถิติแม้ว่าค่าเฉลี่ยเลขคณิตมักใช้เป็นค่าเฉลี่ยหรือแนวโน้มศูนย์กลาง แต่แนวคิดนี้ไม่ใช่สถิติที่ชัดเจน ซึ่งหมายความว่าค่าเฉลี่ยเลขคณิตได้รับอิทธิพลอย่างมากจาก "ค่าเบี่ยงเบนมาก" เป็นที่น่าสังเกตว่าสำหรับการแจกแจงที่มีค่าสัมประสิทธิ์ความเบ้สูงค่าเฉลี่ยเลขคณิตอาจไม่สอดคล้องกับแนวคิดเรื่อง "ค่าเฉลี่ย" และค่าของค่าเฉลี่ยจากสถิติที่แข็งแกร่ง (เช่นค่ามัธยฐาน) อาจอธิบายค่ากลางได้ดีกว่า แนวโน้ม
ตัวอย่างคลาสสิกคือการคำนวณรายได้เฉลี่ย ค่าเฉลี่ยเลขคณิตสามารถตีความผิดว่าเป็นค่ามัธยฐาน ซึ่งอาจนำไปสู่ข้อสรุปว่ามีคนมีรายได้สูงกว่าที่มีอยู่จริงเป็นจำนวนมาก รายได้ "เฉลี่ย" ตีความว่าคนส่วนใหญ่มีรายได้ประมาณจำนวนนี้ รายได้ “เฉลี่ย” (ในแง่ของค่าเฉลี่ยเลขคณิต) นี้สูงกว่ารายได้ของคนส่วนใหญ่ เนื่องจากรายได้ที่สูงโดยมีส่วนเบี่ยงเบนจากค่าเฉลี่ยมากทำให้ค่าเฉลี่ยเลขคณิตเบี่ยงเบนไปมาก (ในทางตรงกันข้าม รายได้เฉลี่ยที่ค่ามัธยฐาน “ต่อต้าน” ความเบ้ดังกล่าว) อย่างไรก็ตาม รายได้ "เฉลี่ย" นี้ไม่ได้พูดอะไรเกี่ยวกับจำนวนคนที่ใกล้กับรายได้มัธยฐาน (และไม่พูดอะไรเกี่ยวกับจำนวนคนที่ใกล้กับรายได้กิริยา) อย่างไรก็ตาม หากคุณพิจารณาแนวคิดเรื่อง “คนทั่วไป” และ “คนส่วนใหญ่” เพียงเล็กน้อย ก็สามารถสรุปผลที่ไม่ถูกต้องได้ว่าคนส่วนใหญ่มีรายได้สูงกว่าความเป็นจริง ตัวอย่างเช่น รายงานรายได้สุทธิ "เฉลี่ย" ในเมืองเมดินา รัฐวอชิงตัน ซึ่งคำนวณเป็นค่าเฉลี่ยเลขคณิตของรายได้สุทธิต่อปีของผู้พักอาศัย จะทำให้เกิดรายได้จำนวนมากอย่างน่าประหลาดใจเนื่องมาจากบิล เกตส์ พิจารณาตัวอย่าง (1, 2, 2, 2, 3, 9) ค่าเฉลี่ยเลขคณิตคือ 3.17 แต่ค่าห้าในหกค่าอยู่ต่ำกว่าค่าเฉลี่ยนี้
ดอกเบี้ยทบต้น
บทความหลัก: ผลตอบแทนจากการลงทุนถ้าเป็นตัวเลข คูณ, ไม่ พับคุณต้องใช้ค่าเฉลี่ยเรขาคณิต ไม่ใช่ค่าเฉลี่ยเลขคณิต เหตุการณ์นี้มักเกิดขึ้นเมื่อคำนวณผลตอบแทนจากการลงทุนในการเงิน
ตัวอย่างเช่น หากหุ้นลดลง 10% ในปีแรกและเพิ่มขึ้น 30% ในปีที่สอง การคำนวณการเพิ่มขึ้นของ “ค่าเฉลี่ย” ในช่วงสองปีนั้นไม่ถูกต้องเนื่องจากค่าเฉลี่ยเลขคณิต (−10% + 30%) / 2 = 10%; ค่าเฉลี่ยที่ถูกต้องในกรณีนี้กำหนดโดยอัตราการเติบโตต่อปีแบบทบต้น ซึ่งให้อัตราการเติบโตต่อปีเพียงประมาณ 8.16653826392% กลับไปยัง 8.2%
เหตุผลก็คือเปอร์เซ็นต์มีจุดเริ่มต้นใหม่ทุกครั้ง: 30% คือ 30% จากจำนวนที่ต่ำกว่าราคาต้นปีแรก:หากหุ้นเริ่มต้นที่ 30 ดอลลาร์และลดลง 10% จะมีมูลค่า 27 ดอลลาร์ในช่วงต้นปีที่สอง หากหุ้นเพิ่มขึ้น 30% จะมีมูลค่า 35.1 ดอลลาร์ในช่วงสิ้นปีที่สอง ค่าเฉลี่ยเลขคณิตของการเติบโตนี้คือ 10% แต่เนื่องจากหุ้นเพิ่มขึ้นเพียง 5.1 ดอลลาร์ในช่วง 2 ปี การเติบโตเฉลี่ย 8.2% จึงให้ผลลัพธ์สุดท้ายที่ 35.1 ดอลลาร์:
[$30 (1 - 0.1) (1 + 0.3) = $30 (1 + 0.082) (1 + 0.082) = $35.1] หากเราใช้ค่าเฉลี่ยเลขคณิต 10% ในลักษณะเดียวกัน เราจะไม่ได้มูลค่าจริง: [$30 (1 + 0.1) (1 + 0.1) = $36.3]
ดอกเบี้ยทบต้น ณ สิ้นปี 2: 90% * 130% = 117% กล่าวคือ เพิ่มขึ้นทั้งหมด 17% และดอกเบี้ยทบต้นเฉลี่ยต่อปีคือ 117% ความเข้มข้น 108.2% (\displaystyle (\sqrt (117\% ))\ประมาณ 108.2\%) นั่นคือ เพิ่มขึ้นเฉลี่ย 8.2% ต่อปี
ทิศทาง
บทความหลัก: สถิติจุดหมายปลายทางเมื่อคำนวณค่าเฉลี่ยเลขคณิตของตัวแปรบางตัวที่เปลี่ยนแปลงเป็นวงจร (เช่น เฟสหรือมุม) จะต้องระมัดระวังเป็นพิเศษ ตัวอย่างเช่น ค่าเฉลี่ยของ 1° และ 359° จะเป็น 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180° หมายเลขนี้ไม่ถูกต้องด้วยเหตุผลสองประการ
- ประการแรก การวัดเชิงมุมถูกกำหนดไว้สำหรับช่วงตั้งแต่ 0° ถึง 360° เท่านั้น (หรือตั้งแต่ 0 ถึง 2π เมื่อวัดเป็นเรเดียน) ดังนั้นตัวเลขคู่เดียวกันสามารถเขียนเป็น (1° และ −1°) หรือเป็น (1° และ 719°) ค่าเฉลี่ยของแต่ละคู่จะแตกต่างกัน: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2 ))=0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\ วงกลม )) .
- ประการที่สอง ในกรณีนี้ ค่า 0° (เทียบเท่า 360°) จะเป็นค่าเฉลี่ยที่ดีกว่าทางเรขาคณิต เนื่องจากตัวเลขเบี่ยงเบนจาก 0° น้อยกว่าค่าอื่นๆ (ค่า 0° มีความแปรปรวนน้อยที่สุด) เปรียบเทียบ:
- ตัวเลข 1° เบี่ยงเบนจาก 0° เพียง 1°;
- ตัวเลข 1° เบี่ยงเบนไปจากค่าเฉลี่ยที่คำนวณได้ 180° x 179°
ค่าเฉลี่ยของตัวแปรไซคลิกที่คำนวณโดยใช้สูตรข้างต้นจะถูกเลื่อนโดยสัมพันธ์กับค่าเฉลี่ยจริงไปตรงกลางของช่วงตัวเลข ด้วยเหตุนี้ ค่าเฉลี่ยจึงถูกคำนวณด้วยวิธีอื่น กล่าวคือ ตัวเลขที่มีความแปรปรวนน้อยที่สุด (จุดกึ่งกลาง) จะถูกเลือกเป็นค่าเฉลี่ย นอกจากนี้ แทนที่จะลบ ระบบจะใช้ระยะห่างแบบโมดูลาร์ (นั่นคือ ระยะห่างเส้นรอบวง) ตัวอย่างเช่น ระยะโมดูลาร์ระหว่าง 1° ถึง 359° คือ 2° ไม่ใช่ 358° (บนวงกลมระหว่าง 359° ถึง 360°==0° - หนึ่งองศา ระหว่าง 0° ถึง 1° - รวม 1° ด้วย - 2 °)
ค่าเฉลี่ยถ่วงน้ำหนัก - คืออะไรและจะคำนวณได้อย่างไร?
ในกระบวนการเรียนคณิตศาสตร์ เด็กนักเรียนจะคุ้นเคยกับแนวคิดเรื่องค่าเฉลี่ยเลขคณิต ต่อมาในด้านสถิติและวิทยาศาสตร์อื่นๆ นักเรียนต้องเผชิญกับการคำนวณค่าเฉลี่ยอื่นๆ พวกเขาสามารถเป็นอะไรได้บ้างและแตกต่างกันอย่างไร?
ค่าเฉลี่ย: ความหมายและความแตกต่าง
ตัวชี้วัดที่แม่นยำไม่ได้ช่วยให้เข้าใจสถานการณ์ได้เสมอไป เพื่อประเมินสถานการณ์เฉพาะ บางครั้งจำเป็นต้องวิเคราะห์ตัวเลขจำนวนมาก แล้วค่าเฉลี่ยก็เข้ามาช่วยเหลือ ช่วยให้เราประเมินสถานการณ์โดยรวมได้
ตั้งแต่สมัยเรียน ผู้ใหญ่หลายคนจำการมีอยู่ของค่าเฉลี่ยเลขคณิตได้ คำนวณได้ง่ายมาก - ผลรวมของลำดับของพจน์ n หารด้วย n นั่นคือถ้าคุณต้องการคำนวณค่าเฉลี่ยเลขคณิตตามลำดับค่า 27, 22, 34 และ 37 คุณต้องแก้นิพจน์ (27+22+34+37)/4 เนื่องจาก 4 ค่า ใช้ในการคำนวณ ในกรณีนี้ ค่าที่ต้องการจะเป็น 30
ค่าเฉลี่ยเรขาคณิตมักถูกศึกษาโดยเป็นส่วนหนึ่งของหลักสูตรของโรงเรียน การคำนวณค่านี้ขึ้นอยู่กับการแยกรากที่ n ของผลิตภัณฑ์ของเงื่อนไข n หากเราใช้ตัวเลขเดียวกัน: 27, 22, 34 และ 37 ผลลัพธ์ของการคำนวณจะเท่ากับ 29.4
ค่าเฉลี่ยฮาร์มอนิกมักไม่ใช่หัวข้อของการศึกษาในโรงเรียนมัธยมศึกษา อย่างไรก็ตามมีการใช้ค่อนข้างบ่อย ค่านี้เป็นค่าผกผันของค่าเฉลี่ยเลขคณิตและคำนวณเป็นผลหารของ n - จำนวนค่าและผลรวม 1/a 1 +1/a 2 +...+1/a n หากเราคำนวณตัวเลขชุดเดียวกันอีกครั้ง ฮาร์มอนิกจะเป็น 29.6
ค่าเฉลี่ยถ่วงน้ำหนัก: คุณสมบัติ
อย่างไรก็ตามค่าที่กล่าวมาทั้งหมดอาจไม่สามารถนำมาใช้ได้ทุกที่ ตัวอย่างเช่น ในสถิติ เมื่อคำนวณค่าเฉลี่ยบางอย่าง "น้ำหนัก" ของแต่ละตัวเลขที่ใช้ในการคำนวณมีบทบาทสำคัญ ผลลัพธ์สามารถบ่งชี้และถูกต้องได้มากกว่าเนื่องจากคำนึงถึงข้อมูลเพิ่มเติม โดยทั่วไปปริมาณกลุ่มนี้เรียกว่า "ค่าเฉลี่ยถ่วงน้ำหนัก" พวกเขาไม่ได้สอนในโรงเรียน ดังนั้นจึงควรดูรายละเอียดเพิ่มเติม
ก่อนอื่น ควรจะบอกว่า "น้ำหนัก" ของค่าใดค่าหนึ่งมีความหมายว่าอย่างไร วิธีที่ง่ายที่สุดในการอธิบายเรื่องนี้คือการใช้ตัวอย่างที่เฉพาะเจาะจง ในโรงพยาบาลจะมีการวัดอุณหภูมิร่างกายของผู้ป่วยแต่ละรายวันละสองครั้ง จากผู้ป่วย 100 รายในแผนกต่างๆ ของโรงพยาบาล 44 ราย จะมีอุณหภูมิปกติ - 36.6 องศา อีก 30 จะมีค่าเพิ่มขึ้น - 37.2, 14 - 38, 7 - 38.5, 3 - 39 และอีกสอง - 40 และถ้าเราเอาค่าเฉลี่ยเลขคณิตแล้วค่านี้โดยทั่วไปสำหรับโรงพยาบาลจะมากกว่า 38 องศา! แต่ผู้ป่วยเกือบครึ่งหนึ่งมีอุณหภูมิปกติโดยสมบูรณ์ และในที่นี้ การใช้ค่าเฉลี่ยถ่วงน้ำหนักจะถูกต้องมากกว่า และ "น้ำหนัก" ของแต่ละค่าจะเป็นจำนวนคน ในกรณีนี้ผลการคำนวณจะเป็น 37.25 องศา ความแตกต่างที่ชัดเจน
ในกรณีของการคำนวณถัวเฉลี่ยถ่วงน้ำหนัก "น้ำหนัก" อาจถือเป็นจำนวนการจัดส่ง จำนวนคนที่ทำงานในวันที่กำหนด โดยทั่วไป สิ่งใดก็ตามที่สามารถวัดได้และส่งผลต่อผลลัพธ์สุดท้าย
พันธุ์
ค่าเฉลี่ยถ่วงน้ำหนักเกี่ยวข้องกับค่าเฉลี่ยเลขคณิตที่กล่าวถึงในตอนต้นของบทความ อย่างไรก็ตาม ค่าแรกดังที่กล่าวไปแล้วยังคำนึงถึงน้ำหนักของแต่ละตัวเลขที่ใช้ในการคำนวณด้วย นอกจากนี้ยังมีค่าเรขาคณิตและค่าฮาร์มอนิกแบบถ่วงน้ำหนักอีกด้วย
มีอีกรูปแบบหนึ่งที่น่าสนใจที่ใช้ในอนุกรมตัวเลข นี่คือค่าเฉลี่ยเคลื่อนที่แบบถ่วงน้ำหนัก บนพื้นฐานนี้จะมีการคำนวณแนวโน้ม นอกจากค่านิยมและน้ำหนักแล้ว ยังใช้คาบเวลาด้วย และเมื่อคำนวณค่าเฉลี่ย ณ จุดใดจุดหนึ่ง ค่าของช่วงเวลาก่อนหน้าก็จะถูกนำมาพิจารณาด้วย
การคำนวณค่าเหล่านี้ทั้งหมดไม่ใช่เรื่องยาก แต่ในทางปฏิบัติมักใช้เฉพาะค่าเฉลี่ยถ่วงน้ำหนักธรรมดาเท่านั้น
วิธีการคำนวณ
ในยุคที่การใช้คอมพิวเตอร์แพร่หลาย ไม่จำเป็นต้องคำนวณค่าเฉลี่ยถ่วงน้ำหนักด้วยตนเอง อย่างไรก็ตาม การทราบสูตรการคำนวณจะมีประโยชน์เพื่อให้คุณสามารถตรวจสอบและปรับผลลัพธ์ที่ได้รับได้หากจำเป็น
วิธีที่ง่ายที่สุดคือการพิจารณาการคำนวณโดยใช้ตัวอย่างเฉพาะ
มีความจำเป็นต้องค้นหาว่าค่าจ้างเฉลี่ยในองค์กรนี้อยู่ที่เท่าใดโดยคำนึงถึงจำนวนคนงานที่ได้รับเงินเดือนอย่างใดอย่างหนึ่ง
ดังนั้นค่าเฉลี่ยถ่วงน้ำหนักจึงคำนวณโดยใช้สูตรต่อไปนี้:
x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)
ตัวอย่างเช่น การคำนวณจะเป็นดังนี้:
x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33.48
แน่นอนว่าไม่มีปัญหาในการคำนวณค่าเฉลี่ยถ่วงน้ำหนักด้วยตนเอง สูตรในการคำนวณค่านี้ในแอปพลิเคชันยอดนิยมที่มีสูตร - Excel - ดูเหมือนว่าฟังก์ชัน SUMPRODUCT (ชุดตัวเลข ชุดน้ำหนัก) / SUM (ชุดน้ำหนัก)
จะหาค่าเฉลี่ยใน Excel ได้อย่างไร?
จะหาค่าเฉลี่ยเลขคณิตใน Excel ได้อย่างไร?
วลาดิมีร์09854
มันไม่ง่ายไปกว่านี้แล้ว หากต้องการค้นหาค่าเฉลี่ยใน Excel คุณต้องมี 3 เซลล์เท่านั้น ในตอนแรกเราจะเขียนตัวเลขหนึ่งตัวในวินาที - อีกอันหนึ่ง และในเซลล์ที่สามเราจะป้อนสูตรที่จะให้ค่าเฉลี่ยระหว่างตัวเลขสองตัวนี้จากเซลล์แรกและเซลล์ที่สอง หากเซลล์หมายเลข 1 เรียกว่า A1 เซลล์หมายเลข 2 จะเรียกว่า B1 จากนั้นในเซลล์ที่มีสูตรคุณต้องเขียนสิ่งนี้:
สูตรนี้จะคำนวณค่าเฉลี่ยเลขคณิตของตัวเลขสองตัว
เพื่อให้การคำนวณของเราสวยงามยิ่งขึ้น เราสามารถเน้นเซลล์ด้วยเส้น ในรูปแบบของจาน
ใน Excel เองก็มีฟังก์ชันสำหรับกำหนดค่าเฉลี่ย แต่ฉันใช้วิธีที่ล้าสมัยและป้อนสูตรที่ฉันต้องการ ดังนั้นฉันมั่นใจว่า Excel จะคำนวณตามที่ฉันต้องการและจะไม่เกิดการปัดเศษขึ้นมาเอง
M3เซอร์เกย์
วิธีนี้ง่ายมากหากป้อนข้อมูลลงในเซลล์แล้ว หากคุณสนใจเพียงตัวเลข เพียงเลือกช่วง/ช่วงที่ต้องการ จากนั้นค่าของผลรวมของตัวเลขเหล่านี้ ค่าเฉลี่ยเลขคณิตและตัวเลขจะปรากฏที่มุมขวาล่างในแถบสถานะ
คุณสามารถเลือกเซลล์ว่างคลิกที่รูปสามเหลี่ยม (รายการแบบเลื่อนลง) "ผลรวมอัตโนมัติ" และเลือก "ค่าเฉลี่ย" ที่นั่น หลังจากนั้นคุณจะเห็นด้วยกับช่วงที่เสนอสำหรับการคำนวณหรือเลือกของคุณเอง
สุดท้ายนี้ คุณสามารถใช้สูตรได้โดยตรงโดยคลิก "แทรกฟังก์ชัน" ข้างแถบสูตรและที่อยู่ของเซลล์ ฟังก์ชัน AVERAGE อยู่ในหมวดหมู่ "สถิติ" และใช้เป็นอาร์กิวเมนต์ทั้งตัวเลขและการอ้างอิงเซลล์ เป็นต้น คุณยังสามารถเลือกตัวเลือกที่ซับซ้อนมากขึ้นได้ เช่น AVERAGEIF ซึ่งคำนวณค่าเฉลี่ยตามเงื่อนไข
ค้นหาค่าเฉลี่ยใน Excelเป็นงานที่ค่อนข้างง่าย ที่นี่คุณต้องเข้าใจว่าคุณต้องการใช้ค่าเฉลี่ยนี้ในบางสูตรหรือไม่
หากคุณต้องการรับค่าเพียงเลือกช่วงตัวเลขที่ต้องการ หลังจากนั้น Excel จะคำนวณค่าเฉลี่ยโดยอัตโนมัติ - มันจะแสดงในแถบสถานะหัวข้อ "ค่าเฉลี่ย"
ในกรณีที่คุณต้องการใช้ผลลัพธ์ในสูตร คุณสามารถทำได้ดังนี้:
1) รวมเซลล์โดยใช้ฟังก์ชัน SUM และหารทั้งหมดด้วยจำนวนตัวเลข
2) ตัวเลือกที่ถูกต้องกว่าคือการใช้ฟังก์ชันพิเศษที่เรียกว่า AVERAGE อาร์กิวเมนต์ของฟังก์ชันนี้อาจเป็นตัวเลขที่ระบุตามลำดับหรือช่วงของตัวเลข
วลาดิมีร์ ทิโคนอฟ
วงกลมค่าที่จะมีส่วนร่วมในการคำนวณคลิกแท็บ "สูตร" คุณจะเห็น "ผลรวมอัตโนมัติ" ทางด้านซ้ายและถัดจากนั้นจะมีรูปสามเหลี่ยมชี้ลง คลิกที่สามเหลี่ยมนี้แล้วเลือก "ปานกลาง" Voila เสร็จแล้ว) ที่ด้านล่างของคอลัมน์คุณจะเห็นค่าเฉลี่ย :)
เอคาเทรินา มูตาลาโปวา
เริ่มจากจุดเริ่มต้นและตามลำดับ ค่าเฉลี่ยหมายถึงอะไร?
ค่าเฉลี่ย คือ ค่าที่เป็นค่าเฉลี่ยเลขคณิต กล่าวคือ คำนวณโดยการบวกชุดตัวเลขแล้วหารผลรวมของตัวเลขทั้งหมดด้วยตัวเลข ตัวอย่างเช่นสำหรับตัวเลข 2, 3, 6, 7, 2 จะมี 4 (ผลรวมของตัวเลข 20 หารด้วยหมายเลข 5)
ในสเปรดชีต Excel โดยส่วนตัวแล้วสำหรับฉัน วิธีที่ง่ายที่สุดคือการใช้สูตร = AVERAGE ในการคำนวณค่าเฉลี่ย คุณต้องป้อนข้อมูลลงในตาราง เขียนฟังก์ชัน =AVERAGE() ใต้คอลัมน์ข้อมูล และระบุช่วงของตัวเลขในเซลล์ในวงเล็บ โดยเน้นคอลัมน์ด้วยข้อมูล หลังจากนั้นให้กด ENTER หรือคลิกซ้ายที่เซลล์ใดก็ได้ ผลลัพธ์จะปรากฏในเซลล์ใต้คอลัมน์ ดูเหมือนอธิบายอย่างเข้าใจยาก แต่จริงๆ แล้วมันเป็นเรื่องของไม่กี่นาที
นักผจญภัย 2000
Excel เป็นโปรแกรมที่หลากหลาย ดังนั้นจึงมีหลายตัวเลือกที่จะช่วยให้คุณค้นหาค่าเฉลี่ยได้:
ตัวเลือกแรก คุณเพียงแค่รวมเซลล์ทั้งหมดแล้วหารด้วยจำนวนของเซลล์
ตัวเลือกที่สอง ใช้คำสั่งพิเศษเขียนสูตร "= AVERAGE (และที่นี่ระบุช่วงของเซลล์)" ในเซลล์ที่ต้องการ
ตัวเลือกที่สาม หากคุณเลือกช่วงที่ต้องการ โปรดทราบว่าในหน้าด้านล่าง ค่าเฉลี่ยในเซลล์เหล่านี้ก็จะแสดงเช่นกัน
ดังนั้นจึงมีหลายวิธีในการค้นหาค่าเฉลี่ย คุณเพียงแค่ต้องเลือกค่าที่ดีที่สุดสำหรับคุณและใช้มันอย่างต่อเนื่อง
ใน Excel คุณสามารถใช้ฟังก์ชัน AVERAGE เพื่อคำนวณค่าเฉลี่ยเลขคณิตอย่างง่ายได้ ในการดำเนินการนี้ คุณจะต้องป้อนค่าจำนวนหนึ่ง กดเท่ากับแล้วเลือกทางสถิติในหมวดหมู่ จากนั้นเลือกฟังก์ชัน AVERAGE
นอกจากนี้ เมื่อใช้สูตรทางสถิติ คุณสามารถคำนวณค่าเฉลี่ยเลขคณิตแบบถ่วงน้ำหนักได้ซึ่งถือว่ามีความแม่นยำมากกว่า ในการคำนวณ เราจำเป็นต้องมีค่าตัวบ่งชี้และความถี่
จะหาค่าเฉลี่ยใน Excel ได้อย่างไร?
นี่คือสถานการณ์ มีตารางดังต่อไปนี้:
คอลัมน์ที่แรเงาสีแดงประกอบด้วยค่าตัวเลขของเกรดในรายวิชา ในคอลัมน์ "คะแนนเฉลี่ย" คุณต้องคำนวณค่าเฉลี่ย
ปัญหาคือมีทั้งหมด 60-70 รายการและบางรายการอยู่ในแผ่นงานอื่น
ฉันดูในเอกสารอื่นและมีการคำนวณค่าเฉลี่ยแล้ว และในเซลล์ก็มีสูตรดังนี้
="ชื่อแผ่นงาน"!|E12
แต่สิ่งนี้ทำโดยโปรแกรมเมอร์บางคนที่ถูกไล่ออก
ช่วยบอกฉันทีว่าใครเข้าใจสิ่งนี้
เฮคเตอร์
ในบรรทัดฟังก์ชัน คุณใส่ "AVERAGE" จากฟังก์ชันที่เสนอ และเลือกตำแหน่งที่ต้องคำนวณจาก (B6:N6) สำหรับ Ivanov เป็นต้น ฉันไม่ทราบแน่ชัดเกี่ยวกับชีตที่อยู่ติดกัน แต่อาจมีอยู่ในวิธีใช้มาตรฐานของ Windows
บอกวิธีคำนวณค่าเฉลี่ยใน Word
โปรดบอกวิธีคำนวณค่าเฉลี่ยใน Word กล่าวคือเป็นค่าเฉลี่ยของการจัดอันดับ ไม่ใช่จำนวนผู้ที่ได้รับคะแนน
ยูเลีย ปาฟโลวา
Word สามารถทำอะไรได้มากมายกับมาโคร กด ALT+F11 แล้วเขียนโปรแกรมมาโคร..
นอกจากนี้ Insert-Object... ยังช่วยให้คุณใช้โปรแกรมอื่นได้ แม้แต่ Excel เพื่อสร้างชีตที่มีตารางภายในเอกสาร Word
แต่ในกรณีนี้ คุณต้องจดตัวเลขลงในคอลัมน์ของตาราง แล้วป้อนค่าเฉลี่ยในเซลล์ด้านล่างของคอลัมน์เดียวกันใช่ไหม
เมื่อต้องการทำเช่นนี้ ให้แทรกเขตข้อมูลลงในเซลล์ด้านล่าง
แทรกฟิลด์... -สูตร
เนื้อหาภาคสนาม
[=ค่าเฉลี่ย(ด้านบน)]
ให้ค่าเฉลี่ยของผลรวมของเซลล์ด้านบน
หากคุณเลือกฟิลด์และคลิกปุ่มเมาส์ขวา คุณสามารถอัปเดตได้หากตัวเลขมีการเปลี่ยนแปลง
ดูรหัสหรือค่าของฟิลด์ เปลี่ยนรหัสโดยตรงในฟิลด์
หากมีสิ่งผิดปกติเกิดขึ้น ให้ลบฟิลด์ทั้งหมดในเซลล์แล้วสร้างใหม่อีกครั้ง
AVERAGE หมายถึงค่าเฉลี่ย สูงกว่า - ประมาณ นั่นคือจำนวนเซลล์ที่อยู่ด้านบน
ฉันไม่รู้ทั้งหมดนี้ด้วยตัวเอง แต่แน่นอนว่าฉันค้นพบมันได้อย่างง่ายดายใน HELP ด้วยการคิดเพียงเล็กน้อย
ค่าเฉลี่ยมีการใช้กันอย่างแพร่หลายในสถิติ ค่าเฉลี่ยแสดงถึงตัวบ่งชี้เชิงคุณภาพของกิจกรรมเชิงพาณิชย์: ต้นทุนการจัดจำหน่าย, กำไร, ความสามารถในการทำกำไร ฯลฯ
เฉลี่ย - นี่เป็นหนึ่งในเทคนิคการวางนัยทั่วไปทั่วไป ความเข้าใจที่ถูกต้องเกี่ยวกับสาระสำคัญของค่าเฉลี่ยจะกำหนดความสำคัญพิเศษในระบบเศรษฐกิจแบบตลาด เมื่อค่าเฉลี่ยผ่านรายบุคคลและแบบสุ่ม ช่วยให้เราสามารถระบุข้อมูลทั่วไปและความจำเป็น เพื่อระบุแนวโน้มของรูปแบบของการพัฒนาเศรษฐกิจ
ค่าเฉลี่ย - สิ่งเหล่านี้เป็นตัวบ่งชี้ทั่วไปที่แสดงผลกระทบของสภาวะทั่วไปและรูปแบบของปรากฏการณ์ที่กำลังศึกษา
ค่าเฉลี่ยทางสถิติคำนวณบนพื้นฐานของข้อมูลมวลจากการสังเกตมวลที่มีการจัดการทางสถิติอย่างถูกต้อง (ต่อเนื่องและเลือก) อย่างไรก็ตาม ค่าเฉลี่ยทางสถิติจะเป็นไปตามวัตถุประสงค์และโดยทั่วไป หากคำนวณจากข้อมูลมวลสำหรับประชากรที่เป็นเนื้อเดียวกันในเชิงคุณภาพ (ปรากฏการณ์มวล) ตัวอย่างเช่น หากคุณคำนวณค่าจ้างเฉลี่ยในสหกรณ์และรัฐวิสาหกิจ และขยายผลลัพธ์ไปยังประชากรทั้งหมด ค่าเฉลี่ยนั้นเป็นสิ่งที่สมมติขึ้น เนื่องจากมันถูกคำนวณสำหรับประชากรที่แตกต่างกัน และค่าเฉลี่ยดังกล่าวจะสูญเสียความหมายทั้งหมด
ด้วยความช่วยเหลือของค่าเฉลี่ยความแตกต่างในมูลค่าของคุณลักษณะที่เกิดขึ้นด้วยเหตุผลใดก็ตามในแต่ละหน่วยการสังเกตจะถูกทำให้เรียบ
ตัวอย่างเช่น ประสิทธิภาพการทำงานโดยเฉลี่ยของพนักงานขายขึ้นอยู่กับหลายสาเหตุ เช่น คุณสมบัติ ระยะเวลาในการให้บริการ อายุ รูปแบบการให้บริการ สุขภาพ ฯลฯ
ผลผลิตเฉลี่ยสะท้อนถึงทรัพย์สินทั่วไปของประชากรทั้งหมด
ค่าเฉลี่ยเป็นการสะท้อนค่าของคุณลักษณะที่กำลังศึกษาจึงวัดในมิติเดียวกับคุณลักษณะนี้
ค่าเฉลี่ยแต่ละค่าจะแสดงลักษณะของประชากรที่อยู่ระหว่างการศึกษาตามลักษณะใดลักษณะหนึ่ง เพื่อให้ได้ความเข้าใจที่สมบูรณ์และครอบคลุมเกี่ยวกับประชากรที่กำลังศึกษาตามลักษณะสำคัญหลายประการ โดยทั่วไปจำเป็นต้องมีระบบค่าเฉลี่ยที่สามารถอธิบายปรากฏการณ์จากมุมที่ต่างกันได้
มีค่าเฉลี่ยที่แตกต่างกัน:
ค่าเฉลี่ยเลขคณิต
ค่าเฉลี่ยทางเรขาคณิต
ค่าเฉลี่ยฮาร์มอนิก
จัตุรัสเฉลี่ย
ลำดับเหตุการณ์โดยเฉลี่ย
มาดูค่าเฉลี่ยบางประเภทที่มักใช้ในสถิติกันดีกว่า
ค่าเฉลี่ยเลขคณิต
ค่าเฉลี่ยเลขคณิตอย่างง่าย (ไม่ถ่วงน้ำหนัก) เท่ากับผลรวมของแต่ละค่าของแอตทริบิวต์หารด้วยจำนวนค่าเหล่านี้
ค่าส่วนบุคคลของคุณลักษณะเรียกว่าตัวแปรและเขียนแทนด้วย x(); จำนวนหน่วยประชากรแสดงด้วย n ค่าเฉลี่ยของลักษณะแสดงด้วย - ดังนั้น ค่าเฉลี่ยเลขคณิตอย่างง่ายจึงเท่ากับ:
ตามข้อมูลชุดการแจกแจงแบบแยกส่วนเป็นที่ชัดเจนว่าค่าลักษณะเดียวกัน (ตัวแปร) ซ้ำหลายครั้ง ดังนั้น ตัวเลือก x เกิดขึ้นทั้งหมด 2 ครั้ง และตัวเลือก x 16 ครั้ง เป็นต้น
จำนวนค่าที่เหมือนกันของคุณลักษณะในแถวการแจกแจงเรียกว่าความถี่หรือน้ำหนักและเขียนแทนด้วยสัญลักษณ์ n
ลองคำนวณเงินเดือนเฉลี่ยของคนงานหนึ่งคน ในถู:
กองทุนค่าจ้างสำหรับคนงานแต่ละกลุ่มจะเท่ากับผลคูณของทางเลือกและความถี่ และผลรวมของผลิตภัณฑ์เหล่านี้คือกองทุนค่าจ้างรวมของคนงานทั้งหมด
ด้วยเหตุนี้การคำนวณจึงสามารถนำเสนอในรูปแบบทั่วไป:
สูตรที่ได้เรียกว่าค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก
จากผลของการประมวลผล วัสดุทางสถิติสามารถนำเสนอได้ไม่เพียงแต่ในรูปแบบของอนุกรมการแจกแจงแบบแยกส่วนเท่านั้น แต่ยังอยู่ในรูปแบบของอนุกรมการแปรผันช่วงเวลาที่มีช่วงปิดหรือเปิดอีกด้วย
ค่าเฉลี่ยสำหรับข้อมูลที่จัดกลุ่มคำนวณโดยใช้สูตรค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:
ในทางปฏิบัติด้านสถิติเศรษฐศาสตร์ บางครั้งจำเป็นต้องคำนวณค่าเฉลี่ยโดยใช้ค่าเฉลี่ยกลุ่มหรือค่าเฉลี่ยของแต่ละส่วนของประชากร (ค่าเฉลี่ยบางส่วน) ในกรณีเช่นนี้ ค่าเฉลี่ยกลุ่มหรือส่วนตัวจะถูกใช้เป็นตัวเลือก (x) โดยที่ค่าเฉลี่ยโดยรวมจะถูกคำนวณเป็นค่าเฉลี่ยเลขคณิตถ่วงน้ำหนักทั่วไป
คุณสมบัติพื้นฐานของค่าเฉลี่ยเลขคณิต .
ค่าเฉลี่ยเลขคณิตมีคุณสมบัติหลายประการ:
1. ค่าของค่าเฉลี่ยเลขคณิตจะไม่เปลี่ยนแปลงจากการลดหรือเพิ่มความถี่ของแต่ละค่าของคุณลักษณะ x คูณ n เท่า
หากความถี่ทั้งหมดถูกหารหรือคูณด้วยตัวเลขใดๆ ค่าเฉลี่ยจะไม่เปลี่ยนแปลง
2. ตัวคูณร่วมของแต่ละค่าของคุณลักษณะสามารถนำมาเกินกว่าเครื่องหมายของค่าเฉลี่ย:
3. ค่าเฉลี่ยของผลรวม (ผลต่าง) ของปริมาณตั้งแต่ 2 ปริมาณขึ้นไปจะเท่ากับผลรวม (ผลต่าง) ของค่าเฉลี่ย:
4. ถ้า x = c โดยที่ c เป็นค่าคงที่ แล้ว
.
5. ผลรวมของการเบี่ยงเบนของค่าของคุณลักษณะ X จากค่าเฉลี่ยเลขคณิต x เท่ากับศูนย์:
ค่าเฉลี่ยฮาร์มอนิก
นอกเหนือจากค่าเฉลี่ยเลขคณิตแล้ว สถิติยังใช้ค่าเฉลี่ยฮาร์มอนิกซึ่งเป็นค่าผกผันของค่าเฉลี่ยเลขคณิตของค่าผกผันของคุณลักษณะ เช่นเดียวกับค่าเฉลี่ยเลขคณิต มันสามารถง่ายและถ่วงน้ำหนักได้
ลักษณะของอนุกรมความผันแปรพร้อมกับค่าเฉลี่ยคือค่าโหมดและค่ามัธยฐาน
แฟชั่น - นี่คือค่าของคุณลักษณะ (ตัวแปร) ที่มักเกิดซ้ำในประชากรที่กำลังศึกษา สำหรับซีรีย์การกระจายแบบแยก โหมดจะเป็นค่าของตัวแปรที่มีความถี่สูงสุด
สำหรับอนุกรมการแจกแจงตามช่วงเวลาที่มีช่วงเวลาเท่ากัน โหมดจะถูกกำหนดโดยสูตร:
ที่ไหน
- ค่าเริ่มต้นของช่วงเวลาที่มีโหมด
- ค่าของช่วงเวลากิริยา;
- ความถี่ของช่วงเวลากิริยา;
- ความถี่ของช่วงเวลาก่อนหน้าโมดอลหนึ่ง
- ความถี่ของช่วงเวลาตามโมดอลหนึ่ง
ค่ามัธยฐาน - นี่คือตัวเลือกที่อยู่ตรงกลางของซีรีส์รูปแบบต่างๆ หากอนุกรมการแจกแจงไม่ต่อเนื่องและมีจำนวนสมาชิกเป็นเลขคี่ ค่ามัธยฐานจะเป็นตัวเลือกที่อยู่ตรงกลางของอนุกรมที่เรียงลำดับ (อนุกรมที่เรียงลำดับคือการจัดเรียงหน่วยประชากรตามลำดับจากน้อยไปมากหรือจากมากไปน้อย)
ค่าเฉลี่ยเลขคณิตหรือค่าเฉลี่ย เป็นหนึ่งในคุณลักษณะหลักของกลุ่มตัวอย่าง
ค่าเฉลี่ยเลขคณิต– ค่าของลักษณะดังกล่าว ผลรวมของการเบี่ยงเบนซึ่งค่าตัวอย่างของลักษณะดังกล่าวเท่ากับศูนย์ (โดยคำนึงถึงเครื่องหมายของการเบี่ยงเบน)
ค่าเฉลี่ยมักจะแสดงด้วยตัวอักษรเดียวกับตัวเลือกการสุ่มตัวอย่าง โดยมีข้อแตกต่างเพียงอย่างเดียวคือสัญลักษณ์ค่าเฉลี่ย (แท่ง) จะอยู่เหนือตัวอักษร เช่น ถ้าเราแสดงคุณลักษณะที่กำลังศึกษาโดย เอ็กซ์และค่าตัวเลขก็ผ่าน x ฉันแล้วค่าเฉลี่ยเลขคณิตจะมีการกำหนดไว้
ค่าเฉลี่ยเลขคณิต เช่นเดียวกับคุณลักษณะตัวเลขอื่นๆ ของกลุ่มตัวอย่าง สามารถคำนวณได้ทั้งจากข้อมูลปฐมภูมิดิบและจากผลลัพธ์ของการจัดกลุ่มข้อมูลนี้
สำหรับข้อมูลที่ไม่ได้จัดกลุ่ม ค่าเฉลี่ยเลขคณิตถูกกำหนดโดยใช้สูตรต่อไปนี้:
ที่ไหน n- ขนาดตัวอย่าง
x ฉัน- ตัวเลือกการสุ่มตัวอย่าง
หากข้อมูลถูกจัดกลุ่มแล้ว
ที่ไหน n- ขนาดตัวอย่าง
เค- จำนวนช่วงเวลาการจัดกลุ่ม
ฉัน- ความถี่ ฉันช่วงเวลาที่;
x ฉัน- ค่ามัธยฐาน ฉัน-ช่วงที่
ค่าเฉลี่ยเลขคณิตคือค่าที่มีชื่อเดียวกันกับค่าของคุณลักษณะ
การค้นหาค่าเฉลี่ยเลขคณิตของอนุกรมการแปรผันต่อเนื่องนั้นซับซ้อนหากช่วงสุดขั้วไม่ปิด (นั่นคือ ดูเหมือนว่า "น้อยกว่า 10" หรือ "มากกว่า 60") ในกรณีนี้จะถือว่าความกว้างของช่วงแรกเท่ากับความกว้างของช่วงที่สอง และความกว้างของช่วงสุดท้ายเท่ากับความกว้างของช่วงสุดท้าย
ค่าเฉลี่ยเลขคณิตที่คำนวณโดยใช้สูตรก็เรียกว่า ถัวเฉลี่ยถ่วงน้ำหนักโดยเน้นย้ำว่าในสูตร x ฉันจะถูกสรุปด้วยค่าสัมประสิทธิ์ (น้ำหนัก) เท่ากับความถี่ที่เกิดขึ้นในช่วงการจัดกลุ่ม
ค่ามัธยฐาน
ค่ามัธยฐาน (เอิ่ม.) เรียกว่าค่าแอตทริบิวต์นี้ เอ็กซ์เมื่อครึ่งหนึ่งของค่าข้อมูลการทดลองน้อยกว่านั้นและครึ่งหลังมากกว่านั้น
หากมีข้อมูลน้อย (ขนาดตัวอย่างมีขนาดเล็ก) ค่ามัธยฐานจะถูกคำนวณอย่างง่ายดาย เมื่อต้องการทำเช่นนี้ ตัวอย่างจะได้รับการจัดอันดับ นั่นคือ ข้อมูลจะถูกจัดเรียงจากน้อยไปหามากหรือจากมากไปน้อย และในกลุ่มตัวอย่างที่มีการจัดอันดับประกอบด้วย nสมาชิกอันดับ ร(เลขลำดับ) ของค่ามัธยฐานให้นิยามว่า
ตัวอย่างที่ 7.8มีตัวอย่างจัดอันดับที่มีสมาชิกเป็นจำนวนคี่ n = 9:
12, 14, 14, 18, 20, 22, 22, 26, 28.
แล้วอันดับมัธยฐาน:
และค่ามัธยฐานเกิดขึ้นพร้อมกับภาคเรียนที่ 5 ของซีรีส์: เอิ่ม. = 20.
หากกลุ่มตัวอย่างมีจำนวนสมาชิกเป็นเลขคู่ ก็ไม่สามารถระบุค่ามัธยฐานได้อย่างชัดเจน
ตัวอย่างที่ 7.9มีตัวอย่างจัดอันดับที่มีสมาชิก 10 คน:
6, 8, 10, 12, 14, 16, 18, 20, 22, 24.
อันดับมัธยฐานกลายเป็น:
ค่ามัธยฐานในกรณีนี้อาจเป็นตัวเลขใดก็ได้ระหว่าง 14 ถึง 16 (เทอมที่ 5 และ 6 ของซีรีส์) เพื่อความชัดเจน เป็นเรื่องปกติที่จะต้องพิจารณาค่าเฉลี่ยเลขคณิตของค่าเหล่านี้เป็นค่ามัธยฐาน เช่น:
หากคุณต้องการหาค่ามัธยฐานของข้อมูลที่จัดกลุ่ม ให้ดำเนินการดังนี้ ขั้นแรก หาช่วงการจัดกลุ่มที่มีค่ามัธยฐานโดยการนับความถี่สะสมหรือความถี่สัมพัทธ์สะสม
ค่ามัธยฐานจะเป็นช่วงที่ความถี่สะสมมีค่ามากกว่าเป็นอันดับแรก หรือความถี่สัมพัทธ์สะสมมากกว่า 0.5 ภายในช่วงค่ามัธยฐาน ค่ามัธยฐานจะถูกกำหนดโดยสูตรต่อไปนี้:
โดยที่ขีด จำกัด ล่างของช่วงค่ามัธยฐานอยู่ที่ไหน
สวัสดีฉัน- ความกว้างของช่วงค่ามัธยฐาน
ความถี่สะสมของช่วงเวลาก่อนค่ามัธยฐาน
- ความถี่ของช่วงค่ามัธยฐาน
ตัวอย่างที่ 7.10- ค้นหาค่ามัธยฐานสำหรับอนุกรมช่วงของตัวอย่าง 6.3
ขนาดตัวอย่างคือ n = 50 + 32 + 26 + 11 + 5 = 124.
ลองหาช่วงค่ามัธยฐาน - ช่วงเวลาที่ความถี่สะสมเป็นครั้งแรกมากกว่าหรือความถี่สัมพัทธ์สะสมมากกว่า 0.5
เนื่องจากความถี่สะสมของช่วงที่สองคือ 50 + 32 = 82 > 62 ดังนั้นช่วง (30; 40) จะเป็นค่ามัธยฐานและ = 30 สวัสดีฉัน = 40 – 30 = 10, = 50, = 32.
ค่ามัธยฐานมักจะแตกต่างจากค่าเฉลี่ยเลขคณิตเล็กน้อย สิ่งนี้จะเกิดขึ้นเสมอเมื่อมีการแจกแจงเชิงประจักษ์ในรูปแบบไม่สมมาตร
แฟชั่น
แฟชั่น ( โม) แสดงถึงค่าแอตทริบิวต์ที่เกิดขึ้นบ่อยที่สุดในตัวอย่าง
ซีรีส์นี้มีชื่อว่า ยูนิโมดัลถ้ามันมีค่ากิริยาเพียงค่าเดียวและ ต่อเนื่องหลายรูปแบบหากมีค่าคุณลักษณะหลายค่าเกิดขึ้นบ่อยเท่าๆ กัน สำหรับอนุกรมแบบต่อเนื่องหลายรูปแบบ โหมดจะไม่ถูกคำนวณ
สำหรับซีรีส์แบบแยก โหมดจะพบตามคำจำกัดความ
เรียกว่าช่วงเวลาการจัดกลุ่มที่มีความถี่สูงสุด เป็นกิริยาช่วย.
เพื่อกำหนดโหมดในชุดช่วงเวลา จะใช้สูตรต่อไปนี้:
โดยที่ขีด จำกัด ล่างของช่วงเวลาโมดอลอยู่ที่ไหน
ชม.- ความกว้างของช่วงการจัดกลุ่ม
และโม- ความถี่ของช่วงเวลากิริยา;
โม-1- ความถี่ของช่วงเวลาก่อนหน้าโมดอลหนึ่ง
เอ็นโม+1- ความถี่ของช่วงเวลาตามโมดอลหนึ่ง