Blog

Bài 2: Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm

T
Tác giả
7 phút đọc
Chia sẻ:
7 phút đọc

Giới thiệu về khái niệm và tầm quan trọng của phương sai và độ lệch chuẩn

Trong chương trình Toán lớp 12, việc phân tích dữ liệu thống kê đóng vai trò quan trọng để đánh giá độ phân tán của một tập hợp số liệu. Phương sai và độ lệch chuẩn là hai chỉ số cơ bản giúp chúng ta hiểu rõ mức độ phân tán quanh giá trị trung bình. Đặc biệt, khi dữ liệu được “ghép nhóm” (phân thành các lớp khoảng), ta cần công thức tính gần đúng để ước lượng phương sai và độ lệch chuẩn của mẫu. Hiểu đúng và vận dụng chính xác các khái niệm này giúp học sinh giải quyết các bài toán thống kê, nhận biết tính ổn định hay biến động của dữ liệu trong thực tế.

Định nghĩa phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm

Giả sử ta có mẫu số liệu ghép nhóm gồm kklớp, mỗi lớp thứ iicó tần số fif_i(số quan sát thuộc lớp), và điểm giữa của lớp đó là mim_i. Tổng số quan sát trong mẫu là n=sumi=1kfilap.Khiđoˊ:<br/>1.Trungbıˋnhma^~u(cnđuˊng):n = sum_{i=1}^k f_ilap{.} Khi đó:<br />1. Trung bình mẫu (cận đúng):\bar x = \frac{\sum_{i=1}^k f_i m_i}{n}\,. <br/>2.Phươngsaima^~u(ướclượngkho^ngchch):s2=i=1kfi(mixˉ)2n1.<br />2. Phương sai mẫu (ước lượng không chệch): s^2 = \frac{\sum_{i=1}^k f_i\bigl(m_i - \bar x\bigr)^2}{n-1}\,.
3. Độ lệch chuẩn mẫu: s=s2=i=1kfi(mixˉ)2n1.s = \sqrt{s^2} = \sqrt{\frac{\sum_{i=1}^k f_i(m_i - \bar x)^2}{n-1}}\,.

Giải thích từng bước với ví dụ minh họa

Để tính phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm, ta thực hiện theo các bước sau:

Bước 1: Xác định điểm giữamim_icủa mỗi lớp.

Bước 2: Tính tổng tần số n=fin = \sum f_ivà trung bình mẫuxˉ=fimi/n\bar x = \sum f_i m_i\,/\,n.

Bước 3: Tính tổng bình phương khoảng cách đến trung bình fi(mixˉ)2.\sum f_i (m_i - \bar x)^2\,.

Bước 4: Áp dụng công thức phương sai s2=fi(mixˉ)2n1vaˋđộlchchuns^2 = \frac{\sum f_i (m_i - \bar x)^2}{n-1} và độ lệch chuẩns = \sqrt{s^2}\,. fif_i| 5 | 12 | 8 | 5

1. Tính điểm giữa mỗi lớp:m1=5,m2=15,m3=25,m4=35m_1=5,\,m_2=15,\,m_3=25,\,m_4=35.

2. Tổng số quan sát:n=5+12+8+5=30n=5+12+8+5=30.

3. Trung bình mẫu:xˉ=55+1215+825+53530=25+180+200+17530=5803019.33.\bar x = \frac{5 \cdot 5 + 12 \cdot 15 + 8 \cdot 25 +5 \cdot 35}{30} = \frac{25 +180 +200 +175}{30} = \frac{580}{30} \approx 19.33\,.

4. Tổng bình phương sai:
fi(mixˉ)2=5(519.33)2+12(1519.33)2+8(2519.33)2+5(3519.33)2<br/>\sum f_i (m_i - \bar x)^2 = 5(5-19.33)^2 +12(15-19.33)^2 +8(25-19.33)^2 +5(35-19.33)^2 <br />=5 \cdot 204.44 +12 \cdot 18.78 +8 \cdot 32.11 +5 \cdot 246.78 \approx 1022.2 +225.4 +256.9 +1233.9 =2738.4\,." data-math-type="inline"> undefined

Ví dụ cụ thể

Cho bảng tần số mẫu số liệu ghép nhóm sau:
Lớp | [0;10) | [10;20) | [20;30) | [30;40)
Tần số fif_i| 5 | 12 | 8 | 5

1. Tính điểm giữa mỗi lớp:m1=5,m2=15,m3=25,m4=35m_1=5,\,m_2=15,\,m_3=25,\,m_4=35.

2. Tổng số quan sát:n=5+12+8+5=30n=5+12+8+5=30.

3. Trung bình mẫu:xˉ=55+1215+825+53530=25+180+200+17530=5803019.33.\bar x = \frac{5 \cdot 5 + 12 \cdot 15 + 8 \cdot 25 +5 \cdot 35}{30} = \frac{25 +180 +200 +175}{30} = \frac{580}{30} \approx 19.33\,.

4. Tổng bình phương sai:
fi(mixˉ)2=5(519.33)2+12(1519.33)2+8(2519.33)2+5(3519.33)2<br/>\sum f_i (m_i - \bar x)^2 = 5(5-19.33)^2 +12(15-19.33)^2 +8(25-19.33)^2 +5(35-19.33)^2 <br />=5 \cdot 204.44 +12 \cdot 18.78 +8 \cdot 32.11 +5 \cdot 246.78 \approx 1022.2 +225.4 +256.9 +1233.9 =2738.4\,.$

5. Phương sai mẫu:s2=2738.4301=2738.42994.43.s^2 = \frac{2738.4}{30-1} = \frac{2738.4}{29} \approx 94.43\,.

6. Độ lệch chuẩn mẫu:s=94.439.72.s = \sqrt{94.43} \approx 9.72\,.

Các trường hợp đặc biệt và lưu ý khi áp dụng

– Nếu có lớp mở đầu hoặc mở cuối (ví dụ [40; ), ta chọn giá trị điểm giữa ước lượng hợp lý.
– Khi mẫu nhỏ (n dưới 30), sai số xấp xỉ có thể lớn hơn, cần chú ý độ tin cậy.
– Luôn phân biệt công thức mẫu (chia chon1n-1) và công thức tổng thể (chia chonn).

Mối liên hệ với các khái niệm toán học khác

Phương sai và độ lệch chuẩn liên quan chặt chẽ đến: trung bình mẫu, các moment của phân phối, hệ số biến thiên, và là cơ sở để tính khoảng tin cậy, kiểm định giả thuyết, cũng như xác suất trong phân phối chuẩn.

Bài tập mẫu có lời giải chi tiết

Bài tập 1: Cho mẫu số liệu ghép nhóm:
Lớp | [0;5) | [5;10) | [10;15) | [15;20)
Tần số fif_i| 4 | 6 | 10 | 5

a) Tínhxˉ\bar x,s2s^2ss.

Lời giải: Điểm giữa: 2.5, 7.5, 12.5, 17.5;n=25n=25;xˉ=(42.5+67.5+1012.5+517.5)/25=(10+45+125+87.5)/25=267.5/25=10.7\bar x=(4 \cdot 2.5+6 \cdot 7.5+10 \cdot 12.5+5 \cdot 17.5)/25= (10+45+125+87.5)/25=267.5/25=10.7;
Tổng bình phương sai:4(2.510.7)2+6(7.510.7)2+10(12.510.7)2+5(17.510.7)2467.24+610.24+103.24+546.24=268.96+61.44+32.4+231.2=593.••4(2.5-10.7)^2+6(7.5-10.7)^2+10(12.5-10.7)^2+5(17.5-10.7)^2 \approx 4 \cdot 67.24+6 \cdot 10.24+10 \cdot 3.24+5 \cdot 46.24=268.96+61.44+32.4+231.2=593.••
s2=593.••/2424.72s^2=593.••/24 \approx 24.72,s4.97s \approx 4.97.

Các lỗi thường gặp và cách tránh

– Nhầm lẫn lớp và điểm giữa;– Quên chia chon1n-1khi tính phương sai mẫu; – Tính nhầm tổng bình phương sai; – Không phân biệt mẫu và tổng thể.

Tóm tắt và các điểm chính cần nhớ

1. Phương sai mẫu ghép nhóm: s2=fi(mixˉ)2/(n1)s^2=\sum f_i(m_i-\bar x)^2/(n-1);2. Độ lệch chuẩn: s=s2s=\sqrt{s^2}; 3. Luôn xác định chính xác điểm giữa và tần số;4. Phân biệt công thức mẫu (ch chian1n-1) với công thức tổng thể (ch chiann).

T

Tác giả

Tác giả bài viết tại Bạn Giỏi.

Bài trước

Tính xác suất bằng công thức Bayes – Hướng dẫn chi tiết cho học sinh lớp 12

Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".