Blog

Bài 2: Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm – Chi tiết dễ hiểu cho học sinh lớp 12

T
Tác giả
6 phút đọc
Chia sẻ:
8 phút đọc

1. Giới thiệu về phương sai và độ lệch chuẩn mẫu số liệu ghép nhóm

Trong chương trình Toán lớp 12, thống kê là một phần quan trọng giúp học sinh hiểu rõ hơn về cách xử lý và phân tích số liệu. Hai khái niệm then chốt trong phần này là phương sai và độ lệch chuẩn – đặc biệt là với mẫu số liệu ghép nhóm (còn gọi là bảng tần số hoặc bảng phân bố tần suất). Đây không chỉ là những đặc trưng toán học giúp đo mức độ phân tán của dữ liệu, mà còn rất thiết thực trong nhiều lĩnh vực thực tế như kinh tế, xã hội, khoa học. Việc hiểu kỹ phương sai và độ lệch chuẩn sẽ giúp bạn giải quyết tốt các bài toán thống kê, đồng thời làm nền tảng cho việc học đại học và ứng dụng ngoài đời sống.

2. Định nghĩa phương sai và độ lệch chuẩn mẫu số liệu ghép nhóm

a) Mẫu số liệu ghép nhóm là gì?

Khi số liệu thực tế quá lớn hoặc quá phức tạp để liệt kê toàn bộ, thường ta chia các số liệu này thành từng nhóm (lớp), mỗi nhóm ghi lại số lượng phần tử (tần số) trong khoảng đó. Bảng thống kê ghép nhóm thường có dạng sau:

— Lớp (Khoảng): (như 10–20, 20–30, ...)
— Dấu lớp: là giá trị trung bình của hai đầu mút mỗi khoảng
— Tần số: số phần tử thuộc vào mỗi lớp.

b) Phương sai mẫu số liệu ghép nhóm

Phương sai(s2)(s^2)của mẫu số liệu ghép nhóm có nnlớp(i=1,2,...,n)(i = 1, 2,..., n)với tần số fif_ivà dấu lớpxix_i được tính theo công thức:

s2=1Ni=1nfi(xix)2s^2 = \frac{1}{N} \sum_{i=1}^{n} f_i (x_i - \overline{x})^2

với N=i=1nfiN = \sum_{i=1}^n f_ilà tổng các tần số (tổng số phần tử),xix_ilà dấu lớp của lớp thứ ii, fif_ilà tần số,x\overline{x} là số trung bình cộng ghép nhóm:

x=1Ni=1nfixi\overline{x} = \frac{1}{N} \sum_{i=1}^{n} f_i x_i

c) Độ lệch chuẩn mẫu số liệu ghép nhóm

Độ lệch chuẩnsslà căn bậc hai của phương sai:

s=s2s = \sqrt{s^2}

3. Các bước tính phương sai và độ lệch chuẩn mẫu số liệu ghép nhóm qua ví dụ

Giả sử bảng phân bố tần số sau thể hiện số điểm kiểm tra Toán của một lớp học:

Lớp điểm (Khoảng) | Tần số (f)
-----------------------------|------------
[2–4] | 2
[4–6] | 4
[6–8] | 6
[8–10] | 3

Bước 1: Tính dấu lớp (xix_i):
[2–4]:x1=(2+4)/2=3x_1 = (2 + 4)/2 = 3
[4–6]:x2=5x_2 = 5
[6–8]:x3=7x_3 = 7
[8–10]:x4=9x_4 = 9

Bước 2: Tính số trung bình cộng ghép nhóm (x\overline{x}):
Tổng số phần tử N=2+4+6+3=15N = 2 + 4 + 6 + 3 = 15
x=115(2×3+4×5+6×7+3×9)\overline{x} = \frac{1}{15} (2 \times 3 + 4 \times 5 + 6 \times 7 + 3 \times 9)
=115(6+20+42+27)=95156,33= \frac{1}{15} (6 + 20 + 42 + 27) = \frac{95}{15} \approx 6,33

Bước 3: Lập bảng tính(xix)2(x_i - \overline{x})^2fi(xix)2f_i(x_i - \overline{x})^2:

Lớp điểmxix_if_ixixx_i - \overline{x}(x_i - \overline{x})^2fi(xix)2f_i(x_i - \overline{x})^2
[2–4]32-3,3311,0922,18
[4–6]54-1,331,787,12
[6–8]760,670,452,7
[8–10]932,677,1421,42
Tổng \times 53,42

Bước 4: Tính phương sai và độ lệch chuẩn:
s2=53,42153,56<br/>s^2 = \frac{53,42}{15} \approx 3,56 <br />s = \sqrt{3,56} \approx 1,89$

Hình minh họa: Biểu đồ cột nhóm thể hiện các giá trị bình phương độ lệch (x_i - x̄)² và bình phương độ lệch có trọng số f_i(x_i - x̄)² cho từng lớp điểm [2–4], [4–6], [6–8], [8–10], với tổng f_i(x_i - x̄)² = 53,42.
Biểu đồ cột nhóm thể hiện các giá trị bình phương độ lệch (x_i - x̄)² và bình phương độ lệch có trọng số f_i(x_i - x̄)² cho từng lớp điểm [2–4], [4–6], [6–8], [8–10], với tổng f_i(x_i - x̄)² = 53,42.

4. Những lưu ý khi áp dụng và các trường hợp đặc biệt

- Nếu các nhóm có độ rộng không đều, phải chú ý chọn đúng dấu lớp.
- Nếu tổng tần số nhỏ (dưới 5), nên kiểm tra lại cách ghép nhóm.
- Với dữ liệu cực đoan (outlier), phương sai có thể bị ảnh hưởng mạnh.

5. Mối liên hệ với các khái niệm toán học khác

Phương sai và độ lệch chuẩn không tách rời khỏi các khái niệm: số trung bình cộng (x\overline{x}), số trung vị (median), tứ phân vị (quartiles). Độ lệch chuẩn càng lớn, dữ liệu càng phân tán; độ lệch chuẩn nhỏ tức dữ liệu tập trung quanh giá trị trung bình. Trong xác suất, các khái niệm này liên hệ đến biến ngẫu nhiên rời rạc và liên tục.

6. Bài tập mẫu có lời giải chi tiết

Bài tập: Một trường hợp khác
Kết quả kiểm tra Anh văn được ghép nhóm như sau:
Lớp điểm | Tần số
[40–50] | 2
[50–60] | 3
[60–70] | 6
[70–80] | 9
[80–90] | 5
Hãy tính số trung bình cộng, phương sai và độ lệch chuẩn.

Lời giải:
Tìm dấu lớp: 45; 55; 65; 75; 85
Tổng số phần tử N=2+3+6+9+5=25N = 2+3+6+9+5 = 25
Tínhx\overline{x}:
x=2×45+3×55+6×65+9×75+5×8525=90+165+390+675+42525=174525=69,8\overline{x} = \frac{2 \times 45 + 3 \times 55 + 6 \times 65 + 9 \times 75 + 5 \times 85}{25} = \frac{90+165+390+675+425}{25} = \frac{1745}{25} = 69,8

Tiếp tục lập bảng tính:
Lớpxix_if_ixixx_i - \overline{x}(x_i - \overline{x})^2fi(xix)2f_i(x_i - \overline{x})^2
[40–50]452-24,8615,041230,08
[50–60]553-14,8219,04657,12
[60–70]656-4,823,04138,24
[70–80]7595,227,04243,36
[80–90]85515,2231,041155,2
Cộng:1230,08+657,12+138,24+243,36+1155,2=34241230,08 + 657,12 + 138,24 + 243,36 + 1155,2 = 3424

s2=342425=136,96<br/>s^2 = \frac{3424}{25} = 136,96 <br />s = \sqrt{136,96} \approx 11,7$

Vậy số trung bình cộng:69,869,8, phương sai:136,96136,96, độ lệch chuẩn:11,711,7

7. Các lỗi thường gặp và cách tránh

- Nhầm lẫn dấu lớp với các giá trị đầu hoặc cuối lớp.
- Tổng tần số tính sai dẫn tới sai toàn bộ đáp án.
- Quên bình phương sai số (xix)(x_i - \overline{x})
- Lấy căn ở bước cuối để ra độ lệch chuẩn.

8. Tóm tắt và các điểm chính cần nhớ

- Phương sai và độ lệch chuẩn phản ánh mức độ phân tán của số liệu mẫu ghép nhóm.
- Dấu lớp là giá trị chính giữa mỗi khoảng.
- Tính đúng số trung bình cộng rồi mới tính phương sai.
- Độ lệch chuẩn là căn bậc hai của phương sai.
- Cần chú ý các bước, cẩn thận với số liệu và cách tính.
Hãy luyện tập nhiều, kiểm tra lại thao tác và hiểu ý nghĩa – khi đó phương sai và độ lệch chuẩn sẽ không còn là nỗi lo với bạn!

T

Tác giả

Tác giả bài viết tại Bạn Giỏi.

Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".