Blog

Độ lệch chuẩn của mẫu số liệu ghép nhóm – Giải thích chi tiết cho học sinh lớp 12

T
Tác giả
7 phút đọc
Chia sẻ:
7 phút đọc

1. Giới thiệu về khái niệm và tầm quan trọng

Trong thống kê, đặc biệt là khi xử lý các bộ dữ liệu lớn và phức tạp, chúng ta thường gặp các bảng số liệu ghép nhóm. Việc sử dụng “độ lệch chuẩn của mẫu số liệu ghép nhóm” giúp chúng ta hiểu rõ mức độ phân tán của dữ liệu quanh giá trị trung bình. Đây là một trong những kiến thức trọng tâm của chương trình Toán 12, nằm trong chương III: Các số đặc trưng đo mức độ phân tán cho mẫu số liệu ghép nhóm.

Hiểu và vận dụng đúng độ lệch chuẩn sẽ giúp học sinh đánh giá, phân tích và so sánh các tập hợp dữ liệu một cách khoa học. Đây cũng là kiến thức nền tảng, ứng dụng nhiều trong giải quyết thực tế, các kỳ thi tốt nghiệp, học sinh giỏi cũng như phục vụ các ngành khoa học xã hội, kinh tế, kĩ thuật…

2. Định nghĩa độ lệch chuẩn của mẫu số liệu ghép nhóm

Độ lệch chuẩn (ký hiệu là ss) là một số đặc trưng đo mức độ phân tán dữ liệu quanh giá trị trung bình mẫu. Khi số liệu đã được phân thành các khoảng (lớp), mỗi khoảng có tần số tương ứng, ta phải sử dụng công thức riêng dành cho số liệu ghép nhóm.

Công thức tính độ lệch chuẩn mẫu đối với số liệu ghép nhóm:

s=1n1i=1kfi(xix)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^{k} f_i (x_i - \overline{x})^2}

  • Với:
  • -kk: số lượng các nhóm (khoảng/lớp)
  • -fif_i: tần số của lớp thứ ii
  • -xix_i: giá trị đại diện (thường là trung điểm) của lớp thứ ii
  • -x\overline{x}: giá trị trung bình mẫu của số liệu ghép nhóm
  • -nn: tổng số mẫu (tổng cácfif_i)
  • 3. Hướng dẫn chi tiết từng bước với ví dụ minh họa

    Giả sử ta có bảng số liệu về chiều cao (đơn vị: cm) của 40 học sinh được phân thành các lớp ghép nhóm như sau:

    Lớp | Tần số (f_i) ---|---
    150–155 | 5 155–160 | 8 160–165 | 15 165–170 | 9 170–175 | 3

    Bước 1: Xác định giá trị đại diệnxix_i

    Giá trị đại diện là trung điểm mỗi khoảng:
    - 150–155:x1=150+1552=152.5x_1 = \frac{150 + 155}{2} = 152.5- 155–160:x2=155+1602=157.5x_2 = \frac{155 + 160}{2} = 157.5- 160–165:x3=160+1652=162.5x_3 = \frac{160 + 165}{2} = 162.5- 165–170:x4=165+1702=167.5x_4 = \frac{165 + 170}{2} = 167.5- 170–175:x5=170+1752=172.5x_5 = \frac{170 + 175}{2} = 172.5

    Bước 2: Tính giá trị trung bình mẫux\overline{x}

    Áp dụng công thức:
    x=1ni=1kfixi\overline{x} = \frac{1}{n} \sum_{i=1}^{k} f_i x_i

  • Tổngfixif_i x_i:
    =5×152.5+8×157.5+15×162.5+9×167.5+3×172.5= 5 \times 152.5 + 8 \times 157.5 + 15 \times 162.5 + 9 \times 167.5 + 3 \times 172.5
    =762.5+1260+2437.5+1507.5+517.5= 762.5 + 1260 + 2437.5 + 1507.5 + 517.5
    =6485= 6485
  • Tổng số mẫun=5+8+15+9+3=40n = 5 + 8 + 15 + 9 + 3 = 40
  • x=648540=162.125\overline{x} = \frac{6485}{40} = 162.125
  • Bước 3: Tínhfi(xix)2f_i (x_i - \overline{x})^2cho từng lớp

    • - Lớp 1:5×(152.5162.125)2=5×(9.625)2=5×92.640625=463.2031255 \times (152.5 - 162.125)^2 = 5 \times (-9.625)^2 = 5 \times 92.640625 = 463.203125
      - Lớp 2:8×(157.5162.125)2=8×(4.625)2=8×21.390625=171.1258 \times (157.5 - 162.125)^2 = 8 \times (-4.625)^2 = 8 \times 21.390625 = 171.125
      - Lớp 3:15×(162.5162.125)2=15×(0.375)2=15×0.140625=2.10937515 \times (162.5 - 162.125)^2 = 15 \times (0.375)^2 = 15 \times 0.140625 = 2.109375
      - Lớp 4:9×(167.5162.125)2=9×(5.375)2=9×28.890625=260.0156259 \times (167.5 - 162.125)^2 = 9 \times (5.375)^2 = 9 \times 28.890625 = 260.015625
      - Lớp 5:3×(172.5162.125)2=3×(10.375)2=3×107.640625=322.9218753 \times (172.5 - 162.125)^2 = 3 \times (10.375)^2 = 3 \times 107.640625 = 322.921875

    Cộng tổng các giá trị trên:=463.203125+171.125+2.109375+260.015625+322.921875=1219.375= 463.203125 + 171.125 + 2.109375 + 260.015625 + 322.921875 = 1219.375

    Bước 4: Tính độ lệch chuẩn mẫuss

    Áp dụng công thức:
    s=1219.375401=1219.3753931.27055.595s = \sqrt{\frac{1219.375}{40-1}} = \sqrt{\frac{1219.375}{39}} \approx \sqrt{31.2705} \approx 5.595
    Vậy, độ lệch chuẩn của mẫu số liệu ghép nhóm là khoảng 5.605.60 (làm tròn đến 2 chữ số thập phân).

    4. Các trường hợp đặc biệt và lưu ý khi áp dụng

  • - Nếu số mẫu quá nhỏ thì việc ghép nhóm có thể làm sai lệch tính đại diện của dữ liệu.
  • - Không nên dùng công thức này cho dữ liệu lẻ, không phân lớp.
  • - Lưu ý lấy trung điểm chính xác cho mỗi nhóm.
  • - Đảm bảo tính tổng tần số (nn) đúng với tổng số mẫu thực tế.
  • 5. Mối liên hệ với các khái niệm toán học khác

    - Độ lệch chuẩn thường đi kèm với phương sai (s2s^2) với công thức tương tự nhưng không lấy căn bậc hai.
    - Độ lệch chuẩn là thước đo hữu ích khi so sánh mức độ phân tán giữa các bộ số liệu khác nhau.
    - Độ lệch chuẩn liên hệ mật thiết với số trung bình (x\overline{x}), các số đo vị trí (trung vị, mode).
    - Trong xác suất thống kê, độ lệch chuẩn là công cụ để kiểm chứng mức độ tin cậy hoặc sự biến thiên ngẫu nhiên của hiện tượng.

    6. Bài tập mẫu có lời giải chi tiết

    • Bài 1: Cho bảng số liệu dưới đây về số sách mượn của các bạn trong lớp trong 1 tháng:

    Số sách mượn | Số bạn
    1–2 | 4
    3–4 | 7
    5–6 | 9
    7–8 | 5
    9–10 | 1

    • Tính độ lệch chuẩn của mẫu số liệu ghép nhóm.

    • Trung điểm: 1.5; 3.5; 5.5; 7.5; 9.5
    • Tổng mẫu n = 4+7+9+5+1 = 26
    • Trung bình mẫu:
    x=4×1.5+7×3.5+9×5.5+5×7.5+1×9.526=6+24.5+49.5+37.5+9.526=127264.88\overline{x} = \frac{4 \times 1.5 + 7 \times 3.5 + 9 \times 5.5 + 5 \times 7.5 + 1 \times 9.5}{26} = \frac{6+24.5+49.5+37.5+9.5}{26} = \frac{127}{26} \approx 4.88fi(xix)2f_i(x_i-\overline{x})^2:
    - (1.54.88)2=11.4044×11.404=45.616(1.5 - 4.88)^2 = 11.404 \rightarrow 4 \times 11.404 = 45.616-(3.54.88)2=1.9047×1.904=13.328(3.5 - 4.88)^2 = 1.904 \rightarrow 7 \times 1.904 = 13.328-(5.54.88)2=0.3849×0.384=3.456(5.5 - 4.88)^2 = 0.384 \rightarrow 9 \times 0.384 = 3.456-(7.54.88)2=6.8645×6.864=34.32(7.5 - 4.88)^2 = 6.864 \rightarrow 5 \times 6.864 = 34.32-(9.54.88)2=21.3821×21.382=21.382(9.5 - 4.88)^2 = 21.382 \rightarrow 1 \times 21.382 = 21.382- Tổng:45.616+13.328+3.456+34.32+21.382=118.10245.616 + 13.328 + 3.456 + 34.32 + 21.382 = 118.102• Độ lệch chuẩn:s=118.102254.7242.17s = \sqrt{\frac{118.102}{25}} \approx \sqrt{4.724} \approx 2.17

    7. Các lỗi thường gặp và cách tránh

  • - Quên lấy trung điểm của mỗi khoảng thay vì lấy ngay giá trị biên.
  • - Nhầm lẫn giữa công thức độ lệch chuẩn mẫu và tổng thể.
  • - Không kiểm tra tổng tần số hoặc cộng nhầm các tíchfixif_i x_i.
  • - Quên lấy căn bậc hai ở bước cuối cùng.
  • - Làm tròn số quá sớm khiến kết quả thiếu chính xác.
  • 8. Tóm tắt và các điểm chính cần nhớ

    - Độ lệch chuẩn số liệu ghép nhóm là chỉ số đo mức độ phân tán, cần thiết cho mọi bài toán thống kê lớp 12.

    - Luôn tính đúng trung điểm, tổng tần số và áp dụng công thức đầy đủ các bước.
    - Đọc kỹ đề về cách phân lớp, kiểm tra số liệu trước khi thao tác.
    - Sử dụng máy tính cẩn thận để tránh sai sót trong khâu tính toán.

    - Độ lệch chuẩn gắn liền với phương sai, trung bình cộng và các đặc trưng thống kê khác.
    - Thành thạo kỹ năng này giúp học sinh vượt qua các đề kiểm tra, kỳ thi cũng như ứng dụng vào thực tế.

    T

    Tác giả

    Tác giả bài viết tại Bạn Giỏi.

    Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".