Blog

Bài 1: Khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm – Giải thích chi tiết

T
Tác giả
6 phút đọc
Chia sẻ:
6 phút đọc

1. Giới thiệu về khoảng biến thiên và khoảng tứ phân vị trong số liệu ghép nhóm

Trong chương trình Toán lớp 12, "Khoảng biến thiên" và "khoảng tứ phân vị" của mẫu số liệu ghép nhóm là hai đại lượng quan trọng để đo mức độ phân tán của dữ liệu thống kê. Những khái niệm này giúp học sinh hiểu, phân tích và trình bày dữ liệu một cách khoa học, đồng thời được ứng dụng thực tiễn trong nhiều lĩnh vực như kinh tế, xã hội, nghiên cứu khoa học,... Hiểu được các đại lượng này là nền tảng vững chắc để tiếp cận các bài toán thống kê, xác suất ở các lớp cao hơn cũng như trong các kỳ thi.

2. Định nghĩa chính xác

- Khoảng biến thiên (range): Là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của một mẫu số liệu.

- Khoảng tứ phân vị (interquartile range – IQR): Là hiệu số giữa tứ phân vị trên (Q3Q_3) và tứ phân vị dưới (Q1Q_1) của dãy số liệu. Tứ phân vị là các giá trị chia dãy số liệu thành 4 phần bằng nhau.

3. Giải thích từng bước với ví dụ minh họa

Giả sử bảng phân bố tần số ghép nhóm của điểm thi (số liệu đã được chia lớp):

  • + Lớp 1: 4 - 6, tần số 4
  • + Lớp 2: 6 - 8, tần số 6
  • + Lớp 3: 8 - 10, tần số 8
  • + Lớp 4: 10 - 12, tần số 2
  • - Tổng số quan sát:n=4+6+8+2=20n = 4 + 6 + 8 + 2 = 20

    a) Tính khoảng biến thiên

    Khoảng biến thiên là:

    R = x_{max} - x_{min}

    Với bảng ghép nhóm,xminx_{min}là giới hạn dưới của lớp nhỏ nhất,xmaxx_{max}là giới hạn trên của lớp lớn nhất:

    R = 12 - 4 = 8

    Kết luận: Khoảng biến thiên của bảng số liệu là 88 điểm.

    b) Tính khoảng tứ phân vị

  • - Bước 1: Xác định các tứ phân vị Q1Q_1Q3Q_3.
  • - Bước 2: Tìm vị trí củaQ1Q_1Q3Q_3dựa trên tổng số quan sátnn:
  • + Vị trí Q1Q_1là quan sát thứ k1=n4=5k_1 = \frac{n}{4} = 5.

    + Vị trí Q3Q_3là quan sát thứ k3=3n4=15k_3 = \frac{3n}{4} = 15.

    • - Bước 3: Xác định lớp chứaQ1Q_1(quan sát thứ 5):

    + Lớp 1: Tích lũy tần số là 4 (chưa tới 5), lớp thứ 2 bắt đầu từ vị trí 5, vậyQ1Q_1nằm trong lớp 2 (6 – 8).

    • - Bước 4: Xác định lớp chứaQ3Q_3(quan sát thứ 15):

    + Lớp 1+2+3: Tích lũy tần số là 4+6+8=18 > 15, nênQ3Q_3nằm trong lớp 3 (8 – 10).

    Áp dụng công thức tính tứ phân vị cho dữ liệu ghép nhóm:

    Q_1 = L_1 + \left[\frac{\frac{n}{4} - F_0}{f_1}\right] \times h

    Trong đó:

  • L1L_1: Giới hạn dưới của lớp chứaQ1Q_1(ở đây là 6).
  • F0F_0: Tần số tích lũy trước lớp chứaQ1Q_1(ở đây là 4).
  • f1f_1: Tần số của lớp chứaQ1Q_1(ở đây là 6).
  • hh: Độ rộng lớp (ở đây là 86=28-6=2).
  • Vậy:

    Q_1 = 6 + \left[\frac{5-4}{6}\right] \times 2 = 6 + \frac{1}{6} \times 2 = 6 + \frac{2}{6} = 6.33

    Tương tự vớiQ3Q_3:

    • -L3L_3= 8 (giới hạn dưới lớp 3),F0F_0= 10 (tích lũy các lớp trước),f3f_3= 8,hh= 2.
    Q_3 = 8 + \left[\frac{15-10}{8}\right] \times 2 = 8 + \frac{5}{8} \times 2 = 8 + 1.25 = 9.25

    Do đó, khoảng tứ phân vị:

    IQR = Q_3 - Q_1 = 9.25 - 6.33 = 2.92

    Kết luận: Khoảng tứ phân vị là 2.922.92 điểm.

    4. Các trường hợp đặc biệt và lưu ý

  • + Nếu số lượng mẫu nhỏ, việc ghép nhóm quá nhiều sẽ thiếu chính xác. Chỉ nên áp dụng cho mẫu lớn.
  • + Khi các lớp không đều rộng, cần để ý chọn h đúng cho từng lớp.
  • + Tứ phân vị chỉ có ý nghĩa rõ khi dữ liệu đã được sắp xếp theo thứ tự.
  • 5. Mối liên hệ với các khái niệm toán học khác

  • + Khoảng biến thiên và khoảng tứ phân vị là các đại lượng mô tả độ phân tán, song song với các đại lượng trung tâm như trung bình cộng, trung vị, mốt.
  • + Khoảng tứ phân vị ít bị ảnh hưởng bởi các giá trị ngoại lai (outlier) nên được dùng để đánh giá độ phân tán một cách khách quan hơn so với khoảng biến thiên.
  • 6. Bài tập mẫu và lời giải chi tiết

    Bài tập:

    Bảng phân bố chiều cao (cm) của 30 học sinh được cho như sau:

  • Lớp 1: 150 – 155, tần số 6
  • Lớp 2: 155 – 160, tần số 10
  • Lớp 3: 160 – 165, tần số 8
  • Lớp 4: 165 – 170, tần số 6
  • Tìm khoảng biến thiên và khoảng tứ phân vị của mẫu.

    Tổng số học sinhn=30n = 30.

    - Khoảng biến thiên:R=170150=20R = 170 - 150 = 20(cm)

    - Vị trí Q1=n4=7.5Q_1 = \frac{n}{4} = 7.5(tức quan sát thứ 8)

    + Tần số tích lũy lớp 1: 6, lớp 2: 16, vậyQ1Q_1nằm trong lớp 2 (155-160).
    +L1=155L_1 = 155,F0=6F_0 = 6,f1=10f_1 = 10,h=5h = 5.

    Q1=155+[8610]×5=155+1=156Q_1 = 155 + \left[\frac{8-6}{10}\right] \times 5 = 155 + 1 = 156

    - Vị trí Q3=3n4=22.5Q_3 = \frac{3n}{4} = 22.5(quan sát thứ 23)

    + Tần số tích lũy lớp 1+2+3: 24, vậyQ3Q_3nằm trong lớp 3 (160-165).
    +L3=160L_3 = 160,F0=16F_0 = 16,f3=8f_3 = 8,h=5h = 5.

    Q3=160+[23168]×5=160+4.375=164.375Q_3 = 160 + \left[\frac{23-16}{8}\right] \times 5 = 160 + 4.375 = 164.375

    - Khoảng tứ phân vị:IQR=164.375156=8.375IQR = 164.375 - 156 = 8.375(cm)

    7. Các lỗi thường gặp và cách tránh

  • + Không xác định đúng lớp chứa tứ phân vị (do tính nhầm tần số tích lũy). Giải pháp: Kẻ bảng tích lũy rõ ràng.
  • + Nhập sai độ rộng lớp (hh) khi các lớp không đều.
  • + Đổi nhầm đơn vị (nếu có). Luôn kiểm tra lại đơn vị kết quả.
  • + Quên sử dụng trị tích lũy đúng choF0F_0.
  • 8. Tóm tắt và điểm cần nhớ

  • + Khoảng biến thiên và khoảng tứ phân vị là những số đo quan trọng đánh giá độ phân tán dữ liệu.
  • + Để tính cần chú ý xác định đúng các giá trị đặc trưng, lớp chứa tứ phân vị.
  • + Khoảng tứ phân vị phản ánh phần lớn dữ liệu, ít bị ảnh hưởng bởi giá trị cực trị hơn khoảng biến thiên.
  • + Khi áp dụng cần chú ý đến độ rộng lớp, tổng số quan sát và soát kỹ đơn vị.
  • T

    Tác giả

    Tác giả bài viết tại Bạn Giỏi.

    Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".