Blog

Khoảng tứ phân vị của mẫu số liệu ghép nhóm: Giải thích chi tiết cho học sinh lớp 12

T
Tác giả
7 phút đọc
Chia sẻ:
8 phút đọc

1. Giới thiệu về khoảng tứ phân vị của mẫu số liệu ghép nhóm và tầm quan trọng

Trong chương trình Toán lớp 12, việc phân tích dữ liệu thống kê là một chủ đề quan trọng, giúp học sinh hiểu được cách xử lý, mô tả và so sánh các tập hợp dữ liệu thực tế. Bên cạnh các số đặc trưng như trung bình, trung vị, phương sai..., thì các số đo phân vị như tứ phân vị đóng vai trò đặc biệt trong việc mô tả mức độ phân tán của dữ liệu, nhất là khi dữ liệu có nhiều giá trị hoặc được chia thành các nhóm (lớp). Khoảng tứ phân vị của mẫu số liệu ghép nhóm là một công cụ hữu ích để đánh giá sự chênh lệch dữ liệu nằm trong nửa giữa tập hợp, hỗ trợ quá trình ra quyết định hoặc phân tích số liệu thực tế.

2. Định nghĩa chính xác về khoảng tứ phân vị của mẫu số liệu ghép nhóm

Tứ phân vị là các số chia dữ liệu thành 4 phần bằng nhau về số lượng. Trong mẫu số liệu ghép nhóm, hai tứ phân vị quan trọng là tứ phân vị thứ nhất(Q1)(Q_1)và tứ phân vị thứ ba(Q3)(Q_3). Khoảng tứ phân vị ký hiệu là IQRIQR(Interquartile Range) được xác định:

Khoảng tứ phân vị IQR=Q3Q1IQR = Q_3 - Q_1

Trong đó:

  • Q1Q_1là giá trị phân chia 25% dữ liệu thấp nhất với 75% còn lại.
  • Q3Q_3là giá trị phân chia 75% dữ liệu thấp nhất với 25% còn lại.
  • Với mẫu số liệu ghép nhóm,Q1Q_1Q3Q_3 được xác định bằng công thức nội suy dựa trên bảng tần số.

    3. Giải thích cách xác định khoảng tứ phân vị với ví dụ minh họa

    Giả sử bảng phân bố tần số của điểm kiểm tra một lớp như sau:


    4 - 55
    5 - 610
    6 - 715
    7 - 88
    8 - 92

    Tổng số học sinh:N=5+10+15+8+2=40N = 5 + 10 + 15 + 8 + 2 = 40

  • Để xác địnhQ1Q_1Q3Q_3, cần xác định vị trí các tứ phân vị trên bảng tần số tích lũy.
  • -Q1Q_1: vị trí thứ N/4=40/4=10N/4 = 40/4 = 10
    -Q3Q_3: vị trí thứ 3N/4=120/4=303N/4 = 120/4 = 30
  • Tính tần số tích lũy:

    Lớp điểmTần sốTần số tích lũy
    4 - 555
    5 - 61015
    6 - 71530
    7 - 8838
    8 - 9240

    Bước 1: Xác địnhQ1Q_1

    Q1Q_1nằm trong lớp565-6, vì tần số tích lũy đến lớp454-5là 5 < 10 và đến lớp565-6là 15 ≥ 10.

    Áp dụng công thức xác định tứ phân vị cho mẫu số liệu ghép nhóm:

    Q1=L+N4FcfhQ_1 = L + \frac{\frac{N}{4} - F_c}{f} \cdot h

  • -LL: Cận dưới của lớp chứaQ1Q_1(ở đây là 5)
  • -FcF_c: Tần số tích lũy trước lớp chứaQ1Q_1(ở đây là 5)
  • -ff: Tần số của lớp chứaQ1Q_1(ở đây là 10)
  • -hh: Độ rộng khoảng lớp (ở đây là 65=16 - 5 = 1)
  • Thay vào công thức:

    Q1=5+10510×1=5+0.5=5.5Q_1 = 5 + \frac{10 - 5}{10} \times 1 = 5 + 0.5 = 5.5

    Bước 2: Xác địnhQ3Q_3

    Q3Q_3nằm trong lớp676-7vì tần số tích lũy đến lớp565-6là 15 < 30 và đến lớp676-7là 30 ≥ 30.

    Q3=L+3N4FcfhQ_3 = L + \frac{\frac{3N}{4} - F_c}{f} \cdot h

  • -LL: Cận dưới của lớp chứaQ3Q_3(ở đây là 6)
  • -FcF_c: Tần số tích lũy trước lớp chứaQ3Q_3(ở đây là 15)
  • -ff: Tần số của lớp chứaQ3Q_3(ở đây là 15)
  • -hh: Độ rộng khoảng lớp (1)
  • Thay vào:

    Q3=6+301515×1=6+1=7Q_3 = 6 + \frac{30 - 15}{15} \times 1 = 6 + 1 = 7

    Bước 3: Tính khoảng tứ phân vị

    IQR=Q3Q1=75.5=1.5IQR = Q_3 - Q_1 = 7 - 5.5 = 1.5

    Vậy khoảng tứ phân vị là 1.51.5(điểm).

    4. Các trường hợp đặc biệt và lưu ý khi áp dụng

  • Nếu số liệu phân nhóm không đều (không cùng độ rộng), cần chú ý chọn đúnghhcho từng lớp.
  • NếuN/4N/4hoặc3N/43N/4rơi đúng vào tần số tích lũy, lấy lớp đó làm lớp chứa tứ phân vị.
  • Hình minh họa: Biểu đồ tần số phân bố điểm kiểm tra của một lớp với các khoảng điểm 0–2, 2–4, 4–6, 6–8, 8–10 và tần số tương ứng 1, 3, 7, 12, 9, kèm theo đa giác tần số minh họa xu hướng phân bố
    Biểu đồ tần số phân bố điểm kiểm tra của một lớp với các khoảng điểm 0–2, 2–4, 4–6, 6–8, 8–10 và tần số tương ứng 1, 3, 7, 12, 9, kèm theo đa giác tần số minh họa xu hướng phân bố
  • Dữ liệu thiếu chính xác hoặc thiếu lớp có thể dẫn đến sai số.
  • 5. Mối liên hệ với các khái niệm toán học khác

    - Khoảng tứ phân vị là một thước đo mức độ phân tán, tương tự như phương sai và độ lệch chuẩn, nhưng không bị ảnh hưởng nhiều bởi các giá trị ngoại lai (outlier).

    - Tứ phân vị liên quan đến trung vị: trung vị là tứ phân vị thứ hai, chia tập hợp thành hai nửa bằng nhau.

    - Khoảng tứ phân vị thường dùng để phát hiện giá trị ngoại lai khi kết hợp với phương pháp Box-plot.

    6. Bài tập mẫu có lời giải chi tiết

    Bài tập: Dữ liệu chiều cao (cm) của học sinh lớp 12A được phân nhóm như bảng sau:

    Lớp chiều caoSố học sinh
    150-1554
    155-16010
    160-16518
    165-17012
    170-1756

    Tổng số học sinhN=4+10+18+12+6=50N = 4 + 10 + 18 + 12 + 6 = 50.

  • -Q1Q_1tại vị trí N/4=12,5N/4 = 12,5trong tần số tích lũy.
  • -Q3Q_3tại vị trí 3N/4=37,53N/4 = 37,5
  • Tìm tần số tích lũy:

    150-15544
    155-1601014
    160-1651832
    165-1701244
    170-175650

    Q1Q_1nằm trong lớp155160155-160:

    L=155L = 155,Fc=4F_c = 4,f=10f = 10,h=5h = 5.
    Q1=155+12.5410×5=155+4.25=159.25Q_1 = 155 + \frac{12.5 - 4}{10} \times 5 = 155 + 4.25 = 159.25

    Q3Q_3nằm trong lớp165170165-170:
    L=165L = 165,Fc=32F_c = 32,f=12f = 12,h=5h = 5.
    Q3=165+37.53212×5=165+2.29=167.29Q_3 = 165 + \frac{37.5 - 32}{12} \times 5 = 165 + 2.29 = 167.29

    Vậy khoảng tứ phân vị:IQR=167.29159.25=8.04IQR = 167.29 - 159.25 = 8.04(cm).

    7. Các lỗi thường gặp và cách tránh

  • Không tính đúng vị trí tứ phân vị từ tần số tích lũy.
  • Sử dụng nhầm công thức hoặc nhập sai các giá trị L,Fc,f,hL, F_c, f, h.
  • Không chú ý đến độ rộng lớp khi các lớp không đều.
  • 8. Tóm tắt và các điểm chính cần nhớ

    - Khoảng tứ phân vị (IQRIQR) cho biết mức độ phân tán của 50% dữ liệu trung tâm.

    - Được tính bằng:IQR=Q3Q1IQR = Q_3 - Q_1vớiQ1Q_1,Q3Q_3xác định dựa trên tần số tích lũy và công thức nội suy.

    - Luôn kiểm tra vị trí tứ phân vị, áp dụng đúng công thức và xác định đúng các thông số lớp.

    T

    Tác giả

    Tác giả bài viết tại Bạn Giỏi.

    Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".