Hướng dẫn cách giải bài toán khoảng tử phân vị
Hướng dẫn cách giải bài toán khoảng tử phân vị cho học sinh lớp 12 – Chiến lược và ví dụ minh họa (Interquartile Range)
Trong thống kê, khoảng tử phân vị (interquartile range – IQR) là một chỉ số quan trọng đo lường sự phân tán của dữ liệu. Bài viết này sẽ trình bày chi tiết chiến lược tổng thể, các bước giải cùng ví dụ, công thức cần nhớ, biến thể thường gặp, và bài tập mẫu để bạn nắm vững cách giải bài toán khoảng tử phân vị.
1. Giới thiệu về loại bài toán này và tại sao nó quan trọng
Khoảng tử phân vị (IQR) đo khoảng cách giữa phần tử tử phân vị thứ ba (Q₃) và phần tử tử phân vị thứ nhất (Q₁) trong tập dữ liệu. Nó loại bỏ ảnh hưởng của ngoại lệ (outliers) và cho biết độ tập trung ở phần giữa của phân phối.
Tại sao IQR quan trọng?
- Giúp đánh giá độ phân tán không bị lệch bởi giá trị ngoại lai.
- Thường dùng trong biểu đồ hộp (box plot) để minh họa sự phân bố.
- Là cơ sở để phát hiện ngoại lai và so sánh phân phối giữa các nhóm.
2. Phân tích đặc điểm của bài toán khoảng tử phân vị
Các đặc điểm chính:
- Dữ liệu có thể là dãy rời rạc hoặc tần suất (bảng tần số).
- Cần sắp xếp dữ liệu theo thứ tự tăng dần.
- Xác định vị trí Q₁, Q₂ (median), Q₃.
- Công thức tính khác nhau với dữ liệu nhóm (cần nội suy).
3. Chiến lược tổng thể để tiếp cận bài toán
Bước 1: Xác định loại dữ liệu (rời rạc/trọn bộ, hay nhóm/class intervals).
Bước 2: Sắp xếp hoặc tính bảng phân phối tích lũy (cộng dồn).
Bước 3: Tính vị trí Q₁ và Q₃:
• Dữ liệu rời rạc: vị trí ,.
• Dữ liệu nhóm: nội suy trong lớp chứa tử phân vị.
Bước 4: Tìm giá trị Q₁, Q₃ theo vị trí hoặc qua nội suy.
Bước 5: Tính IQR:
4. Các bước giải quyết chi tiết với ví dụ minh họa
Ví dụ 1: Tập dữ liệu rời rạc (n = 9) gồm độ cao (cm) của 9 học sinh:
Bước 1: Sắp xếp (đã cho sẵn).
Bước 2: Tính vị trí Q₁, Q₃:
Bước 3: Vì không nguyên, cần nội suy giữa phần tử thứ 2 và thứ 3:
Tương tự, vớigiữa phần tử thứ 7 và 8:
Bước 4: Tính IQR:
Kết luận: khoảng tử phân vị của dữ liệu là 13 cm.
Ví dụ 2: Dữ liệu nhóm (bảng tần số):
Lớp (điểm) | Tần số | Tần số tích lũy
0–10 | 2 | 2
10–20 | 5 | 7
20–30 | 8 | 15
30–40 | 5 | 20
Tổng n = 20
Xác định Q₁ tại vị trí , Q₃ tại.
– Q₁ nằm trong lớp 10–20 (tần số tích lũy trước =2).
– Nội suy: độ dài lớp, tần số lớp, tần số tích lũy trước lớp.
Tương tự, Q₃ tại lớp 20–30 ():
Do đó:.
5. Các công thức và kỹ thuật cần nhớ
- Vị trí phần tử p-th percentile:.
- Đối với tử phân vị Q₁ (25%) và Q₃ (75%):
- Interpolation (nội suy) cho vị trí không nguyên:
- Với dữ liệu nhóm:
vớicận dưới lớp chứa tử phân vị, độ dài lớp.
6. Các biến thể của bài toán và cách điều chỉnh chiến lược
a) Dữ liệu rời rạc vs nhóm: dùng interpolation khi cần.
b) Dữ liệu có ngoại lai: IQR giúp phát hiện outliers (ngoại lai nằm ngoài).
c) Phân phối nặng đuôi (heavy-tailed): IQR ổn định hơn độ lệch chuẩn.
d) Nếu yêu cầu phần trăm khác (như percentiles): áp dụngchung.
7. Bài tập mẫu với lời giải chi tiết theo từng bước
Bài tập 1: Dãy điểm kiểm tra:
Giải:
n = 11, sắp xếp đã đúng.
,.
Donguyên:
.
IQR =.
Bài tập 2: Cho bảng tần số điểm thi (0–10:3; 10–20:7; 20–30:10), n=20. Tính IQR.
Giải tương tự phần ví dụ 2 (các bước sắp xếp, tích lũy, nội suy).
8. Bài tập thực hành để học sinh tự làm
1) Dữ liệu:. Tính IQR.
2) Bảng tần số: lớp 5–15:4; 15–25:6; 25–35:10; 35–45:5. Tính Q₁, Q₃, IQR.
3) Phát hiện ngoại lai trong dãy:.
9. Mẹo và lưu ý để tránh sai lầm phổ biến
- Luôn sắp xếp dữ liệu tăng dần trước khi xác định vị trí.
- Phân biệt rõ dữ liệu rời rạc và nhóm để chọn phương pháp nội suy phù hợp.
- Vớikhông nguyên, trình bày chi tiết cách nội suy (không bỏ qua).
- Kiểm tra lại kết quả bằng cách vẽ box plot hoặc tính phần trăm phần tử trong khoảng.
- Ghi nhớ công thức chung cho percentile để áp dụng linh hoạt với các yêu cầu khác.
Chúc bạn thành công trong việc nắm vững chiến lược và cách giải bài toán khoảng tử phân vị hiệu quả!
Tác giả
Tác giả bài viết tại Bạn Giỏi.
Theo dõi chúng tôi tại