Blog

Hướng dẫn cách giải bài toán khoảng tử phân vị

T
Tác giả
8 phút đọc
Chia sẻ:
8 phút đọc

Hướng dẫn cách giải bài toán khoảng tử phân vị cho học sinh lớp 12 – Chiến lược và ví dụ minh họa (Interquartile Range)

Trong thống kê, khoảng tử phân vị (interquartile range – IQR) là một chỉ số quan trọng đo lường sự phân tán của dữ liệu. Bài viết này sẽ trình bày chi tiết chiến lược tổng thể, các bước giải cùng ví dụ, công thức cần nhớ, biến thể thường gặp, và bài tập mẫu để bạn nắm vững cách giải bài toán khoảng tử phân vị.

1. Giới thiệu về loại bài toán này và tại sao nó quan trọng

Khoảng tử phân vị (IQR) đo khoảng cách giữa phần tử tử phân vị thứ ba (Q₃) và phần tử tử phân vị thứ nhất (Q₁) trong tập dữ liệu. Nó loại bỏ ảnh hưởng của ngoại lệ (outliers) và cho biết độ tập trung ở phần giữa của phân phối.

Tại sao IQR quan trọng?

- Giúp đánh giá độ phân tán không bị lệch bởi giá trị ngoại lai.

- Thường dùng trong biểu đồ hộp (box plot) để minh họa sự phân bố.

- Là cơ sở để phát hiện ngoại lai và so sánh phân phối giữa các nhóm.

2. Phân tích đặc điểm của bài toán khoảng tử phân vị

Các đặc điểm chính:

- Dữ liệu có thể là dãy rời rạc hoặc tần suất (bảng tần số).

- Cần sắp xếp dữ liệu theo thứ tự tăng dần.

- Xác định vị trí Q₁, Q₂ (median), Q₃.

- Công thức tính khác nhau với dữ liệu nhóm (cần nội suy).

3. Chiến lược tổng thể để tiếp cận bài toán

Bước 1: Xác định loại dữ liệu (rời rạc/trọn bộ, hay nhóm/class intervals).

Bước 2: Sắp xếp hoặc tính bảng phân phối tích lũy (cộng dồn).

Bước 3: Tính vị trí Q₁ và Q₃:

• Dữ liệu rời rạc: vị trí L1=n+14L_1 = \frac{n+1}{4},L3=3(n+1)4L_3 = \frac{3(n+1)}{4}.

• Dữ liệu nhóm: nội suy trong lớp chứa tử phân vị.

Bước 4: Tìm giá trị Q₁, Q₃ theo vị trí hoặc qua nội suy.

Bước 5: Tính IQR:IQR=Q3Q1IQR = Q_3 - Q_1

4. Các bước giải quyết chi tiết với ví dụ minh họa

Ví dụ 1: Tập dữ liệu rời rạc (n = 9) gồm độ cao (cm) của 9 học sinh:

{150,  152,  155,  158,  160,  162,  165,  168,  170}\{150, \;152, \;155, \;158, \;160, \;162, \;165, \;168, \;170\}

Bước 1: Sắp xếp (đã cho sẵn).

Bước 2: Tính vị trí Q₁, Q₃:

L1=n+14=9+14=2.5L_1 = \frac{n+1}{4} = \frac{9+1}{4} = 2.5

L3=3(n+1)4=3×104=7.5L_3 = \frac{3(n+1)}{4} = \frac{3 \times 10}{4} = 7.5

Bước 3: Vì L1=2.5L_1 = 2.5không nguyên, cần nội suy giữa phần tử thứ 2 và thứ 3:

x(2)=152,x(3)=155x_{(2)} = 152,\, x_{(3)} = 155

Q1=x(2)+(L12)(x(3)x(2))=152+0.5(155152)=152+1.5=153.5Q_1 = x_{(2)} + (L_1 - 2)\bigl(x_{(3)} - x_{(2)}\bigr) = 152 + 0.5\,(155 -152) = 152 +1.5 = 153.5

Tương tự, vớiL3=7.5L_3 = 7.5giữa phần tử thứ 7 và 8:

x(7)=165,x(8)=168x_{(7)} = 165,\, x_{(8)} =168

Q3=165+0.5(168165)=165+1.5=166.5Q_3 = 165 +0.5\,(168 -165)=165 +1.5=166.5

Bước 4: Tính IQR:

IQR=Q3Q1=166.5153.5=13IQR = Q_3 - Q_1 = 166.5 - 153.5 = 13

Kết luận: khoảng tử phân vị của dữ liệu là 13 cm.

Ví dụ 2: Dữ liệu nhóm (bảng tần số):

Lớp (điểm) | Tần số | Tần số tích lũy

0–10 | 2 | 2

10–20 | 5 | 7

20–30 | 8 | 15

30–40 | 5 | 20

Tổng n = 20

Xác định Q₁ tại vị trí 0.25n=50.25n =5, Q₃ tại0.75n=150.75n=15.

– Q₁ nằm trong lớp 10–20 (tần số tích lũy trước =2).

– Nội suy: độ dài lớph=10h =10, tần số lớpfi=5f_i =5, tần số tích lũy trước lớpFi1=2F_{i-1}=2.

Q1=ai+0.25nFi1fi×h=10+525×10=10+6=16Q_1 = a_i + \frac{0.25n - F_{i-1}}{f_i} \times h =10 + \frac{5-2}{5} \times 10 =10 +6 =16

Tương tự, Q₃ tại lớp 20–30 (Fi1=7,fi=8F_{i-1}=7,f_i=8):

Q3=20+1578×10=20+10=30Q_3 =20 + \frac{15-7}{8} \times 10 =20 +10 =30

Do đó:IQR=3016=14IQR =30 -16 =14.

5. Các công thức và kỹ thuật cần nhớ

- Vị trí phần tử p-th percentile:Lp=p(n+1)100L_p= \frac{p(n+1)}{100}.

- Đối với tử phân vị Q₁ (25%) và Q₃ (75%):

L1=n+14,L3=3(n+1)4L_1= \frac{n+1}{4},\quad L_3= \frac{3(n+1)}{4}

- Interpolation (nội suy) cho vị trí không nguyên:

Qp=x(Lp)+(LpLp)(x(Lp+1)x(Lp)).Q_p = x_{(\lfloor L_p\rfloor)} + (L_p-\lfloor L_p\rfloor)\bigl(x_{(\lfloor L_p\rfloor+1)}-x_{(\lfloor L_p\rfloor)}\bigr).

- Với dữ liệu nhóm:

Qp=ai+pn/100Fi1fi×h,Q_p = a_i + \frac{p n/100 - F_{i-1}}{f_i} \times h,

vớiaia_icận dưới lớp chứa tử phân vị,hh độ dài lớp.

6. Các biến thể của bài toán và cách điều chỉnh chiến lược

a) Dữ liệu rời rạc vs nhóm: dùng interpolation khi cần.

b) Dữ liệu có ngoại lai: IQR giúp phát hiện outliers (ngoại lai nằm ngoài[Q11.5IQR,Q3+1.5IQR][Q_1 -1.5IQR, Q_3 +1.5IQR]).

c) Phân phối nặng đuôi (heavy-tailed): IQR ổn định hơn độ lệch chuẩn.

d) Nếu yêu cầu phần trăm khác (như percentiles): áp dụngLpL_pchung.

7. Bài tập mẫu với lời giải chi tiết theo từng bước

Bài tập 1: Dãy điểm kiểm tra:

{6,8,9,9,10,12,15,18,20,22,25}\{6,8,9,9,10,12,15,18,20,22,25\}

Giải:

n = 11, sắp xếp đã đúng.

L1=11+14=3L_1=\frac{11+1}{4}=3,L3=3×124=9L_3=\frac{3 \times 12}{4}=9.

DoL1,L3L_1,L_3nguyên:

Q1=x(3)=9,<br/>Q3=x(9)=20Q_1 = x_{(3)} =9,<br />Q_3 = x_{(9)} =20.

IQR =209=1120 -9 =11.

Bài tập 2: Cho bảng tần số điểm thi (0–10:3; 10–20:7; 20–30:10), n=20. Tính IQR.

Giải tương tự phần ví dụ 2 (các bước sắp xếp, tích lũy, nội suy).

8. Bài tập thực hành để học sinh tự làm

1) Dữ liệu:{3,7,8,12,13,14,18,21,22}\{3,7,8,12,13,14,18,21,22\}. Tính IQR.

2) Bảng tần số: lớp 5–15:4; 15–25:6; 25–35:10; 35–45:5. Tính Q₁, Q₃, IQR.

3) Phát hiện ngoại lai trong dãy:{10,12,13,15,18,20,40}\{10,12,13,15,18,20,40\}.

9. Mẹo và lưu ý để tránh sai lầm phổ biến

- Luôn sắp xếp dữ liệu tăng dần trước khi xác định vị trí.

- Phân biệt rõ dữ liệu rời rạc và nhóm để chọn phương pháp nội suy phù hợp.

- VớiLpL_pkhông nguyên, trình bày chi tiết cách nội suy (không bỏ qua).

- Kiểm tra lại kết quả bằng cách vẽ box plot hoặc tính phần trăm phần tử trong khoảng.

- Ghi nhớ công thức chung cho percentile để áp dụng linh hoạt với các yêu cầu khác.

Chúc bạn thành công trong việc nắm vững chiến lược và cách giải bài toán khoảng tử phân vị hiệu quả!

T

Tác giả

Tác giả bài viết tại Bạn Giỏi.

Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".