1. Giới thiệu về khoảng biến thiên và khoảng tứ phân vị trong số liệu ghép nhóm
Trong chương trình Toán lớp 12, "Khoảng biến thiên" và "khoảng tứ phân vị" của mẫu số liệu ghép nhóm là hai đại lượng quan trọng để đo mức độ phân tán của dữ liệu thống kê. Những khái niệm này giúp học sinh hiểu, phân tích và trình bày dữ liệu một cách khoa học, đồng thời được ứng dụng thực tiễn trong nhiều lĩnh vực như kinh tế, xã hội, nghiên cứu khoa học,... Hiểu được các đại lượng này là nền tảng vững chắc để tiếp cận các bài toán thống kê, xác suất ở các lớp cao hơn cũng như trong các kỳ thi.
2. Định nghĩa chính xác
- Khoảng biến thiên (range): Là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của một mẫu số liệu.
- Khoảng tứ phân vị (interquartile range – IQR): Là hiệu số giữa tứ phân vị trên (Q3) và tứ phân vị dưới (Q1) của dãy số liệu. Tứ phân vị là các giá trị chia dãy số liệu thành 4 phần bằng nhau.
3. Giải thích từng bước với ví dụ minh họa
Giả sử bảng phân bố tần số ghép nhóm của điểm thi (số liệu đã được chia lớp):
+ Lớp 1: 4 - 6, tần số 4+ Lớp 2: 6 - 8, tần số 6+ Lớp 3: 8 - 10, tần số 8+ Lớp 4: 10 - 12, tần số 2- Tổng số quan sát:n=4+6+8+2=20
a) Tính khoảng biến thiên
Khoảng biến thiên là:
Với bảng ghép nhóm,xminlà giới hạn dưới của lớp nhỏ nhất,xmaxlà giới hạn trên của lớp lớn nhất:
Kết luận: Khoảng biến thiên của bảng số liệu là 8 điểm.
b) Tính khoảng tứ phân vị
- Bước 1: Xác định các tứ phân vị Q1và Q3.- Bước 2: Tìm vị trí củaQ1và Q3dựa trên tổng số quan sátn:+ Vị trí Q1là quan sát thứ k1=4n=5.
+ Vị trí Q3là quan sát thứ k3=43n=15.
- - Bước 3: Xác định lớp chứaQ1(quan sát thứ 5):
+ Lớp 1: Tích lũy tần số là 4 (chưa tới 5), lớp thứ 2 bắt đầu từ vị trí 5, vậyQ1nằm trong lớp 2 (6 – 8).
- - Bước 4: Xác định lớp chứaQ3(quan sát thứ 15):
+ Lớp 1+2+3: Tích lũy tần số là 4+6+8=18 > 15, nênQ3nằm trong lớp 3 (8 – 10).
Áp dụng công thức tính tứ phân vị cho dữ liệu ghép nhóm:
Q_1 = L_1 + \left[\frac{\frac{n}{4} - F_0}{f_1}\right] \times h
Trong đó:
L1: Giới hạn dưới của lớp chứaQ1(ở đây là 6).F0: Tần số tích lũy trước lớp chứaQ1(ở đây là 4).f1: Tần số của lớp chứaQ1(ở đây là 6).h: Độ rộng lớp (ở đây là 8−6=2).Vậy:
Q_1 = 6 + \left[\frac{5-4}{6}\right] \times 2 = 6 + \frac{1}{6} \times 2 = 6 + \frac{2}{6} = 6.33
Tương tự vớiQ3:
- -L3= 8 (giới hạn dưới lớp 3),F0= 10 (tích lũy các lớp trước),f3= 8,h= 2.
Q_3 = 8 + \left[\frac{15-10}{8}\right] \times 2 = 8 + \frac{5}{8} \times 2 = 8 + 1.25 = 9.25
Do đó, khoảng tứ phân vị:
IQR = Q_3 - Q_1 = 9.25 - 6.33 = 2.92
Kết luận: Khoảng tứ phân vị là 2.92 điểm.
4. Các trường hợp đặc biệt và lưu ý
+ Nếu số lượng mẫu nhỏ, việc ghép nhóm quá nhiều sẽ thiếu chính xác. Chỉ nên áp dụng cho mẫu lớn.+ Khi các lớp không đều rộng, cần để ý chọn h đúng cho từng lớp.+ Tứ phân vị chỉ có ý nghĩa rõ khi dữ liệu đã được sắp xếp theo thứ tự.5. Mối liên hệ với các khái niệm toán học khác
+ Khoảng biến thiên và khoảng tứ phân vị là các đại lượng mô tả độ phân tán, song song với các đại lượng trung tâm như trung bình cộng, trung vị, mốt.+ Khoảng tứ phân vị ít bị ảnh hưởng bởi các giá trị ngoại lai (outlier) nên được dùng để đánh giá độ phân tán một cách khách quan hơn so với khoảng biến thiên.6. Bài tập mẫu và lời giải chi tiết
Bài tập:
Bảng phân bố chiều cao (cm) của 30 học sinh được cho như sau:
Lớp 1: 150 – 155, tần số 6Lớp 2: 155 – 160, tần số 10Lớp 3: 160 – 165, tần số 8Lớp 4: 165 – 170, tần số 6Tìm khoảng biến thiên và khoảng tứ phân vị của mẫu.
Tổng số học sinhn=30.
- Khoảng biến thiên:R=170−150=20(cm)
- Vị trí Q1=4n=7.5(tức quan sát thứ 8)
+ Tần số tích lũy lớp 1: 6, lớp 2: 16, vậyQ1nằm trong lớp 2 (155-160).
+L1=155,F0=6,f1=10,h=5.
Q1=155+[108−6]×5=155+1=156
- Vị trí Q3=43n=22.5(quan sát thứ 23)
+ Tần số tích lũy lớp 1+2+3: 24, vậyQ3nằm trong lớp 3 (160-165).
+L3=160,F0=16,f3=8,h=5.
Q3=160+[823−16]×5=160+4.375=164.375
- Khoảng tứ phân vị:IQR=164.375−156=8.375(cm)
7. Các lỗi thường gặp và cách tránh
+ Không xác định đúng lớp chứa tứ phân vị (do tính nhầm tần số tích lũy). Giải pháp: Kẻ bảng tích lũy rõ ràng.+ Nhập sai độ rộng lớp (h) khi các lớp không đều.+ Đổi nhầm đơn vị (nếu có). Luôn kiểm tra lại đơn vị kết quả.+ Quên sử dụng trị tích lũy đúng choF0.8. Tóm tắt và điểm cần nhớ
+ Khoảng biến thiên và khoảng tứ phân vị là những số đo quan trọng đánh giá độ phân tán dữ liệu.+ Để tính cần chú ý xác định đúng các giá trị đặc trưng, lớp chứa tứ phân vị.+ Khoảng tứ phân vị phản ánh phần lớn dữ liệu, ít bị ảnh hưởng bởi giá trị cực trị hơn khoảng biến thiên.+ Khi áp dụng cần chú ý đến độ rộng lớp, tổng số quan sát và soát kỹ đơn vị.
Theo dõi chúng tôi tại