Chiến lược giải bài toán ứng dụng khoảng tứ phân vị trong phân tích dữ liệu (Lớp 12)
1. Giới thiệu về bài toán ứng dụng khoảng tứ phân vị trong phân tích dữ liệu
Bài toán ứng dụng khoảng tứ phân vị trong phân tích dữ liệu là dạng bài thường gặp ở chương Thống kê của Toán lớp 12. Khoảng tứ phân vị giúp nắm được độ phân tán và sự trải rộng của bộ dữ liệu, từ đó phân tích, đánh giá phân phối dữ liệu một cách trực quan và định lượng. Khoảng tứ phân vị (IQR) là độ dài khoảng giữa tứ phân vị thứ nhất (Q1) và tứ phân vị thứ ba (Q3), thể hiện phạm vi của 50% giá trị trung tâm của mẫu số liệu.
2. Phân tích đặc điểm của loại bài toán này
- Đề bài thường cho bảng phân bố tần số hoặc dãy số liệu đã sắp xếp.
- Yêu cầu xác định các tứ phân vị Q1 (tứ phân vị thứ nhất), Q2 (tứ phân vị thứ hai - trung vị), Q3 (tứ phân vị thứ ba).
- Cần tính khoảng tứ phân vị IQR và diễn giải kết quả.
- Có thể yêu cầu nhận xét mức độ phân tán, phát hiện ngoại lệ (outlier).
3. Chiến lược tổng thể để tiếp cận bài toán
- Đọc kỹ đề, xác định kiểu dữ liệu: Dữ liệu rời rạc, ghép nhóm hay bảng tần số.
- Sắp xếp số liệu tăng dần (nếu chưa sắp).
- Tính tổng số phần tử .
- Xác định chỉ số vị trí của Q1, Q2, Q3.
- Tính giá trị Q1, Q2, Q3 theo công thức từng trường hợp.
- Tính khoảng tứ phân vị .
- Kết luận và nhận xét.
4. Các bước giải quyết chi tiết với ví dụ minh họa
Bước 1: Đọc đề, nhận diện kiểu dữ liệu và tổng số phần tử .
Ví dụ 1: Cho bảng số liệu sau về điểm kiểm tra Toán của 16 học sinh:
Bảng số liệu: 3, 4, 6, 7, 7, 8, 8, 8, 8, 9, 9, 9, 9, 9, 10, 10
Số phần tử .
- Bước 2: Xác định vị trí các tứ phân vị Q1, Q2, Q3.
Vị trí Q1:(vị trí thứ tư và một phần tư)
Vị trí Q2 (trung vị):
Vị trí Q3:
- Bước 3: Tìm giá trị Q1, Q2, Q3 theo chỉ số vị trí.
Q1 sẽ nằm giữa phần tử thứ 4 và thứ 5: Q1 = Giá trị thứ 4 + 0,25 × (Giá trị thứ 5 - Giá trị thứ 4) = 7 + 0,25 × (7-7) = 7
Q2 nằm giữa phần tử thứ 8 và 9: Q2 =
Q3 nằm giữa phần tử thứ 12 và 13: Q3 =
- Bước 4: Tính khoảng tứ phân vị
Diễn giải: 50% giá trị trung tâm trải dài trên đoạn [7;9].
5. Các công thức và kỹ thuật cần nhớ
- Vị trí các tứ phân vị trên dãy số liệu đã sắp xếp:
- Q1 tại vị trí
- Q2 tại vị trí (trung vị)
- Q3 tại vị trí
- Nếu chỉ số vị trí là số nguyên , giá trị là số liệu thứ . Nếu là số thập phân , giá trị là , trong đó là phần thập phân.
- Khoảng tứ phân vị
- Cách phát hiện outlier: Một số lý thuyết sử dụng: nếuhoặcthì là ngoại lệ.
6. Các biến thể và cách điều chỉnh chiến lược
- Dữ liệu ghép nhóm: Khi số liệu cho dưới dạng bảng tần số ghép nhóm khoảng, dùng công thức nội suy:
- - Xác định nhóm chứa tứ phân vị.
- - Công thức nội suy:
- Trong đó:
- : Cận dưới của lớp tứ phân vị
- : tần số tích lũy trước lớp đó
- : tần số lớp đó
- : độ rộng lớp
- Dữ liệu rời rạc: Áp dụng như trên với từng giá trị.
7. Bài tập mẫu và lời giải chi tiết
Cho bảng số liệu ghép nhóm sau về chiều cao (đơn vị cm) của 40 học sinh:
Bảng tần số:
Lớp (cm): 150-155 155-160 160-165 165-170 170-175
Tần số: 3 8 15 10 4
- Tổng số học sinh
- Vị trí Q1:
- Xác định lớp chứa Q1: Tần số tích lũy đến lớp 155-160 là 3+8=11 > 10,25Q1 nằm trong lớp 155-160.
- Lớp trước là 150-155, số tần số tích lũy
Cận dưới, tần số , độ rộng
Áp dụng công thức:
(cm)
- Tương tự tìm Q3:
- Tần số tích lũy đến lớp 165-170: 3+8+15+10=36 > 30,75Q3 nằm lớp 165-170.
-,,,
(cm)
-(cm)
8. Bài tập tự luyện
- Bài 1: Cho dãy số liệu: 2, 4, 5, 6, 8, 10, 11, 13, 15, 17. Hãy xác định Q1, Q2, Q3 và IQR.
- Bài 2: Cho bảng ghép nhóm về cân nặng (kg) của 30 bạn như sau:
- Lớp: 40-45 45-50 50-55 55-60
Tần số: 5 9 11 5 - Tính Q1, Q3 và IQR cho bảng trên.
9. Mẹo và lưu ý tránh sai lầm
- Phải sắp xếp số liệu tăng dần mới tìm được tứ phân vị chính xác.
- Tìm đúng chỉ số vị trí (vị trí phần tử), đặc biệt với số liệu có chẵn.
- Đọc kỹ bảng tần số, không nhầm giữa tần số và tần số tích lũy.
- Với số liệu ghép nhóm, ghi nhớ rõ cận dưới, tần số, độ rộng lớp.
- Nội suy đúng công thức cho dữ liệu ghép nhóm.
- Nêu ý nghĩa kết quả: IQR càng lớn → phân tán càng rộng.
Danh mục:
Tác giả
Tác giả bài viết tại Bạn Giỏi.
Theo dõi chúng tôi tại