Blog

Bài 1: Khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm

T
Tác giả
7 phút đọc
Chia sẻ:
7 phút đọc

Bài 1: Khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm

1. Giới thiệu về khái niệm và tầm quan trọng

Trong chương trình Toán lớp 12, phần thống kê cung cấp các công cụ để phân tích và tổng hợp số liệu. Hai khái niệm quan trọng là khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu ghép nhóm. Hiểu rõ chúng giúp học sinh đánh giá mức độ phân tán và cấu trúc dữ liệu, phục vụ cho việc so sánh và ra quyết định.

2. Định nghĩa chính xác

Cho mẫu số liệu ghép nhóm gồm kklớp, mỗi lớp thứ iicó khoảng giá trị [ai1,ai)[a_{i-1},a_i)và tần số fif_i. Gọi xix'_ilà giá trị đại diện của lớp thứ ii, thường lấy xi=ai1+ai2x'_i = \frac{a_{i-1}+a_i}{2}. Tổng số quan sát là n=i=1kfin = \sum_{i=1}^k f_i.

2.1 Khoảng biến thiên (Range): là hiệu số giữa giá trị lớn nhất và nhỏ nhất trong dữ liệu. Với dữ liệu ghép nhóm, giá trị nhỏ nhất là a0a_0và lớn nhất gần đúng là aka_k. Như vậy, khoảng biến thiên được xác định bởi công thức:

Range=aka0\text{Range} = a_k - a_0

2.2 Khoảng tứ phân vị (Interquartile range - IQR): là hiệu số giữa giá trị phân vị thứ baQ3Q_3và phân vị thứ nhấtQ1Q_1.Q1Q_1Q3Q_3chia mẫu thành 4 phần bằng nhau theo tần số tích lũy. Công thức tính khoảng tứ phân vị:

IQR=Q3Q1\text{IQR} = Q_3 - Q_1

3. Giải thích từng bước với ví dụ minh họa

Bước 1: Xác định các giới hạn lớp và tần số. Bước 2: Tính điểm đại diệnxix'_icho mỗi lớp. Bước 3: Tính tần số tích lũy để tìm vị trí phân vị. Bước 4: Nội suy để xác địnhQ1Q_1Q3Q_3. Cuối cùng, tính Range và IQR theo công thức.

Ví dụ: Cho bảng tần số sau của điểm thi một bài kiểm tra:

Lớp điểm [0,10):f1=3f_1=3; [10,20):f2=7f_2=7; [20,30):f3=10f_3=10; [30,40):f4=6f_4=6; [40,50]:f5=4f_5=4.

Tính Range và IQR của dữ liệu.

Giải:

1) Khoảng biến thiên:Range=500=50.\text{Range} = 50 - 0 = 50.

2) TìmQ1Q_1Q3Q_3:

Tổngn=3+7+10+6+4=30n = 3+7+10+6+4 = 30. Vị trí Q1Q_10.25n=7.50{.}25n = 7{.}5quan sát,Q3Q_30.75n=22.50{.}75n = 22{.}5quan sát.

Xây dựng bảng tần số tích lũy:

[0,10): 3; [10,20): 3+7=10; [20,30): 10+10=20; [30,40): 20+6=26; [40,50]: 26+4=30.

Vị trí 7{.}5 rơi trong lớp [10,20), vị trí 22{.}5 rơi trong lớp [30,40).

Công thức nội suy để tìmQpQ_ptrong lớp[ai1,ai)[a_{i-1},a_i):

Qp=ai1+(pnFi1)fi(aiai1)Q_p = a_{i-1} + \frac{(pn - F_{i-1})}{f_i} (a_i - a_{i-1})

Vớip=0.25,f2=7,F1=3,a1=10,a2=20p=0{.}25,f_2=7,F_1=3,a_1=10,a_2=20:

Q1=10+(7.53)7(2010)=10+4.57×1016.43Q_1 = 10 + \frac{(7{.}5-3)}{7}(20-10) = 10 + \frac{4{.}5}{7}\times 10 \approx 16{.}43

Vớip=0.75,f4=6,F3=20,a3=30,a4=40p=0{.}75,f_4=6,F_3=20,a_3=30,a_4=40:

Q3=30+(22.520)6(4030)=30+2.56×1034.17Q_3 = 30 + \frac{(22{.}5-20)}{6}(40-30) = 30 + \frac{2{.}5}{6}\times 10 \approx 34{.}17

VậyIQR=Q3Q134.1716.43=17.74.\text{IQR} = Q_3 - Q_1 \approx 34{.}17 - 16{.}43 = 17{.}74.

4. Các trường hợp đặc biệt và lưu ý khi áp dụng

• Khi một lớp có tần số bằng 0, bỏ qua lớp đó trong nội suy.
• Nếu phân vị rơi đúng vào giới hạn lớp, giá trị phân vị chính xác là giới hạn đó.
• Đảm bảo tổng tần số đúng và giới hạn lớp không chồng lên nhau.

5. Mối liên hệ với các khái niệm toán học khác

Khoảng biến thiên và IQR liên quan chặt chẽ đến độ lệch chuẩn và phương sai trong việc đo độ phân tán. IQR là thước đo bền vững hơn khi có ngoại lệ so với Range và độ lệch chuẩn.

6. Các bài tập mẫu có lời giải chi tiết

Bài tập 1 - Đề bài: Cho dữ liệu ghép nhóm:

[5,15): 4; [15,25): 8; [25,35): 12; [35,45): 6.

Giải:

Tổngn=4+8+12+6=30n=4+8+12+6=30. Range = 45 - 5 = 40.

Vị trí Q1Q_10.25n=7.50{.}25n=7{.}5,Q3Q_30.75n=22.50{.}75n=22{.}5.

Bảng tích lũy: [5,15):4; [15,25):12; [25,35):24; [35,45):30.

Vị trí 7{.}5 trong [15,25),f2=8,F1=4,a1=15,a2=25f_2=8,F_1=4,a_1=15,a_2=25:

Q1=15+(7.54)8(2515)=15+3.58×10=19.375Q_1 = 15 + \frac{(7{.}5-4)}{8}(25-15) = 15 + \frac{3{.}5}{8} \times 10 = 19{.}375

Vị trí 22{.}5 trong [25,35),f3=12,F2=12,a2=25,a3=35f_3=12,F_2=12,a_2=25,a_3=35:

Q3=25+(22.512)12(3525)=25+10.512×1033.75Q_3 = 25 + \frac{(22{.}5-12)}{12}(35-25) = 25 + \frac{10{.}5}{12} \times 10 \approx 33{.}75

IQR = 33{.}75 - 19{.}375 = 14{.}375.

Bài tập 2: Cho bảng tần số... (tự làm tương tự).

7. Các lỗi thường gặp và cách tránh

• Nhầm lẫn giữa phân vị và điểm đại diện.
• Bỏ qua tần số tích lũy từ lớp đầu.
• Nội suy sai vị trí phân vị.
Cách tránh: luôn kiểm tra tính đúng cách của bảng tần số tích lũy và công thức nội suy.

8. Tóm tắt và các điểm chính cần nhớ

• Range đo khoảng cách giữa giá trị lớn nhất và nhỏ nhất.
• IQR đo phân bố trung tâm, bền vững với ngoại lệ.
• Tính IQR cần xác định chính xácQ1Q_1Q3Q_3bằng nội suy.
• Kiểm tra kỹ bảng tần số tích lũy trước khi tính toán.

T

Tác giả

Tác giả bài viết tại Bạn Giỏi.

Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".