Blog

Ứng dụng khoảng tứ phân vị trong phân tích dữ liệu – Giải thích chi tiết cho học sinh lớp 12

T
Tác giả
7 phút đọc
Chia sẻ:
8 phút đọc

1. Giới thiệu về khoảng tứ phân vị và tầm quan trọng trong Toán 12

Trong chương trình Toán 12, khi học về phân tích số liệu thống kê, các em sẽ thường gặp những khái niệm như trung bình cộng, trung vị, phương sai, và đặc biệt là khoảng tứ phân vị. Khoảng tứ phân vị là một công cụ toán học quan trọng giúp học sinh hiểu hơn về mức độ phân tán, sự chênh lệch và phân bố dữ liệu trong một mẫu số liệu, từ đó phân tích và đưa ra nhận xét chính xác về đặc điểm của dữ liệu.

Khoảng tứ phân vị không chỉ xuất hiện trong các bài kiểm tra, thi tốt nghiệp THPT Quốc gia mà còn ứng dụng rộng rãi trong các lĩnh vực khoa học, kinh tế, kỹ thuật,… Do đó, việc nắm vững khái niệm, cách tính và ý nghĩa của khoảng tứ phân vị rất quan trọng đối với các bạn học sinh lớp 12.

2. Định nghĩa khoảng tứ phân vị

Tứ phân vị là các giá trị chia một tập hợp dữ liệu thành bốn phần bằng nhau. Có ba tứ phân vị quan trọng:

  • Tứ phân vị thứ nhất (Q1Q_1): Là giá trị chia phần nhỏ nhất của dữ liệu thành 25%.
  • Tứ phân vị thứ hai (Q2Q_2): Còn gọi là trung vị (median), chia tập dữ liệu thành hai phần bằng nhau (50%).
  • Tứ phân vị thứ ba (Q3Q_3): Là giá trị chia phần nhỏ nhất vào 75% của dữ liệu.

Khoảng tứ phân vị (hay còn gọi là IQR – Interquartile Range) là hiệu giữa tứ phân vị thứ ba và thứ nhất:

IQR = Q_3 - Q_1

Khoảng tứ phân vị thể hiện mức độ phân tán của 50% số liệu tập trung ở giữa phân phối.

3. Hướng dẫn cách tính khoảng tứ phân vị từng bước (có ví dụ)

Để tính khoảng tứ phân vị, các em thực hiện các bước sau:

  1. Xếp dữ liệu theo thứ tự tăng dần.
  2. Xác định số phần tử nntrong dãy số.
  3. Tìm các tứ phân vị Q1Q_1,Q2Q_2,Q3Q_3theo công thức đã học.
  4. Tính khoảng tứ phân vị IQR=Q3Q1IQR = Q_3 - Q_1.

Ví dụ:

Cho dãy số liệu: 3, 5, 7, 8, 11, 13, 15, 18, 21

  1. Xếp theo thứ tự tăng dần (đã có): 3, 5, 7, 8, 11, 13, 15, 18, 21.
  2. n=9n = 9số liệu.
  3. Tính trung vị (Q2): Số ở vị trí thứ 9+12=5\frac{9+1}{2} = 51111.Q2=11Q_2 = 11.
  4. Tứ phân vị thứ nhất (Q1Q_1): Xét dãy bên trái{3,5,7,8}\{3,5,7,8\}. Trung vị của dãy này là trung bình cộng của5577(là hai giá trị giữa), tức là Q1=5+72=6Q_1 = \frac{5+7}{2} = 6.
  5. Tứ phân vị thứ ba (Q3Q_3): Xét dãy bên phải{13,15,18,21}\{13,15,18,21\}. Trung vị là trung bình cộng của15151818:Q3=15+182=16,5Q_3 = \frac{15+18}{2} = 16,5.
  6. Khoảng tứ phân vị:IQR=Q3Q1=16,56=10,5IQR = Q_3 - Q_1 = 16,5 - 6 = 10,5.

Vậy khoảng tứ phân vị của dãy số trên là 10,5.

4. Các trường hợp đặc biệt và lưu ý khi áp dụng

– Nếu số số liệunnlà số lẻ, không tính trung vị vào hai nửa dãy khi tìmQ1Q_1Q3Q_3(như trong ví dụ trên).

– Nếunnlà số chẵn, hai nửa dãy đều có số lượng bằng nhau, ta chia trực tiếp và tìm trung vị mỗi nửa.

– Với dữ liệu ghép nhóm (chia thành các lớp), cần sử dụng công thức nội suy để tìm giá trị tứ phân vị:

<br/>Qk=L+(kN4F)hf<br />Q_k = L + \dfrac{\left(\dfrac{kN}{4} - F \right) \cdot h}{f}

Trong đó:
-QkQ_k: Tứ phân vị thứ kk(k=1,2,3k=1,2,3)
-LL: Lớp dưới của lớp chứa tứ phân vị
-NN: Tổng số các số liệu
-FF: Tổng tần số tích lũy trước lớp chứa tứ phân vị
-hh: Độ rộng lớp
-ff: Tần số của lớp chứa tứ phân vị

5. Mối liên hệ với các khái niệm toán học khác

– Khoảng tứ phân vị liên quan chặt chẽ đến trung vị (Q2Q_2) và các chỉ số thống kê như trung bình cộng, phương sai, độ lệch chuẩn. Trong nhiều trường hợp, khoảng tứ phân vị được dùng để phát hiện các giá trị ngoại lai (outlier) trong dữ liệu: một giá trị được coi là ngoại lai nếu nhỏ hơnQ11,5×IQRQ_1 - 1,5 \times IQRhoặc lớn hơnQ3+1,5×IQRQ_3 + 1,5 \times IQR.

– Ngoài ra, khoảng tứ phân vị biểu thị mức độ tập trung của dữ liệu tốt hơn trung bình hoặc độ lệch chuẩn khi dữ liệu có ngoại lai hoặc không đối xứng.

6. Bài tập mẫu có lời giải chi tiết

Bài tập 1: Cho dãy số liệu sau
12,14,15,17,18,19,21,23,24,2912, 14, 15, 17, 18, 19, 21, 23, 24, 29

a) Hãy tínhQ1Q_1,Q2Q_2,Q3Q_3và khoảng tứ phân vị của dãy số liệu trên.

Lời giải:

  1. Dãy đã được xếp tǎng dần.
  2. n=10n = 10(số chẵn).
  3. Q2 (trung vị): Trung bình của 5, 6:18+192=18,5\frac{18+19}{2} = 18,5
  4. Nửa dưới:12,14,15,17,1812, 14, 15, 17, 18Q1=15Q_1 = 15
  5. Nửa trên:19,21,23,24,2919, 21, 23, 24, 29Q3=23Q_3 = 23
  6. Khoảng tứ phân vị IQR=2315=8IQR = 23 - 15 = 8

Bài tập 2 (Dữ liệu ghép nhóm):
Bảng tần số chiều cao học sinh (đơn vị: cm):
Lớp: 150–154 | 155–159 | 160–164 | 165–169
Tần số: 3 | 7 | 16 | 4
Tổng số học sinh:N=3+7+16+4=30N = 3 + 7 + 16 + 4 = 30

a) Xác định các tứ phân vị Q1,Q2,Q3Q_1, Q_2, Q_3(theo công thức nội suy)

Lời giải:

  1. Tìm vị trí:
    1×304=7,5\dfrac{1 \times 30}{4} = 7,5Q1Q_1nằm ở lớp thứ hai (tích lũy trước là 3).
    2×304=15\dfrac{2 \times 30}{4} = 15Q2Q_2nằm ở lớp thứ ba (tích lũy trước là 10).
    3×304=22,5\dfrac{3 \times 30}{4} = 22,5Q3Q_3cũng nằm ở lớp thứ ba (tích lũy trước là 10).
    Các lớp đều có độ rộngh=5h = 5.
  2. TínhQ1Q_1:
    L=155L = 155,F=3F = 3,f=7f = 7
    Q1=155+(7,53)×57=155+4,5×57155+3,2=158,2Q_1 = 155 + \frac{(7,5 - 3) \times 5}{7} = 155 + \frac{4,5 \times 5}{7} \approx 155 + 3,2 = 158,2(cm)
  3. TínhQ2Q_2:
    L=160L = 160,F=10F = 10,f=16f = 16
    Q2=160+(1510)×516=160+5×516=160+1,56=161,56Q_2 = 160 + \frac{(15 - 10) \times 5}{16} = 160 + \frac{5 \times 5}{16} = 160 + 1,56 = 161,56(cm)
  4. TínhQ3Q_3:
    L=160L = 160,F=10F = 10,f=16f = 16
    Q3=160+(22,510)×516=160+12,5×516=160+3,91=163,91Q_3 = 160 + \frac{(22,5 - 10) \times 5}{16} = 160 + \frac{12,5 \times 5}{16} = 160 + 3,91 = 163,91(cm)
  5. IQR=Q3Q1163,91158,2=5,71= Q_3 - Q_1 \approx 163,91 - 158,2 = 5,71(cm)

7. Các lỗi thường gặp và cách tránh

  • Không xếp dãy số liệu theo thứ tự tăng dần trước khi tính các tứ phân vị.
  • Nhầm vị trí trung vị khinnlà số lẻ hay chẵn.
  • Nhầm dãy số khi chia làm hai nửa tìmQ1Q_1Q3Q_3(đặc biệt chú ý loại bỏ/giữ trung vị đúng quy tắc).
  • Tính sai tần số tích lũy hoặc chọn sai lớp tứ phân vị trong dữ liệu ghép nhóm.

8. Tóm tắt và các điểm chính cần nhớ

– Khoảng tứ phân vị thể hiện mức độ phân tán của 50% số liệu tập trung ở giữa.
– Các bước cơ bản: xếp số liệu tăng dần, tìmQ1Q_1,Q3Q_3, lấy hiệu.
– Khi áp dụng cho dữ liệu ghép nhóm, cần xác định vị trí đúng và dùng công thức nội suy.
– Khoảng tứ phân vị rất hữu ích trong việc phát hiện ngoại lai, và so sánh sự phân tán của các mẫu số liệu.
– Nắm chắc quy tắc chia dãy số liệu khinnlẻ/chẵn sẽ giúp tránh nhiều lỗi sai.

Cố gắng luyện tập nhiều dạng bài để thuần thục kỹ năng tính khoảng tứ phân vị, từ đó vận dụng hiệu quả trong các bài thi và thực tế phân tích dữ liệu!

T

Tác giả

Tác giả bài viết tại Bạn Giỏi.

Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".