Blog

So sánh độ phân tán bằng độ lệch chuẩn – Giải thích chi tiết cho học sinh lớp 12

T
Tác giả
5 phút đọc
Chia sẻ:
5 phút đọc

Giới thiệu về khái niệm và tầm quan trọng

Trong chương trình Toán lớp 12, các em không chỉ làm quen với các số đặc trưng như số trung bình cộng mà còn phải hiểu rõ các đại lượng đo mức độ phân tán của dữ liệu. Trong đó, độ lệch chuẩn là công cụ mạnh mẽ giúp chúng ta đo lường và so sánh mức độ phân tán của các bộ số liệu. Việc "so sánh độ phân tán bằng độ lệch chuẩn" có vai trò rất quan trọng trong thống kê, ứng dụng từ học tập, nghiên cứu đến thực tiễn đời sống.

Định nghĩa về độ phân tán và độ lệch chuẩn

- Độ phân tán phản ánh mức độ "rải rác" của các giá trị trong một bộ số liệu quanh giá trị trung bình cộng.
- Độ lệch chuẩn ký hiệu là σ\sigma(hoặcss nếu tính theo mẫu) là số đo phổ biến nhất cho mức độ phân tán.

Định nghĩa toán học:

Với một bộ số liệu gồmnngiá trị x1,x2,,xnx_1, x_2, \ldots, x_n, trung bình cộng là

x=1ni=1nxi\overline{x} = \frac{1}{n} \sum_{i=1}^n x_i

Độ lệch chuẩn σ\sigma cho dãy số liệu này là:
<br/>σ=1ni=1n(xix)2<br/><br />\sigma = \sqrt{\frac{1}{n} \sum_{i=1}^n (x_i - \overline{x})^2}<br />

Nếu số liệu là mẫu, ta sửa mẫu số là n1n-1:
<br/>s=1n1i=1n(xix)2<br/><br />s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}<br />

Hướng dẫn từng bước với ví dụ minh họa

Ví dụ: So sánh độ phân tán của hai dãy số liệu sau bằng độ lệch chuẩn:
- Dãy 1: 3, 5, 7, 9, 11
- Dãy 2: 6, 7, 8, 9, 10 Các bước thực hiện:

  • Bước 1: Tính trung bình cộng mỗi dãy.
\overline{x}_1 = \frac{3 + 5 + 7 + 9 + 11}{5} = 7
\overline{x}_2 = \frac{6 + 7 + 8 + 9 + 10}{5} = 8
  • Bước 2: Tính tổng các bình phương độ lệch so với trung bình cộng.
\sum (x_i - \overline{x}_1)^2 = (3-7)^2 + (5-7)^2 + (7-7)^2 + (9-7)^2 + (11-7)^2 = 16 + 4 + 0 + 4 + 16 = 40
\sum (x_i - \overline{x}_2)^2 = (6-8)^2 + (7-8)^2 + (8-8)^2 + (9-8)^2 + (10-8)^2 = 4 + 1 + 0 + 1 + 4 = 10
  • Bước 3: Tính độ lệch chuẩn.
\sigma_1 = \sqrt{\frac{40}{5}} = \sqrt{8} \approx 2,83
\sigma_2 = \sqrt{\frac{10}{5}} = \sqrt{2} \approx 1,41

Kết luận: Dãy 1 có độ phân tán lớn hơn dãy 2 vì σ1>σ2\sigma_1 > \sigma_2.

Các trường hợp đặc biệt và lưu ý khi áp dụng

  • Nếu các dãy số liệu có đơn vị đo khác nhau thì không nên so sánh độ lệch chuẩn trực tiếp.
  • Với số liệu nhóm lớp, ta cần sử dụng công thức độ lệch chuẩn cho dữ liệu ghép nhóm.
  • Nếu hai dãy số liệu có trung bình cộng khác xa nhau, nên cân nhắc dùng hệ số biến thiên để so sánh.

Mối liên hệ với các khái niệm toán học khác

- Độ lệch chuẩn luôn là số không âm, càng gần 0 thì bộ số liệu càng tập trung quanh trung bình cộng.
- Phương sai (σ2\sigma^2) là bình phương của độ lệch chuẩn và cũng là một thước đo quan trọng trong thống kê.
- Khi muốn so sánh độ phân tán giữa các dãy số liệu không cùng đơn vị, hoặc trung bình cộng khác nhau nhiều, có thể dùng hệ số biến thiên:

CV=σx×100%CV = \frac{\sigma}{\overline{x}} \times 100\%

- Hệ số biến thiên đo lường độ phân tán tương đối, là công cụ bổ trợ hữu hiệu.

Bài tập mẫu có lời giải chi tiết

Bài tập 1: So sánh độ phân tán của hai dãy số liệu sau:

  • Dãy A: 2, 4, 6, 8
    Dãy B: 4, 5, 6, 7
  • Giải:
    Trung bình cộng dãy A: xA=2+4+6+84=5\overline{x}_A = \frac{2 + 4 + 6 + 8}{4} = 5
    Tính các bình phương độ lệch:
    (25)2+(45)2+(65)2+(85)2=9+1+1+9=20(2-5)^2 + (4-5)^2 + (6-5)^2 + (8-5)^2 = 9 + 1 + 1 + 9 = 20
    Độ lệch chuẩn dãy A: σA=204=52,24\sigma_A = \sqrt{\frac{20}{4}} = \sqrt{5} \approx 2,24

    Trung bình cộng dãy B: xB=5,5\overline{x}_B = 5,5
    (45,5)2+(55,5)2+(65,5)2+(75,5)2=2,25+0,25+0,25+2,25=5(4-5,5)^2 + (5-5,5)^2 + (6-5,5)^2 + (7-5,5)^2 = 2,25 + 0,25 + 0,25 + 2,25 = 5
    σB=54=1,251,12\sigma_B = \sqrt{\frac{5}{4}} = \sqrt{1,25} \approx 1,12

    Kết luận: Dãy A phân tán hơn dãy B vì độ lệch chuẩn lớn hơn.

Bài tập 2: Cho hai dãy số liệu biểu diễn điểm kiểm tra của hai lớp.
Lớp X: 8, 8, 8, 8, 8
Lớp Y: 5, 6, 7, 8, 9
Hãy so sánh mức độ phân tán thành tích của hai lớp.

  • Giải:
    Lớp X: Các số giống nhau, nên σX=0\sigma_X = 0
    Lớp Y: Trung bình cộng xY=7\overline{x}_Y = 7
    (57)2+(67)2+(77)2+(87)2+(97)2=4+1+0+1+4=10(5-7)^2 + (6-7)^2 + (7-7)^2 + (8-7)^2 + (9-7)^2 = 4 + 1 + 0 + 1 + 4 = 10
    σY=105=21,41\sigma_Y = \sqrt{\frac{10}{5}} = \sqrt{2} \approx 1,41

    Lớp X có điểm đồng đều, lớp Y phân tán hơn.

Các lỗi thường gặp và cách tránh

  • Quên bình phương sai số khi tính phương sai.
  • Nhầm lẫn công thức mẫu và tổng thể.
  • Quên chia cho đúng số lượng phần tử (n hoặc n-1) tùy bài.
  • So sánh độ lệch chuẩn của các dãy số liệu có đơn vị khác biệt mà không chuẩn hóa.

Tóm tắt và những điểm chính cần nhớ

  • Độ lệch chuẩn đo mức độ phân tán của một bộ số liệu quanh giá trị trung bình.
  • Nếu σ\sigmacàng nhỏ thì dữ liệu càng tập trung;σ\sigma lớn cho thấy dữ liệu phân tán.
  • Chỉ nên so sánh độ lệch chuẩn giữa các dãy có cùng đơn vị.
  • Nên tính hệ số biến thiên nếu các trung bình cộng khác nhau nhiều hoặc đơn vị khác nhau.
  • Độ lệch chuẩn là nền tảng cho nhiều khái niệm quan trọng trong thống kê, xác suất.
T

Tác giả

Tác giả bài viết tại Bạn Giỏi.

Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".