Blog

So sánh độ phân tán bằng độ lệch chuẩn – Hướng dẫn chi tiết cho học sinh lớp 12

T
Tác giả
6 phút đọc
Chia sẻ:
6 phút đọc

1. Giới thiệu về so sánh độ phân tán bằng độ lệch chuẩn

Trong chương trình toán lớp 12, việc phân tích dữ liệu là một nội dung cơ bản và quan trọng với nhiều ứng dụng thực tiễn. Một trong những khía cạnh quan trọng là cần biết không chỉ giá trị trung bình của dãy số liệu, mà còn cần xem xét mức độ phân tán (mức độ “rải” của các giá trị quanh trung bình). Độ lệch chuẩn là một đại lượng dùng để đo mức độ phân tán và thường được sử dụng để so sánh sự biến thiên giữa hai hoặc nhiều bộ số liệu. Việc "so sánh độ phân tán bằng độ lệch chuẩn" giúp ta trả lời các câu hỏi kiểu như: Dữ liệu nào ổn định hơn? Dữ liệu nào có sự chênh lệch nhiều hơn quanh giá trị trung bình?

2. Định nghĩa về độ lệch chuẩn và ý nghĩa của nó

Độ lệch chuẩn (ký hiệu σ\sigmavới tổng thể,ss với mẫu) là số đo cho biết mức độ phân tán của các giá trị trong tập dữ liệu so với giá trị trung bình cộng của chúng.

Cho một dãy số liệux1,x2,...,xnx_1, x_2,..., x_n, trung bình cộng là:

Độ lệch chuẩn của mẫu số liệu là:

Ý nghĩa: Độ lệch chuẩn càng lớn, mức độ phân tán của số liệu quanh giá trị trung bình càng lớn và ngược lại.

3. Phân tích từng bước cách so sánh độ phân tán bằng độ lệch chuẩn (có ví dụ cụ thể)

Bước 1: Tính trung bình cộng của từng dãy số liệu.

Bước 2: Tính độ lệch chuẩn của từng dãy theo công thức (có thể dùng máy tính Casio hoặc tự thực hiện từng bước thủ công).

Bước 3: So sánh các giá trị độ lệch chuẩn vừa tìm được:

- NếusA>sBs_A > s_Bthì mẫu số liệu A phân tán lớn hơn mẫu số liệu B.

- NếusA<sBs_A < s_Bthì mẫu số liệu A phân tán nhỏ hơn mẫu số liệu B.

Ví dụ minh họa:

Giả sử có hai dãy số liệu:

Dãy A: 4, 6, 6, 5, 9

Dãy B: 3, 7, 5, 7, 8

Tính trung bình cộng:

Tính độ lệch chuẩn:

Kết luận: Dãy B có độ lệch chuẩn lớn hơn dãy A (1.79>1.671.79 > 1.67), do đó dãy B phân tán lớn hơn quanh trung bình.

4. Các trường hợp đặc biệt và lưu ý khi áp dụng

- Nếu hai dãy số liệu có giá trị trung bình khác nhau, bạn cần cân nhắc sử dụng hệ số biến thiên khi so sánh (xem phần sau).

- Độ lệch chuẩn chỉ mang ý nghĩa khi số liệu có tính chất cùng đơn vị đo, hoặc có ý nghĩa trong ngữ cảnh thống kê. Không nên so sánh hai dãy số liệu khác loại.

- Đối với số liệu đã ghép nhóm, công thức tính có thể thay đổi chút ít (theo chương 3 SGK Toán 12).

5. Mối liên hệ với các khái niệm toán học khác

- So với phương sai: Độ lệch chuẩn là căn bậc hai của phương sai (variance)

s2=1ni=1n(xixˉ)2s^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2

- Hệ số biến thiên (Coefficient of Variation):CV=sxˉCV = \frac{s}{\bar{x}}giúp so sánh độ phân tán tương đối khi trung bình cộng các dãy khác nhau.

- Trung vị, tứ phân vị: Là các số đặc trưng khác, thường dùng với dữ liệu lệch hoặc có ngoại lệ.

6. Các bài tập mẫu có lời giải chi tiết

Bài tập 1: Cho hai dãy số liệu sau:

Dãy X: 2, 4, 6, 8, 10

Dãy Y: 5, 5, 6, 7, 7

Hãy so sánh độ phân tán của hai dãy bằng độ lệch chuẩn.

Giải:

xˉX=2+4+6+8+105=6\bar{x}_X = \frac{2+4+6+8+10}{5} = 6

Tính các bình phương độ lệch:(26)2=16(2-6)^2=16,(46)2=4(4-6)^2=4,(66)2=0(6-6)^2=0,(86)2=4(8-6)^2=4,(106)2=16(10-6)^2=16

Tổng:16+4+0+4+16=4016 + 4 + 0 + 4 + 16 = 40

xˉY=5+5+6+7+75=6\bar{x}_Y = \frac{5+5+6+7+7}{5} = 6

Tính bình phương độ lệch:(56)2=1(5-6)^2=1,(56)2=1(5-6)^2=1,(66)2=0(6-6)^2=0,(76)2=1(7-6)^2=1,(76)2=1(7-6)^2=1.
Tổng:1+1+0+1+1=41+1+0+1+1=4

Kết luận: Dãy X có độ lệch chuẩn lớn hơn nên có độ phân tán lớn hơn dãy Y.

Bài tập 2: Cho hai lớp học có điểm kiểm tra lần lượt là:

Lớp 1: 7, 8, 8, 9, 10

Lớp 2: 6, 8, 8, 10, 12

So sánh sự phân tán điểm kiểm tra của hai lớp.

Giải:

Lớp 1:xˉ1=7+8+8+9+105=8.4\bar{x}_1 = \frac{7+8+8+9+10}{5} = 8.4

Các bình phương độ lệch: (7-8.4)2^2= 1.96, (8-8.4)2^2= 0.16, (8-8.4)2^2= 0.16, (9-8.4)2^2= 0.36, (10-8.4)2^2= 2.56. Tổng:1.96+0.16+0.16+0.36+2.56=5.21.96+0.16+0.16+0.36+2.56=5.2

Độ lệch chuẩn lớp 1: s1=5.25=1.041.02s_1 = \sqrt{\frac{5.2}{5}} = \sqrt{1.04} \approx 1.02

Lớp 2:xˉ2=6+8+8+10+125=8.8\bar{x}_2 = \frac{6+8+8+10+12}{5} = 8.8

Bình phương độ lệch: (6-8.8)2^2= 7.84, (8-8.8)2^2= 0.64, (8-8.8)2^2= 0.64, (10-8.8)2^2= 1.44, (12-8.8)2^2= 10.24. Tổng:7.84+0.64+0.64+1.44+10.24=20.87.84+0.64+0.64+1.44+10.24=20.8

Độ lệch chuẩn lớp 2: s2=20.85=4.162.04s_2 = \sqrt{\frac{20.8}{5}} = \sqrt{4.16} \approx 2.04

Kết luận: Sự phân tán điểm kiểm tra của lớp 2 lớn hơn lớp 1.

7. Các lỗi thường gặp và cách tránh khi so sánh độ phân tán bằng độ lệch chuẩn

  • Nhầm lẫn khi tính trung bình cộng hoặc các giá trị bình phương độ lệch.
  • So sánh các bộ số liệu không cùng đơn vị đo.
  • Lấy căn bậc hai tổng bình phương độ lệch mà quên chia cho số phần tử nn.
  • Không kiểm tra điều kiện đặc biệt: Nếu trung bình cộng quá khác biệt, nên sử dụng hệ số biến thiên.

8. Tóm tắt và các điểm chính cần ghi nhớ

  • Độ lệch chuẩn là số đo chuẩn xác mức độ phân tán của dữ liệu quanh trung bình.
  • Khi so sánh độ lệch chuẩn, bộ số liệu nào có giá trị độ lệch chuẩn lớn hơn, bộ đó phân tán lớn hơn.
  • Đảm bảo các bộ số liệu sử dụng cùng đơn vị đo và có nghĩa thống kê.
  • Nếu trung bình cộng hai bộ số liệu quá khác biệt, hãy sử dụng hệ số biến thiên.

Việc hiểu rõ về so sánh độ phân tán bằng độ lệch chuẩn sẽ giúp bạn nắm vững kiến thức nền tảng của Thống kê, đồng thời sử dụng linh hoạt, chính xác vào các bài toán thực tế và các kỳ thi quan trọng sắp tới. Hãy luyện tập nhiều để tránh sai sót và ghi nhớ công thức!

T

Tác giả

Tác giả bài viết tại Bạn Giỏi.

Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".