Blog

Thống kê mô tả – Khái niệm, ví dụ, bài tập cho học sinh lớp 12

T
Tác giả
9 phút đọc
Chia sẻ:
10 phút đọc

1. Giới thiệu về thống kê mô tả và tầm quan trọng trong toán học

Thống kê mô tả là một chủ đề quan trọng trong chương trình Toán lớp 12 và có ứng dụng rộng rãi trong thực tế. Học thống kê mô tả giúp học sinh biết cách tóm tắt, trình bày và phân tích dữ liệu, từ đó hiểu được bản chất, xu hướng của một tập hợp số liệu. Đây là nền tảng cho nhiều lĩnh vực như kinh tế, y học, xã hội học... và là bước cơ bản trước khi tiếp cận các khái niệm nâng cao hơn như xác suất hoặc thống kê suy luận.

2. Định nghĩa chính xác về thống kê mô tả

Thống kê mô tả là tập hợp các phương pháp dùng để thu thập, trình bày, xử lý và phân tích một tập dữ liệu để mô tả các đặc trưng cơ bản (trung tâm, độ phân tán, phân phối) của dữ liệu đó. Các đại lượng thường gặp gồm: số trung bình, trung vị, mốt, phương sai, độ lệch chuẩn, bảng tần số, biểu đồ,...

3. Các bước thực hiện thống kê mô tả kèm ví dụ minh họa

3.1. Thu thập dữ liệu

Dữ liệu có thể thu thập từ khảo sát, thực nghiệm, đo đạc,... hoặc lấy từ các nguồn có sẵn.

3.2. Sắp xếp và trình bày dữ liệu

Với tập dữ liệu nhỏ, ta có thể liệt kê trực tiếp. Với dữ liệu lớn, nên sử dụng bảng tần số, phân lớp dữ liệu hoặc biểu đồ (cột, tròn, đoạn thẳng...).

3.3. Tính các đại lượng thống kê mô tả

Dưới đây là các đại lượng thống kê mô tả cơ bản với cách tính và ví dụ.

a) Số trung bình (Trung bình cộng)

Nếu dữ liệu gồmnngiá trị x1,x2,...,xnx_1, x_2,...,x_n, số trung bình là:

\bar{x} = \frac{x_1 + x_2 + \cdots + x_n}{n}

Ví dụ: Dữ liệu điểm toán của 5 bạn: 7, 8, 7.5, 6, 9.

Khi đó: xˉ=7+8+7.5+6+95=37.55=7.5\bar{x} = \frac{7 + 8 + 7.5 + 6 + 9}{5} = \frac{37.5}{5} = 7.5

b) Trung vị (Median)

Trung vị là giá trị nằm ở giữa khi dữ liệu được sắp xếp theo thứ tự tăng/giảm. Nếu số lượng giá trị lẻ, trung vị là giá trị chính giữa; nếu là số chẵn, trung vị là trung bình cộng của hai giá trị ở giữa.

Ví dụ: Sắp xếp 5 điểm: 6, 7, 7.5, 8, 9. Trung vị là 7.57.5.

c) Mốt (Mode)

Mốt là giá trị xuất hiện nhiều lần nhất trong tập dữ liệu.

Ví dụ: Dữ liệu: 7, 8, 7.5, 7, 9. Mốt là 7 (xuất hiện 2 lần).

d) Độ lệch chuẩn, phương sai

Phương sai (σ2\sigma^2) đo mức độ phân tán dữ liệu quanh giá trị trung bình. Độ lệch chuẩn (σ\sigma) là căn bậc hai của phương sai.

\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2
\sigma = \sqrt{\sigma^2}

Ví dụ với tập dữ liệu trên, tính phương sai và độ lệch chuẩn:

- Số trung bình:7.57.5

- Các giá trị lệch bình phương:(77.5)2=0.25(7-7.5)^2 = 0.25,(87.5)2=0.25(8-7.5)^2 = 0.25,(7.57.5)2=0(7.5-7.5)^2 = 0,(67.5)2=2.25(6-7.5)^2 = 2.25,(97.5)2=2.25(9-7.5)^2 = 2.25.

- Tổng:0.25+0.25+0+2.25+2.25=50.25 + 0.25 + 0 + 2.25 + 2.25 = 5

- Phương sai:55=1\frac{5}{5} = 1

- Độ lệch chuẩn: 1=1\sqrt{1} = 1

4. Các trường hợp đặc biệt và lưu ý khi áp dụng

- Khi dữ liệu có giá trị ngoại lai (outlier) lớn/nhỏ bất thường, số trung bình có thể bị ảnh hưởng mạnh. Trung vị hoặc mốt sẽ phản ánh chính xác xu hướng hơn.

- Mỗi dạng dữ liệu (số, dạng rời rạc, dạng phân lớp) sẽ có cách trình bày, biểu diễn khác nhau. Cần chọn đại lượng thống kê mô tả phù hợp loại dữ liệu.

5. Mối liên hệ với các khái niệm toán học khác

Thống kê mô tả liên kết chặt chẽ với:

  • - Xác suất: Thống kê mô tả cung cấp nền tảng để ước lượng, kiểm định giả thuyết trong xác suất và thống kê suy luận.
  • - Đại số: Các phép tính tổng, bình phương, căn bậc hai,... trong thống kê đều là kiến thức đại số.
  • - Đồ thị: Biểu đồ là công cụ hỗ trợ trực quan hóa dữ liệu, liên quan đến các dạng hàm số và hình học.
  • 6. Các bài tập mẫu có lời giải chi tiết

    Bài 1: Cho dãy số: 4, 5, 7, 8, 6, 5, 7, 9, 4, 6.

    a) Tính số trung bình, trung vị, mốt.

    b) Tính phương sai, độ lệch chuẩn.

    Lời giải:

    a) Tổng:4+5+7+8+6+5+7+9+4+6=614+5+7+8+6+5+7+9+4+6 = 61.

    \RightarrowSố trung bình:xˉ=6110=6.1\bar{x} = \frac{61}{10} = 6.1

    Sắp xếp: 4, 4, 5, 5, 6, 6, 7, 7, 8, 9.

    Trung vị: Trung bình hai số ở vị trí 5 và 6:(6+6)/2=6(6 + 6)/2 = 6.

    Mốt: 4, 5, 6, 7 đều xuất hiện 2 lần → Dãy số có nhiều mốt.

    b) Tính phương sai và độ lệch chuẩn:

    Các giá trị lệch bình phương so với6.16.1:

  • (46.1)2=4.41(4-6.1)^2 = 4.41
  • (46.1)2=4.41(4-6.1)^2 = 4.41
  • (56.1)2=1.21(5-6.1)^2 = 1.21
  • (56.1)2=1.21(5-6.1)^2 = 1.21
  • (66.1)2=0.01(6-6.1)^2 = 0.01
  • (66.1)2=0.01(6-6.1)^2 = 0.01
  • (76.1)2=0.81(7-6.1)^2 = 0.81
  • (76.1)2=0.81(7-6.1)^2 = 0.81
  • (86.1)2=3.61(8-6.1)^2 = 3.61
  • (96.1)2=8.41(9-6.1)^2 = 8.41
  • Tổng:4.41+4.41+1.21+1.21+0.01+0.01+0.81+0.81+3.61+8.41=24.894.41 + 4.41 + 1.21 + 1.21 + 0.01 + 0.01 + 0.81 + 0.81 + 3.61 + 8.41 = 24.89

    Phương sai: σ2=24.8910=2.489\sigma^2 = \frac{24.89}{10} = 2.489

    Độ lệch chuẩn: σ=2.4891.58\sigma = \sqrt{2.489} \approx 1.58

    7. Các lỗi thường gặp và cách tránh

  • - Nhầm lẫn giữa trung bình và trung vị, đặc biệt với dữ liệu có giá trị ngoại lai.
  • - Tính phương sai, độ lệch chuẩn sai vì quên bình phương độ lệch hoặc quên lấy căn bậc hai.
  • - Không sắp xếp dữ liệu khi tìm trung vị dẫn đến kết quả sai.
  • - Quên xét trường hợp nhiều mốt hoặc không có mốt.
  • 8. Tóm tắt các điểm chính cần nhớ

  • - Thống kê mô tả giúp mô tả đặc trưng của dữ liệu (trung bình, trung vị, mốt, độ phân tán...)
  • - Biết cách tính và ý nghĩa của các đại lượng: số trung bình, trung vị, mốt, phương sai, độ lệch chuẩn.
  • - Chọn đại lượng phù hợp từng loại dữ liệu; thận trọng với các giá trị ngoại lai.
  • - Là cơ sở cho các khái niệm nâng cao hơn như xác suất, thống kê suy luận.
  • T

    Tác giả

    Tác giả bài viết tại Bạn Giỏi.

    Nút này mở form phản hồi nơi bạn có thể báo cáo lỗi, đề xuất cải tiến, hoặc yêu cầu trợ giúp. Form sẽ tự động thu thập thông tin ngữ cảnh để giúp chúng tôi hỗ trợ bạn tốt hơn. Phím tắt: Ctrl+Shift+F. Lệnh giọng nói: "phản hồi" hoặc "feedback".