I. Các số đặc trưng đo xu thế trung tâm của mẫu số liệu
Các số đặc trưng đo xu thế trung tâm là các giá trị số biểu thị "trung tâm" hoặc "điểm đại diện" của một tập hợp dữ liệu. Những số này giúp chúng ta có cái nhìn tổng quát về dữ liệu. Dưới đây là các số đặc trưng đo xu thế trung tâm phổ biến:
1. Trung bình cộng
- Khái niệm: Trung bình cộng (hay gọi đơn giản là trung bình) là giá trị được tính bằng cách cộng tất cả các giá trị trong một tập hợp dữ liệu lại và chia cho số lượng các giá trị.
- Công thức:
\[ \overline{x} = \frac{\sum_{i=1}^n x_i}{n} \]
trong đó \(x_i\) là các giá trị của mẫu số liệu và \(n\) là số lượng giá trị.
- Ưu điểm: Đơn giản, dễ tính toán, phù hợp với dữ liệu không có giá trị ngoại lệ.
- Nhược điểm: Dễ bị ảnh hưởng bởi các giá trị ngoại lệ.
2. Trung vị
- Khái niệm: Trung vị là giá trị nằm ở vị trí chính giữa khi các giá trị được sắp xếp theo thứ tự tăng dần (hoặc giảm dần). Nếu số lượng giá trị là lẻ, trung vị là giá trị ở giữa. Nếu là số chẵn, trung vị là trung bình cộng của hai giá trị giữa.
- Ưu điểm: Không bị ảnh hưởng bởi các giá trị ngoại lệ, phù hợp với dữ liệu phân bố không đối xứng.
- Ví dụ: Với tập hợp số liệu \(1, 3, 5, 7, 9\), trung vị là 5.
3. Mốt
- Khái niệm: Mốt là giá trị xuất hiện nhiều nhất trong một tập hợp dữ liệu.
- Ưu điểm: Phù hợp cho dữ liệu định tính và các tập dữ liệu có giá trị trùng lặp nhiều.
- Nhược điểm: Có thể không tồn tại hoặc có nhiều hơn một giá trị mốt.
- Ví dụ: Với tập hợp số liệu \(1, 2, 2, 3, 4\), mốt là 2.
II. Các số đặc trưng đo mức độ phân tán của mẫu số liệu
Các số đặc trưng đo mức độ phân tán cho biết dữ liệu phân tán hoặc biến đổi như thế nào so với xu thế trung tâm. Dưới đây là một số số đo mức độ phân tán phổ biến:
1. Độ lệch chuẩn
- Khái niệm: Độ lệch chuẩn đo lường mức độ phân tán của các giá trị trong một tập dữ liệu so với trung bình cộng.
- Công thức:
\[ \sigma = \sqrt{\frac{\sum_{i=1}^n (x_i - \overline{x})^2}{n}} \]
trong đó \(x_i\) là các giá trị của mẫu số liệu, \(\overline{x}\) là trung bình cộng và \(n\) là số lượng giá trị.
- Ưu điểm: Cung cấp cái nhìn tổng quát về độ biến thiên của dữ liệu. Thường được sử dụng trong các phân tích thống kê.
- Nhược điểm: Bị ảnh hưởng bởi các giá trị ngoại lệ.
2. Phương sai
- Khái niệm: Phương sai là bình phương của độ lệch chuẩn, biểu thị mức độ biến đổi của các giá trị so với trung bình.
- Công thức:
\[ \text{Var}(X) = \frac{\sum_{i=1}^n (x_i - \overline{x})^2}{n} \]
- Ưu điểm: Dễ tính toán, giúp so sánh độ phân tán giữa các tập dữ liệu.
- Nhược điểm: Đơn vị đo của phương sai là bình phương của đơn vị gốc, nên khó giải thích trực quan.
3. Khoảng biến thiên
- Khái niệm: Khoảng biến thiên là sự chênh lệch giữa giá trị lớn nhất và nhỏ nhất trong một tập dữ liệu.
- Công thức:
\[ \text{Range} = \text{Max} - \text{Min} \]
- Ưu điểm: Dễ tính toán và hiểu.
- Nhược điểm: Không phản ánh đầy đủ mức độ phân tán nếu có các giá trị ngoại lệ.
4. Độ lệch trung bình
- Khái niệm: Độ lệch trung bình là trung bình của các giá trị tuyệt đối của độ lệch so với trung bình cộng.
- Công thức:
\[ \text{MAD} = \frac{\sum_{i=1}^n |x_i - \overline{x}|}{n} \]
- Ưu điểm: Dễ hiểu và không bị ảnh hưởng quá nhiều bởi các giá trị ngoại lệ.
- Nhược điểm: Không được sử dụng phổ biến trong các phân tích thống kê nâng cao.
5. Ứng dụng trong lĩnh vực thực tế
- Kinh tế: Sử dụng độ lệch chuẩn để đánh giá mức độ biến động của giá cổ phiếu.
- Y học: Tính trung bình cộng và độ lệch chuẩn của các thông số sinh học để đánh giá tình trạng sức khỏe.
- Giáo dục: Sử dụng trung bình và phương sai để đánh giá mức độ chênh lệch điểm số giữa các học sinh.
Việc hiểu và áp dụng đúng các số đặc trưng này giúp chúng ta có thể phân tích, so sánh và đưa ra các kết luận chính xác dựa trên dữ liệu thực tế.