Thông tin tài liệu:
Bài giảng Giới thiệu về thống kê DEPOCEN: Chương 3 - Tóm tắt và mô tả số liệu trình bày về các đại lượng hướng tâm (trung bình, trung vị, Mod, phân vị, trung bình khoảng); các đại lượng biến thiên (biên độ, khoảng tứ vị phân, phương sai, độ lệch chuẩn, hệ số biến thiên); dạng đồ thị.
Nội dung trích xuất từ tài liệu:
Bài giảng Giới thiệu về thống kê DEPOCEN: Chương 3 - Tóm tắt và mô tả số liệu
Giới thiệu về thống kê
DEPOCEN
Chương 3
Tóm tắt và mô tả số liệu
Các chủ đề
• Các đại lượng hướng tâm: trung
bình, trung vị, Mod, phân vị, trung bình
khoảng.
• Các đại lượng biến thiên: biên độ,
khoảng tứ vị phân, phương sai, độ lệch
chuẩn, hệ số biến thiên
• Dạng đồ thị: đối xứng, nhọn, sử dụng
hộp và phần đuôi.
Các đại lượng
Các đại lượng
Hướng tâm Phân vị Biến thiên
Trung Mod
bình Trung vị Biên độ Hệ số biến
thiên
Phương sai
trung bình
khoảng
Độ lệch chuẩn
Các đại lượng hướng tâm
Các đại lượng
hướng tâm
Trung bình Trung vị Mod
n
xi Trung
i 1
n bình
khoảng
Trung bình
•Là trung bình số học của số liệu:
x
n
xi xi x2 xn
i 1
Sample Mean
n n
•Hầu hết là hướng tâm
• Bị ảnh hưởng bởi yếu tố ngoại lai
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Mean = 5 Mean = 6
Đặc trưng chính của trung bình:
1. Yêu cầu một khoảng giá trị xác định.
2. Sử dụng tất cả các giá trị.
3. Là duy nhất.
4. Tổng độ sai lệch tính từ trung bình
đến các giá trị bằng 0.
Minh họa tính chất 4:
xét các số liệu có giá trị: 3, 8, 4 và có
trung bình là 5.
( X X ) (3 5) (8 5) (4 5) 0
Bài toán
Tính trung bình độ tuổi của học sinh?
Học sinh Tần xuất
0 đến 10 3
10 đến 20 8
20 đến 30 16
30 đến 40 10
40 đến 50 9
50 đến 60 4
Tổng 50
Trung bình của một nhóm số
liệu
Trung bình của một mẫu số liệu được
cho ở dạng bảng phân phối tần xuất
được tính như sau:
Xf
X
n
Trong đó: f là tần số
Trung vị
•Là một đại lượng hướng tâm quan trọng
•Trong một mảng có thứ tự, trung vị là số
“ở giữa”:
•Nếu n chẵn, trung vị là số ở chính giữa.
•Nếu n lẻ, trung vị là trung bình của hai số
nằm
chính giữa.
•Không bị ảnh hưởng bởi giá trị ngoại lai
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Median = 5 Median = 5
Mod
• Là một đại lượng hướng tâm
• Là giá trị xuất hiện nhiều nhất
• Không bị ảnh hưởng bởi giá trị ngoại lai
• Có thể có hoặc không có Mod
• Có thể có một vài Mod
• Được sử dụng với số liệu hoặc biến định tính
0 1 2 3 4 5 6
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
No Mode
Mode = 9
Trung bình khoảng
•Là một đại lượng hướng tâm
•Là trung bình của giá trị lớn nhất và nhỏ
nhất quan sát được.
x l arg est xsmallest
Midrange
2
•Bị ảnh hưởng bởi giá trị ngoại lai
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 10
10 Midrange = 5 Midrange = 5
Điểm phân vị
• Không là đại lượng hướng tâm
• Chia khoảng số liệu có thứ tự làm 4 phần bằng nhau
25% 25% 25% 25%
Q1 Q2 Q3
i(n+1)
Qi 4
•Vị trí điểm phân vị thứ i:
Dãy số liệu: 11 12 13 16 16 17 18 21
22
Vị trí Q1 = 1•(9 + 1) = 2.50 Q1 =12.5
4
Các đại lượng biến thiên
2
2 xi x
...