作业3参考答案
1. 有一考试成绩分布,其平均数为71,中数79。问这是一个正态分布,还是正偏态,负偏态?
平均数容易受到极端数值的影响,而本题中平均数比中数小,所以极端数值在较小的数值部分,也就是说尾巴在左边,那么这是一个负偏态。
2. 对于下面的三种情况,请指出能最佳描述其“平均”值的集中量数(平均数、中数、众数)。
(1) 样本为50个6岁儿童,关于他们最喜欢看的电视节目的研究。
因变量是一个命名量度,所以只能选用众数作为集中量数的指标。
(2) 研究某饮食计划对病人的影响,记录6周后他们增加或减少的体重。
因变量是比例量度,而且并未表明数据中可能产生极端值,用平均数描述较好。
(3) 一项关于动机的研究,要求被试在报纸中搜索单词“disicipline”。研究者记录被试在找到单词或放弃前所用的时间(单位,分钟)。样本n=20,平均数M=29分钟,中数17分钟,众数为15分钟。
平均数与中数和众数的差异很大,说明在分布中有极端数值,所以用中数表示集中趋势比较合适。
3. 对下面的数据
3,4,4,1,7,3,2,6,4,2,1,6,3,4,5,2,5,4,3,4
(1) 画次数分布直方图

(2) 指出这组数据的全距(提示:你可以使用全距公式或者只要从直方图的X轴数一下即可。)
全距:7.5-0.5=7
(3)指出这组数据的四分位距和四分差。
解法一:要寻找处于25%和75%的点,先将数据从小到大排列如下:
1 1 2 2 2 3 3 3 3 4 4 4 4 4 4 5 5 6 6 7
↑ ↑ ↑
25% (50%) 75%
由排列好的数据可见,25%tile,即Q1位于2和3之间,故Q1=2.5;同理Q3=4.5
因此,四分位距(IQR)=4.5-2.5=2,
四分差(SIQR)=1
解法二:
|
X |
F |
P(%) |
CP(%) |
|
7 |
1 |
5 |
100 |
|
6 |
2 |
10 |
95 |
|
5 |
2 |
10 |
85 |
|
4 |
6 |
30 |
75 |
|
3 |
4 |
20 |
45 |
|
2 |
3 |
15 |
25 |
|
1 |
2 |
10 |
10 |
|
Total |
20 |
100 |
|
25%tile Q 1 = 2.5
75%tile Q 3 = 4.5
IQR = 4.5 - 2.5 = 2
SIQR = 1
4.一个样本 n=25,样本方差 s2=
100
(1) 求样本标准差s=sqroot(100)=10
(2) 求样本和方SS SS=(n-1) s2 =100*(25-1)=2400
5. 下列分数构成一个总体:
8, 5, 3, 7, 5, 6, 4, 7, 2, 6
5, 3, 6, 4, 5, 7, 8, 6, 5, 6
(1) 绘制次数分布直方图

(2) 在图中粗略估计分布的均值和标准差
估计的均值为(8-2+1)/2+1.5=5.0
标准差约为 (8.5-1.5)/4=1.75
(3) 计算该总体的均值和标准差, 与粗略估计的值
m= (2*1+3*2+4*2+5*5+6*5+7*3+8*2)/(1+2+2+5+5+3+2)=5.4
SS=Σx2 –(Σx) 2 / N=634-(108) 2 /20=50.8
σ2 =SS/N=2.54
σ=sqrt(2.54)=1.59
估计的均值和标准差与实际值比较接近
6‚ 计算下列样本分数 SS, 方差, 和标准差:
431, 432, 435, 432, 436, 431, 434
(1+2+5+2+6+1+4)/7=3
μ=430+3=433
SS=Σ(x-μ) 2 =4+1+4+1+9+4+1=24
s2 =SS/(n-1)=4
s=sqrt(4)=2
p.s.请大家注意是数据是样本还是总体。 |