高中数学必修四 苗金利 精华学校-高中数学共面
高中数学知识点总结 统计
一、三种抽样方法
1.三种抽样方法的比较
类别
简单随
机抽样
是不放回
抽样,抽
系统抽样
样过程
中,每个
个体被抽
到的机会
分层抽样
(概率)相等
共同点 各自特点
从总体中逐个抽取
将总体均分成几部分,按
事先确定的规则,在各部
分抽取
将总体分成几层,分层进
行抽取
相互联系
—
适用范围
总体中的个
数较少
总体中的个
数比较多
总体由差异
明显的几部
分组成
在起始部分抽样时,
采用简单随机抽样
各层抽样时,采用简
单随机抽样或者系统
抽样
2
.抽样方法的选取方法
(1)
若总体由差异明显的几个层次组成,则选用分层抽样.
(2)
若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当
总体容量较大,样
本容量也较大时宜用系统抽样.
特别提醒
利用系统抽样的两个关键步骤:
N
(1)分组,当总体个数N能被样本容量n整除时,分为n个组,分段间隔k=;
n
(2)获取样本用简单随机抽样在第一组抽取起始数s,通常把起始数s加上间隔k得到第
2
个个体编号(s+k),再加上k得第3个个体编号(s+2k),依次进行下去,直到获取样本.
二、用样本估计总体
1
.数字特征
(1)众数、中位数、平均数
数字特征
众数
定义
出现次数最多的数据
与频率分布直方图的关系
最高的小长方形中的某个(些)点的横坐
标
将数据按大小依次排列,处在最中间位置
的一个数据(或最中间两个数据的平均数)
中位数左边和右边的小长方形的面积和是
相等的
每个小矩形的面积乘以小矩形底边中点的
横坐标之和
中位数
平均数
样本数据的算术平均数
(2)极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:
s
2
?
1
[(x
1
?x)
2
?(x
2
?x)
2<
br>???(x
n
?x)
2
]
.
n
标准差:
s?
(3)性质
1
[(x
1
?x)
2
?(x
2
?x)
2
???(x
n
?x)
2
]
.
n
①若
x
1
,x
2
,?,x
n
的平均数为
x
,那么
mx
1
?a,mx
2
?a,?,mx
n
?a
的平均数为
mx?a<
br>.
②数据
x
1
,x
2
,?,x
n
与数据
x
1
??x
1
?a,x
2
??x
2
?a,?,x
n
??x
n
?a
的方差相等,即数
据
经过平移后方差不变.
③若
x
1
,x
2
,?,x
n
的方差为s
2
,那么
ax
1
?b,ax
2
?b,?,ax
n
?b
的方差为
a
2
s
2
.
2
.统计表
(
1
)频率分布的估计:频率分布是指
各个小组数据在样本中所占比例的大小,可以用
样本的频率分布估计总体的频率分布,频率分布表是反映
样本的频率分布的表格.通过
频率分布直方图和频率分布表可以看到样本的频率分布.
(
2
)尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体
表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图
不同;即使对于
同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布
折线图是随样本容量和分组情况的
变化而变化的,因此不能用样本的频率分布折线图得
到准确的总体密度曲线.
(
3
)估计总体分布的步骤是:
①选择适当的抽样方法从总体中抽取样本,即收集数据.
②利用样本数据画出统计图或计算数字特征.
③结合统计图分析样本取值的分布规律.
④用样本取值的分布规律估
计总体分布,由于是用科学抽样抽取的样本,那么样本与总
体取值的分布规律近似,有时也可看成相同<
br>.
⑤利用总体分布解决有关问题.
(4)各种统计表的优点与不足
频率分布表
频率分布直
方图
频率分布折
线图
优点
表示数据较确切
表示数据分布情况非常直观
不足
分析数据分布的总体态势不方便
原有的具体数据信息被抹掉了
能反映数据的变化趋势
一是所有的信息都可以从这个茎叶图中得到;二
不能显示原有数据
茎叶图
是茎叶图便于记录和表示,能够展示数据的分布
情况
样本数据较多或数据位数较多时,
不方便表示数据
特别提醒
频率分布表、
频率分布直方图、频率分布折线图、总体密度曲线都是描述样本数据分布
情况,估计总体频率分布规律的
,其联系如下:
三、变量间的相关关系
1
.相关关系
当自变量取值一定时,因变量的取值带有一定的随机性,则这
两个变量之间的关系叫做
相关关系.即相关关系是一种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;
当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关
.
2
.散点图
?,n)
描在平面直角坐标系中,所得图形叫做散将样
本中的
n
个数据点
(x
i
,y
i
)(i?1,2,
点图.
从散点图上看,点散布在从左下角到右上角的区域
内,两个变量的这种相关关系称为正
相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为
负相关.
具有正相关关系的两个变量的散点图如图
1
,具有负相关关系的两
个变量的散点图如图
2.
3
.回归分析
如果散点图中点的分布从
整体上看大致在一条直线附近,则这两个变量之间具有线性相
关关系,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程
(
简称回归方程
)
.
4
.回归方程的求解
(
1
)求回归方程的方法是最小二乘
法,即使得样本数据的点到回归直线的距离的平方
和最小.
?,n)
,则回
归方若变量
x
与
y
具有线性相关关系,有
n
个样本数据(x
i
,y
i
)(i?1,2,
?
?
?
?a
?
?bx
?
中
b
程
y
?
(
x?x)(y?y)
?
xy?nxy
iiii
i?1
nn
?
(x?x)
i
i?1
n
?
2
i?1
n?
x
i?1
?
.
?
?y?bx
,
a
2
i
?nx
2
x
1
?x
2
??
?x
n
y?y
2
?
?
?y
n
1
n
1
n
,y?
?
y
i
?
1<
br>其中
x?
?
x
i
?
,
(x,y)
称
为样
n
i?1
nn
i?1
n
本点的中心.
(
2
)线性回归模型
y?bx?a?e
,其中
e
称为随机
误差,自变量
x
称为解释变量,
因变量
y
称为预报变量.
特别提醒
?
?a
①回归直线
y
?
?bx
?
必过样本点的中心
(x,y)
,这个结论既是检验所求回归直线方程
是否准
确的依据,也是求参数的一个依据.
②利用回归直线方程不但可以预测在x
取某一个值时,
y
的估计值,同时也能知道
x
每
?<
br>的变化量.
增加
1
个单位,
y
?
既表示直
线的斜率,又表示自变量
x
的取值每增加一个单位③在回归直线方程中,
b
时
,函数
y
的改变量.
5
.相关系数
(
1
)样本相关系数
r
的计算公式
我们可以利用
相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为
r?
?
(x?x)(
y?y)
ii
i?1
n
?
(x?x)
?
(y?y)
2
ii
i?1i?1
nn
.
2
(
2
)样本相关系数
r
的性质
①
|r|?1
;
②当
r>0
时,表明两个变量正
相关;当
r<0
时,表明两个变量负相关;
③
|r|
越接近于
1
,表明两个变量的线性相关性越强;
④
|r|
越接近于
0
,表明两个变量的线性相关性越弱
.
6
.非线性回归分析
对某些特殊的非线性关系,可以通过变量转换,把非线
性回归问题转化成线性回归问题,
然后用线性回归的方法进行研究.
在大量的实际问
题中,所研究的两个变量不一定都呈线性相关关系,当两变量
y
与
x
不
具有线性相关关系时,要借助散点图,与已学过的函数
(
如指数函数、对数函数、幂函
数等
)
的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而
使问题得以解决.
特别提醒
求非线性回归方程的步骤:
①确定变量,作出散点图.
②根据散点图,选择恰当的拟合函数.
③变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方
程.
④分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.
⑤根据相应的变换,写出非线性回归方程.
7.刻画回归效果的方式
方式方法
计算公式 刻画效果
R
2
R
2
?
1?
?
)
?
(
y?y
ii
n
2
?
(y?y)
i
i?1
i?1
n
2
R
2
越接近于1,表示回归的效果越好
残差点比较均匀地落在水平的带状区域
残差图
?
i
称为相应于点<
br>(x
i
,y
i
)
的
e
?
i
?y
i
?y
?
i
残差,
e
中,说明选用的模型比
较合适,其中这样
的带状区域的宽度越窄,说明模型拟合精
确度越高.
残差平方和
?
)
?
(
y?y
ii
i?1
n
2
残差平方和越小,模型的拟合效果越好
四、独立性检验
1
.独立性检验
2
n(ad?bc)
(
其中n?a?b?c?d
利用随机变量
K
2
(
也可表示为
?
)
?
(a?b)(c?d)(a?c)(b?d)
2
为样本容量)
来判断
“
两个变量有关系
”
的方法称为独立性检验.
2
.独立性检验的一般步骤
(1)
根据样本数据列出
2?2
列联表;
(2)
计算随机变量
K
2
的观测值
k
,查下表确定临界值
k
0
:
P(K
2
?k
0
)
0.50
0.455
0.40
0.708
0.25
1.323
0.15
0.100
0.050
0.025
0.010
0.005
0.001
k
0
2.072
2.706
3.841
5.024
6.635
7.879
10.828
(3)如果
k?k
0
,
就推断“X与Y有关系”,这种推断犯错误的概率不超过
PK
2
?k
0
;
否则,就认为在犯错误的概率不超过
PK
2
?k
0
的前
提下不能推断“X与Y有关系”.
??
??
特别提醒
(1)通常认为
k?2.706
时,样本数据就没有充分的证据显示“X与Y有关系”. (2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能
完全肯定一
个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个
问题下确定性结论,否则就
可能对统计计算的结果作出错误的解释.
(3)
独立性检验是对两个变量有关系的可信程度的
判断,而不是对其是否有关系的判断.
天津高中数学竞赛资料-美国高中数学好
高中数学教师考后分析发言稿-高中数学奥赛那个类型最容易
高中数学竞赛极点极线-刘胖课堂人教版高中数学
可汗学院高中数学课程-教师资格证高中数学难过吗
女生为什么学不好高中数学-高中数学必修4.pdf
抖音上高中数学公式-高中数学复利问题估算
谈谈高中数学文化的认识-高中数学知识点加基础题目
高中数学 不用教材-高中数学公式名称大全
-
上一篇:高中数学知识点总结课标大纲
下一篇:(完整版)高中数学数列知识点总结(经典)