高中数学笔试教师资格证视频百度云-高中数学重点五个必修
统计
一、三种抽样方法
1.三种抽样方法的比较
类别
共同点 各自特点 相互联系
适用
范围
总体
简单随
机抽样
从总体中逐个抽取 —
中的
个数
较少
是不放回
抽样,抽
系统抽样
样过程
中,每个
个体被抽
到的机会
(概率)相
等
分层抽样
将总体分成几层,分层
进行抽取
各层抽样
将总体均分成几部分,
按事先确定的规则,在
各部分抽取
在起始部
分抽样时,
采用简单
随机抽样
总体
中的
个数
比较
多
总体
由差
时,采用简异明
单随机抽
样或者系
统抽样
显的
几部
分组
成
2.抽样方法的选取方法
(1)若总体由差异明显的几个层次组成,则选用分层抽样.
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
当总体容量较小时
宜用抽签法;当总体容量较大,样本容量较小时宜用随机
数表法;当总体容量较大,样本容量也较大时宜
用系统抽样.
特别提醒
利用系统抽样的两个关键步骤:
(1)分组,当总体
个数
N
能被样本容量
n
整除时,分为
n
个组,分段间隔k
=
N
;
n
(2)获取样本用简单随机抽样在
第一组抽取起始数
s
,通常把起始数
s
加上间
隔
k
得到第2个个体编号(
s
+
k
),再加上
k
得第3个个体编
号(
s
+2
k
),依次进
行下去,直到获取样本.
二、用样本估计总体
1.数字特征
(1)众数、中位数、平均数
数字特
征
众数
定义 与频率分布直方图的关系
最高的小长方形中的某个(些)点
的横坐标
中位数左边和右边的小长方形的
面积和是相等的
每个小矩形的面积乘以小矩形底
边中点的横坐标之和
出现次数最多的数据
将数据按大小依次排列,处在最中
中位数
间位置的一个数据(或最中间两个
数据的平均数)
平均数 样本数据的算术平均数
(2)极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
1
方差:
s
2
?[(x
1
?x)
2
?(x
2
?x)
2
?
n
?(x
n
?x)
2
]
.
?(x
n
?x)
2
]
.
标准差:
s?
(3)性质
①若
x
1
,x
2
,
1
[(x
1
?x)
2
?(x
2
?x)
2
?
n
,x
n
的平均数为
x
,那么
mx
1
?a,mx
2
?a,,mx
n
?a
的平均
数为
mx?a
.
②数据
x
1
,x
2
,,
x
n
与数据
x
1
??x
1
?a,x
2??x
2
?a,,x
n
??x
n
?a
的方差相
等,
即数据经过平移后方差不变.
③若
x
1
,x
2
,,x
n
的方差为
s
2
,那么
ax
1
?
b,ax
2
?b,,ax
n
?b
的方差为
a
2s
2
.
2.统计表
(1)频率分布的估计:频率分布
是指各个小组数据在样本中所占比例的大
小,可以用样本的频率分布估计总体的频率分布,频率分布表是
反映样本的
频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分
布. <
br>(2)尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道
它的具体表达形式,
需要用样本来估计.由于样本是随机的,不同的样本得
到的频率分布折线图不同;即使对于同一个样本,
不同的分组情况得到的频
率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变化而变化的,因此不能用样本的频率分布折线图得到准确的总体密度曲线.
(3)估计总体分布的步骤是:
①选择适当的抽样方法从总体中抽取样本,即收集数据.
②利用样本数据画出统计图或计算数字特征.
③结合统计图分析样本取值的分布规律. ④用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那
么样本与总体取值的分布
规律近似,有时也可看成相同.
⑤利用总体分布解决有关问题.
(4)各种统计表的优点与不足
频率分布
表
频率分布
直方图
频率分布
折线图
优点
表示数据较确切
不足
分析数据分布的总体态势不
方便
原有的具体数据信息被抹掉
了
不能显示原有数据
表示数据分布情况非常直观
能反映数据的变化趋势
一是所有的信息都可以从这个茎叶图
茎叶图
中得到;二是茎叶图便于记录和表示,
能够展示数据的分布情况
特别提醒
样本数据较多或数据位数较
多时,不方便表示数据
频率分
布表、频率分布直方图、频率分布折线图、总体密度曲线都是描述样
本数据分布情况,估计总体频率分布
规律的,其联系如下:
三、变量间的相关关系
1.相关关系
当自变量
取值一定时,因变量的取值带有一定的随机性,则这两个变量之间
的关系叫做相关关系.即相关关系是一
种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正
相关;
当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负
相关.
2.散点图
将样本中的
n
个数据点
(x
i
,y<
br>i
)(i?1,2,,n)
描在平面直角坐标系中,所得图形
叫做散点图.
从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关
关系称为
正相关,点散布在从左上角到右下角的区域内,两个变量的相关关
系为负相关.
具有正相关关
系的两个变量的散点图如图1,具有负相关关系的两个变量的
散点图如图2.
3.回归分析
如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程(简称回归方程).
4.回归方程的求解
(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距
离的平方和最小.
若变量
x
与
y
具有线性相关关系,有
n
个样本数据
(x
i
,y
i
)(i?1,2,,n)
,则回
?<
br>?
?
?a
?
?bx
?
中
b
归方程<
br>y
?
(x?x)(y?y)
?
xy?nxy
iiii
i?1
nn
?
(x?x)
i
i?1
n
?
2
i?1
n
?
x
i?1
?
.
?
?
y?bx
,
a
2
i
?nx
2
?y
n
x
1
?x
2
?
1
n
其中
x?
?
x
i
?
n
i?1
n
?x
n
y?y
2
?
1
n
,
y?
?
y
i
?
1
n
i?1
n
,
(x,y)
称为样
本点
的中心.
(2)线性回归模型
y?bx?a?e
,其中
e
称为随机
误差,自变量
x
称为解释变
量,因变量
y
称为预报变量.
特别提醒
?
?a
?
?bx
?
必过样本点的中心<
br>(x,y)
,这个结论既是检验所求回归①回归直线
y
直线方程是否准确的依据
,也是求参数的一个依据.
②利用回归直线方程不但可以预测在
x
取某一个值时,<
br>y
的估计值,同时也
?
的变化量. 能知道
x
每增加1个单位
,
y
?
既表示直线的斜率,又表示自变量
x
的取值每增③在回归直线
方程中,
b
加一个单位时,函数
y
的改变量.
5.相关系数
(1)样本相关系数
r
的计算公式
我们可以利用相关系数来定量地衡量两个
变量之间的线性相关关系,计算公
式为
r?
?
(x?x)(y
?y)
ii
i?1
n
?
(x?x)
?
(y?y)<
br>2
ii
i?1i?1
nn
.
2
(2)样本相关系数
r
的性质
①
|r|?1
;
②当
r
>0时,表明两个变量正相关;当
r
<0时,表明两个变量负
相关;
③|
r
|越接近于1,表明两个变量的线性相关性越强;
④|
r
|越接近于0,表明两个变量的线性相关性越弱.
6.非线性回归分析
对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成
线
性回归问题,然后用线性回归的方法进行研究.
在大量的实际问题中,所研究的两个变量不
一定都呈线性相关关系,当两变
量
y
与
x
不具有线性相关关系时,要
借助散点图,与已学过的函数(如指数函
数、对数函数、幂函数等)的图象相比较,找到合适的函数模型
,利用变量
代换转化为线性函数关系,从而使问题得以解决.
特别提醒
求非线性回归方程的步骤:
①确定变量,作出散点图.
②根据散点图,选择恰当的拟合函数.
③变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出
线性回归方程.
④分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.
⑤根据相应的变换,写出非线性回归方程.
7.刻画回归效果的方式
方式方法
计算公式
?
)
?
(
y?y
ii
n
2刻画效果
R
2
R
2
?
1?
?(y?y)
i
i?1
i?1
n
2
R
2
越接近于1,表示回归的效果越好
残差点比
较均匀地落在水平的带状区
?
i
称为相应于点
(x
i
,y<
br>i
)
e
残差图
?
i
?
i
?
y
i
?y
的残差,
e
域中,说明选用的模型比较合适,
其中
这样的带状区域的宽度越窄,说明模型
拟合精确度越高.
残差平方和
四、独立性检验
1.独立性检验
?
(
y
i?1
n
i
?
i
)
2
?y
残差平方和越小,模型的拟合效果越好
2
n(ad?bc)
利
用随机变量
K
2
(也可表示为
?
)
?
(其中
(a?b)(c?d)(a?c)(b?d)
2
n?a?b?c?
为样本容量
d
)来判断“两个变量有关系”的方法称为独立性检
验.
2.独立性检验的一般步骤
(1)根据样本数据列出
2?2
列联表; (2)计算随机变量
K
2
的观测值
k
,查下表确定临界值
k
0
:
P(K
2
?k
0
)
0.50
0.40
0.25
0.15
0.1000.0500.0250.0100.0050.001
k
0
0.4550.7081.3232.0722.7063.8415
.0246.6357.87910.828
(3)如果
k?k
0
,就推断“
X
与
Y
有关系”,这种推断犯错误的概率不超
过
P
?
K
2
?k
0
?
;否则,就认为在犯
错误的概率不超过
P
?
K
2
?k
0
?
的前
提下不能
推断“
X
与
Y
有关系”.
特别提醒
(
1)通常认为
k?2.706
时,样本数据就没有充分的证据显示“
X
与Y
有关
系”.
(2)独立性检验得出的结论是带有概率性质的,只能说结论成立
的概率有多
大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要
注意这
点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出
错误的解释.
(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有
关系的判断.
河北高中数学竞赛初试-高中数学竞赛几何定理都有哪些
高中数学外心内心怎么求-高中数学解三角形最值
百度网盘高中数学+郭化楠-北师大版高中数学贴吧
北师大高中数学选修1 1课后答案-骐骥教育高中数学精编答案
高中数学教论-高中数学教学解决策略研究
华师大二附中高中数学教材-全国高中数学能力竞赛高二试题及答案
高中数学零点求法-华南师范大学出版社 高中数学 学习与评价 广州市中学数学教学研究会
宁乡高中数学老师招聘-吉林省高中数学竞赛复赛
-
上一篇:高中数学知识点巧记
下一篇:(完整版)高中数学集合知识点