关键词不能为空

当前您在: 主页 > 数学 >

高中数学知识点总结 统计

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-09-16 12:56
tags:高中数学知识点总结

高中数学必修四 苗金利 精华学校-高中数学共面


高中数学知识点总结 统计
一、三种抽样方法

1.三种抽样方法的比较
类别
简单随
机抽样
是不放回
抽样,抽
系统抽样
样过程
中,每个
个体被抽
到的机会
分层抽样
(概率)相等
共同点 各自特点
从总体中逐个抽取
将总体均分成几部分,按
事先确定的规则,在各部
分抽取
将总体分成几层,分层进
行抽取
相互联系

适用范围
总体中的个
数较少
总体中的个
数比较多
总体由差异
明显的几部
分组成
在起始部分抽样时,
采用简单随机抽样
各层抽样时,采用简
单随机抽样或者系统
抽样
2
.抽样方法的选取方法

(1)
若总体由差异明显的几个层次组成,则选用分层抽样.

(2)
若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.

当总体容量较小时宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法;当
总体容量较大,样 本容量也较大时宜用系统抽样.

特别提醒
利用系统抽样的两个关键步骤:
N
(1)分组,当总体个数N能被样本容量n整除时,分为n个组,分段间隔k=;
n
(2)获取样本用简单随机抽样在第一组抽取起始数s,通常把起始数s加上间隔k得到第
2 个个体编号(s+k),再加上k得第3个个体编号(s+2k),依次进行下去,直到获取样本.
二、用样本估计总体

1
.数字特征

(1)众数、中位数、平均数
数字特征
众数
定义
出现次数最多的数据
与频率分布直方图的关系
最高的小长方形中的某个(些)点的横坐



将数据按大小依次排列,处在最中间位置
的一个数据(或最中间两个数据的平均数)
中位数左边和右边的小长方形的面积和是
相等的
每个小矩形的面积乘以小矩形底边中点的
横坐标之和
中位数
平均数 样本数据的算术平均数
(2)极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
方差:
s
2
?
1
[(x
1
?x)
2
?(x
2
?x)
2< br>???(x
n
?x)
2
]
.
n
标准差:
s?
(3)性质
1
[(x
1
?x)
2
?(x
2
?x)
2
???(x
n
?x)
2
]
.
n
①若
x
1
,x
2
,?,x
n
的平均数为
x
,那么
mx
1
?a,mx
2
?a,?,mx
n
?a
的平均数为
mx?a< br>.
②数据
x
1
,x
2
,?,x
n
与数据
x
1
??x
1
?a,x
2
??x
2
?a,?,x
n
??x
n
?a
的方差相等,即数
据 经过平移后方差不变.
③若
x
1
,x
2
,?,x
n
的方差为s
2
,那么
ax
1
?b,ax
2
?b,?,ax
n
?b
的方差为
a
2
s
2
.
2
.统计表


1
)频率分布的估计:频率分布是指 各个小组数据在样本中所占比例的大小,可以用
样本的频率分布估计总体的频率分布,频率分布表是反映 样本的频率分布的表格.通过
频率分布直方图和频率分布表可以看到样本的频率分布.


2
)尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体
表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图
不同;即使对于 同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布
折线图是随样本容量和分组情况的 变化而变化的,因此不能用样本的频率分布折线图得
到准确的总体密度曲线.


3
)估计总体分布的步骤是:

①选择适当的抽样方法从总体中抽取样本,即收集数据.

②利用样本数据画出统计图或计算数字特征.

③结合统计图分析样本取值的分布规律.


④用样本取值的分布规律估 计总体分布,由于是用科学抽样抽取的样本,那么样本与总
体取值的分布规律近似,有时也可看成相同< br>.
⑤利用总体分布解决有关问题.

(4)各种统计表的优点与不足

频率分布表
频率分布直
方图
频率分布折
线图
优点
表示数据较确切
表示数据分布情况非常直观
不足
分析数据分布的总体态势不方便
原有的具体数据信息被抹掉了
能反映数据的变化趋势
一是所有的信息都可以从这个茎叶图中得到;二
不能显示原有数据
茎叶图 是茎叶图便于记录和表示,能够展示数据的分布
情况
样本数据较多或数据位数较多时,
不方便表示数据
特别提醒
频率分布表、 频率分布直方图、频率分布折线图、总体密度曲线都是描述样本数据分布
情况,估计总体频率分布规律的 ,其联系如下:


三、变量间的相关关系

1
.相关关系

当自变量取值一定时,因变量的取值带有一定的随机性,则这 两个变量之间的关系叫做
相关关系.即相关关系是一种非确定性关系.

当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;

当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关
.
2
.散点图

?,n)
描在平面直角坐标系中,所得图形叫做散将样 本中的
n
个数据点
(x
i
,y
i
)(i?1,2,
点图.



从散点图上看,点散布在从左下角到右上角的区域 内,两个变量的这种相关关系称为正
相关,点散布在从左上角到右下角的区域内,两个变量的相关关系为 负相关.

具有正相关关系的两个变量的散点图如图
1
,具有负相关关系的两 个变量的散点图如图
2.
3
.回归分析

如果散点图中点的分布从 整体上看大致在一条直线附近,则这两个变量之间具有线性相
关关系,这条直线叫做回归直线.

回归直线对应的方程叫做回归直线方程
(
简称回归方程
)


4
.回归方程的求解


1
)求回归方程的方法是最小二乘 法,即使得样本数据的点到回归直线的距离的平方
和最小.

?,n)
,则回 归方若变量
x

y
具有线性相关关系,有
n
个样本数据(x
i
,y
i
)(i?1,2,
?
?
?
?a
?
?bx
?

b

y
?
( x?x)(y?y)
?
xy?nxy
iiii
i?1
nn
?
(x?x)
i
i?1
n
?
2
i?1
n?
x
i?1
?
.
?
?y?bx

a
2
i
?nx
2
x
1
?x
2
??
?x
n
y?y
2
?
?
?y
n
1
n
1
n
,y?
?
y
i
?
1< br>其中
x?
?
x
i
?

(x,y)
称 为样
n
i?1
nn
i?1
n
本点的中心.


2
)线性回归模型
y?bx?a?e
,其中
e
称为随机 误差,自变量
x
称为解释变量,
因变量
y
称为预报变量.

特别提醒
?
?a
①回归直线
y
?
?bx
?
必过样本点的中心
(x,y)
,这个结论既是检验所求回归直线方程
是否准 确的依据,也是求参数的一个依据.


②利用回归直线方程不但可以预测在x
取某一个值时,
y
的估计值,同时也能知道
x

?< br>的变化量.

增加
1
个单位,
y
?
既表示直 线的斜率,又表示自变量
x
的取值每增加一个单位③在回归直线方程中,
b
时 ,函数
y
的改变量.

5
.相关系数


1
)样本相关系数
r
的计算公式

我们可以利用 相关系数来定量地衡量两个变量之间的线性相关关系,计算公式为
r?
?
(x?x)( y?y)
ii
i?1
n
?
(x?x)
?
(y?y)
2
ii
i?1i?1
nn
.
2

2
)样本相关系数
r
的性质


|r|?1


②当
r>0
时,表明两个变量正 相关;当
r<0
时,表明两个变量负相关;


|r|
越接近于
1
,表明两个变量的线性相关性越强;


|r|
越接近于
0
,表明两个变量的线性相关性越弱
.
6
.非线性回归分析

对某些特殊的非线性关系,可以通过变量转换,把非线 性回归问题转化成线性回归问题,
然后用线性回归的方法进行研究.

在大量的实际问 题中,所研究的两个变量不一定都呈线性相关关系,当两变量
y

x

具有线性相关关系时,要借助散点图,与已学过的函数
(
如指数函数、对数函数、幂函
数等
)
的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而
使问题得以解决.

特别提醒
求非线性回归方程的步骤:
①确定变量,作出散点图.
②根据散点图,选择恰当的拟合函数.
③变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方
程.
④分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.
⑤根据相应的变换,写出非线性回归方程.
7.刻画回归效果的方式
方式方法 计算公式 刻画效果


R
2

R
2
?
1?
?
)
?
(
y?y
ii
n
2
?
(y?y)
i
i?1
i?1
n

2
R
2
越接近于1,表示回归的效果越好
残差点比较均匀地落在水平的带状区域
残差图
?
i
称为相应于点< br>(x
i
,y
i
)

e
?
i
?y
i
?y
?
i
残差,
e
中,说明选用的模型比 较合适,其中这样
的带状区域的宽度越窄,说明模型拟合精
确度越高.
残差平方和
?
)
?
(
y?y
ii
i?1
n
2

残差平方和越小,模型的拟合效果越好
四、独立性检验

1
.独立性检验

2
n(ad?bc)
(
其中n?a?b?c?d
利用随机变量
K
2
(
也可表示为
?
)
?
(a?b)(c?d)(a?c)(b?d)
2
为样本容量)
来判断

两个变量有关系

的方法称为独立性检验.

2
.独立性检验的一般步骤

(1)
根据样本数据列出
2?2
列联表;

(2)
计算随机变量
K
2
的观测值
k
,查下表确定临界值
k
0


P(K
2
?k
0
)

0.50

0.455

0.40

0.708

0.25

1.323

0.15

0.100

0.050

0.025


0.010

0.005

0.001


k
0

2.072

2.706

3.841

5.024
6.635

7.879

10.828
(3)如果
k?k
0
, 就推断“X与Y有关系”,这种推断犯错误的概率不超过
PK
2
?k
0

否则,就认为在犯错误的概率不超过
PK
2
?k
0
的前 提下不能推断“X与Y有关系”.
??
??
特别提醒
(1)通常认为
k?2.706
时,样本数据就没有充分的证据显示“X与Y有关系”. (2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能
完全肯定一 个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个
问题下确定性结论,否则就 可能对统计计算的结果作出错误的解释.
(3)
独立性检验是对两个变量有关系的可信程度的 判断,而不是对其是否有关系的判断.

天津高中数学竞赛资料-美国高中数学好


高中数学教师考后分析发言稿-高中数学奥赛那个类型最容易


高中数学竞赛极点极线-刘胖课堂人教版高中数学


可汗学院高中数学课程-教师资格证高中数学难过吗


女生为什么学不好高中数学-高中数学必修4.pdf


抖音上高中数学公式-高中数学复利问题估算


谈谈高中数学文化的认识-高中数学知识点加基础题目


高中数学 不用教材-高中数学公式名称大全



本文更新与2020-09-16 12:56,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/399637.html

高中数学知识点总结 统计的相关文章