关键词不能为空

当前您在: 主页 > 数学 >

统计-高中数学知识点总结

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-09-15 07:15
tags:高中数学知识点

高中数学笔试教师资格证视频百度云-高中数学重点五个必修


统计
一、三种抽样方法
1.三种抽样方法的比较
类别 共同点 各自特点 相互联系
适用
范围
总体
简单随
机抽样
从总体中逐个抽取 —
中的
个数
较少
是不放回
抽样,抽
系统抽样 样过程
中,每个
个体被抽
到的机会
(概率)相

分层抽样
将总体分成几层,分层
进行抽取
各层抽样
将总体均分成几部分,
按事先确定的规则,在
各部分抽取
在起始部
分抽样时,
采用简单
随机抽样
总体
中的
个数
比较

总体
由差
时,采用简异明
单随机抽
样或者系
统抽样
显的
几部
分组

2.抽样方法的选取方法
(1)若总体由差异明显的几个层次组成,则选用分层抽样.
(2)若总体没有差异明显的层次,则考虑采用简单随机抽样或系统抽样.
当总体容量较小时 宜用抽签法;当总体容量较大,样本容量较小时宜用随机
数表法;当总体容量较大,样本容量也较大时宜 用系统抽样.
特别提醒
利用系统抽样的两个关键步骤:
(1)分组,当总体 个数
N
能被样本容量
n
整除时,分为
n
个组,分段间隔k


N

n
(2)获取样本用简单随机抽样在 第一组抽取起始数
s
,通常把起始数
s
加上间

k
得到第2个个体编号(
s

k
),再加上
k
得第3个个体编 号(
s
+2
k
),依次进
行下去,直到获取样本.
二、用样本估计总体
1.数字特征
(1)众数、中位数、平均数
数字特

众数
定义 与频率分布直方图的关系
最高的小长方形中的某个(些)点
的横坐标
中位数左边和右边的小长方形的
面积和是相等的
每个小矩形的面积乘以小矩形底
边中点的横坐标之和
出现次数最多的数据
将数据按大小依次排列,处在最中
中位数 间位置的一个数据(或最中间两个
数据的平均数)
平均数 样本数据的算术平均数
(2)极差、方差和标准差
极差:即一组数据中最大值与最小值的差.
1
方差:
s
2
?[(x
1
?x)
2
?(x
2
?x)
2
?
n
?(x
n
?x)
2
]
.
?(x
n
?x)
2
]
. 标准差:
s?
(3)性质
①若
x
1
,x
2
,
1
[(x
1
?x)
2
?(x
2
?x)
2
?
n
,x
n
的平均数为
x
,那么
mx
1
?a,mx
2
?a,,mx
n
?a
的平均 数为
mx?a
.
②数据
x
1
,x
2
,, x
n
与数据
x
1
??x
1
?a,x
2??x
2
?a,,x
n
??x
n
?a
的方差相 等,
即数据经过平移后方差不变.
③若
x
1
,x
2
,,x
n
的方差为
s
2
,那么
ax
1
? b,ax
2
?b,,ax
n
?b
的方差为
a
2s
2
.


2.统计表
(1)频率分布的估计:频率分布 是指各个小组数据在样本中所占比例的大
小,可以用样本的频率分布估计总体的频率分布,频率分布表是 反映样本的
频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分
布. < br>(2)尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道
它的具体表达形式, 需要用样本来估计.由于样本是随机的,不同的样本得
到的频率分布折线图不同;即使对于同一个样本, 不同的分组情况得到的频
率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变化而变化的,因此不能用样本的频率分布折线图得到准确的总体密度曲线.
(3)估计总体分布的步骤是:
①选择适当的抽样方法从总体中抽取样本,即收集数据.
②利用样本数据画出统计图或计算数字特征.
③结合统计图分析样本取值的分布规律. ④用样本取值的分布规律估计总体分布,由于是用科学抽样抽取的样本,那
么样本与总体取值的分布 规律近似,有时也可看成相同.
⑤利用总体分布解决有关问题.
(4)各种统计表的优点与不足

频率分布

频率分布
直方图
频率分布
折线图
优点
表示数据较确切
不足
分析数据分布的总体态势不
方便
原有的具体数据信息被抹掉

不能显示原有数据
表示数据分布情况非常直观
能反映数据的变化趋势
一是所有的信息都可以从这个茎叶图
茎叶图 中得到;二是茎叶图便于记录和表示,
能够展示数据的分布情况
特别提醒
样本数据较多或数据位数较
多时,不方便表示数据



频率分 布表、频率分布直方图、频率分布折线图、总体密度曲线都是描述样
本数据分布情况,估计总体频率分布 规律的,其联系如下:

三、变量间的相关关系
1.相关关系
当自变量 取值一定时,因变量的取值带有一定的随机性,则这两个变量之间
的关系叫做相关关系.即相关关系是一 种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正
相关;
当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负
相关.
2.散点图
将样本中的
n
个数据点
(x
i
,y< br>i
)(i?1,2,,n)
描在平面直角坐标系中,所得图形
叫做散点图.

从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关
关系称为 正相关,点散布在从左上角到右下角的区域内,两个变量的相关关
系为负相关.
具有正相关关 系的两个变量的散点图如图1,具有负相关关系的两个变量的


散点图如图2.
3.回归分析
如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程(简称回归方程).
4.回归方程的求解
(1)求回归方程的方法是最小二乘法,即使得样本数据的点到回归直线的距
离的平方和最小.
若变量
x

y
具有线性相关关系,有
n
个样本数据
(x
i
,y
i
)(i?1,2,,n)
,则回
?< br>?
?
?a
?
?bx
?

b
归方程< br>y
?
(x?x)(y?y)
?
xy?nxy
iiii
i?1
nn
?
(x?x)
i
i?1
n
?
2
i?1
n
?
x
i?1
?
.
?
? y?bx

a
2
i
?nx
2
?y
n
x
1
?x
2
?
1
n
其中
x?
?
x
i
?
n
i?1
n
?x
n
y?y
2
?
1
n
,
y?
?
y
i
?
1
n
i?1
n

(x,y)
称为样
本点 的中心.
(2)线性回归模型
y?bx?a?e
,其中
e
称为随机 误差,自变量
x
称为解释变
量,因变量
y
称为预报变量.
特别提醒
?
?a
?
?bx
?
必过样本点的中心< br>(x,y)
,这个结论既是检验所求回归①回归直线
y
直线方程是否准确的依据 ,也是求参数的一个依据.
②利用回归直线方程不但可以预测在
x
取某一个值时,< br>y
的估计值,同时也
?
的变化量. 能知道
x
每增加1个单位 ,
y
?
既表示直线的斜率,又表示自变量
x
的取值每增③在回归直线 方程中,
b
加一个单位时,函数
y
的改变量.
5.相关系数
(1)样本相关系数
r
的计算公式
我们可以利用相关系数来定量地衡量两个 变量之间的线性相关关系,计算公


式为
r?
?
(x?x)(y ?y)
ii
i?1
n
?
(x?x)
?
(y?y)< br>2
ii
i?1i?1
nn
.
2
(2)样本相关系数
r
的性质

|r|?1

②当
r
>0时,表明两个变量正相关;当
r
<0时,表明两个变量负 相关;
③|
r
|越接近于1,表明两个变量的线性相关性越强;
④|
r
|越接近于0,表明两个变量的线性相关性越弱.
6.非线性回归分析
对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成 线
性回归问题,然后用线性回归的方法进行研究.
在大量的实际问题中,所研究的两个变量不 一定都呈线性相关关系,当两变

y

x
不具有线性相关关系时,要 借助散点图,与已学过的函数(如指数函
数、对数函数、幂函数等)的图象相比较,找到合适的函数模型 ,利用变量
代换转化为线性函数关系,从而使问题得以解决.
特别提醒
求非线性回归方程的步骤:
①确定变量,作出散点图.
②根据散点图,选择恰当的拟合函数.
③变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出
线性回归方程.
④分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.
⑤根据相应的变换,写出非线性回归方程.
7.刻画回归效果的方式
方式方法 计算公式
?
)
?
(
y?y
ii
n
2刻画效果
R
2

R
2
?
1?
?(y?y)
i
i?1
i?1
n

2
R
2
越接近于1,表示回归的效果越好


残差点比 较均匀地落在水平的带状区
?
i
称为相应于点
(x
i
,y< br>i
)
e
残差图
?
i

?
i
?
y
i
?y
的残差,
e
域中,说明选用的模型比较合适, 其中
这样的带状区域的宽度越窄,说明模型
拟合精确度越高.
残差平方和
四、独立性检验
1.独立性检验
?
(
y
i?1
n
i
?
i
)
2

?y
残差平方和越小,模型的拟合效果越好
2
n(ad?bc)
利 用随机变量
K
2
(也可表示为
?
)
?
(其中
(a?b)(c?d)(a?c)(b?d)
2
n?a?b?c?
为样本容量
d
)来判断“两个变量有关系”的方法称为独立性检
验.
2.独立性检验的一般步骤
(1)根据样本数据列出
2?2
列联表; (2)计算随机变量
K
2
的观测值
k
,查下表确定临界值
k
0

P(K
2
?k
0
)
0.50

0.40

0.25

0.15

0.1000.0500.0250.0100.0050.001


k
0

0.4550.7081.3232.0722.7063.8415 .0246.6357.87910.828

(3)如果
k?k
0
,就推断“
X

Y
有关系”,这种推断犯错误的概率不超 过
P
?
K
2
?k
0
?
;否则,就认为在犯 错误的概率不超过
P
?
K
2
?k
0
?
的前 提下不能
推断“
X

Y
有关系”.
特别提醒
( 1)通常认为
k?2.706
时,样本数据就没有充分的证据显示“
X
Y
有关
系”.
(2)独立性检验得出的结论是带有概率性质的,只能说结论成立 的概率有多
大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要
注意这 点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出


错误的解释.
(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有
关系的判断.

河北高中数学竞赛初试-高中数学竞赛几何定理都有哪些


高中数学外心内心怎么求-高中数学解三角形最值


百度网盘高中数学+郭化楠-北师大版高中数学贴吧


北师大高中数学选修1 1课后答案-骐骥教育高中数学精编答案


高中数学教论-高中数学教学解决策略研究


华师大二附中高中数学教材-全国高中数学能力竞赛高二试题及答案


高中数学零点求法-华南师范大学出版社 高中数学 学习与评价 广州市中学数学教学研究会


宁乡高中数学老师招聘-吉林省高中数学竞赛复赛



本文更新与2020-09-15 07:15,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/396116.html

统计-高中数学知识点总结的相关文章