如何会做高中数学题-高中数学的内容提纲
第一章 统计案例
一、回归分析的基本思想及其初步应用
1、数学变量相关关系
的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不
确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系.
(1)按方向分类
?正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是
从左下角到右上角的区域,即一个
变量的值由小变大时,另一个变量的值也由小变大。
?负相
关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个
变
量的值由小变大时,另一个变量的值由大变小。
正相关
负相关 不相关
(2)相关性系数r(在《必修3》中有介绍)
用相关系数r来衡量两个变量之间的相关关系
r?
?
?
x?x
??
y
i
i?1
n
i
?y
?
?
2
?
?
i?1
n
x
i
?x
?
?<
br>?
2
i?1
n
y
i
?y
2、两变量之间的关系存在两种不同的类型
(1)相关关系——非确定性关系
(2)函数关系——确定性关系
3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。
其基本步骤是:①画出两个变量的散点图;
②求回归直线方程;
③并用回归直线方程进行预报。
4、回归直线方程:
y?bx?a
nn
?
?<
br>?
?
(x
i
?x)(y
i
?y)
?
x
i
y
i
?nxy
i?1
?
?
i?1n
,
?
b?
n
2
?
(x
i
?x)
2
x
i
2
?nx
??
?
i
?1i?1
??
?
?
a?y?bx
?
???
说明:
?
1
?
回归系数b?0.因为当b?0时,相关系数r?0,这时
不具有线性相关关系.
?
2
?
?
x,y
?
称为样本点的中心,回归直线必定经过样本点的中心.
例如:
4、线性回归模型用
y?bx?a?e来表示,其中a和b为模型的未知参数,e称为随机误差.
残差:e?y
i
?y
5、相关指数
R
是用来刻画回归效果的,
R
2
?1?
2
?
?
y
i
?y
i
?
?
?
y?y
?
i
i?1
i?1
n
n
2
2
R
2
越大,残差平方和越小,模
型的拟合效果就越好。
二、独立性检验的基本思想及其初步应用
1、列联表
假设有
两个分类变量
X和Y,它们的值域分另为{x
1
,
x
2
}和{y
1
, y
2
},其样本频数列联表为:
x
1
x
2
总计
y
1
a
c
a+c
y
2
b
d
b+d
总计
a+b
c+d
a+b+c+d
n
?
ad?bc
?
2
2、随机变
量K=,其中n?a?b?c?d为样本容量.
?
a?b
??
c?d
??
a?c
??
b?d
?
2
3、独立性检验
(1)利用随机变量
K
来判断“两个分类变
量有关系”的方法称为独立性检验,并且能较精确地给出这种判断的
可靠程度。
(2)具体的
做法是,由表中的数据算出随机变量K
2
的值。K
2
的值越大,说明“X与Y
有关系”成立的可能性越大。
下表k是观测值,概率P为犯错误的概率。
P(K
2
?k)
0.50
2
0.40
0.708
0.25
1.323
0.15
2.072
0.10
2.706
0.05
3.841
0.025
5.024
0.010
6.635
0.005
7.879
0.001
10.828
k
例如:
0.455
4、利用列联表直接计算发现 和
相差很大,就判断两个分类变量之间有关系
。
a
a?b
c
c?d