高中数学教材经典题目-江西省高中数学资料
第一章统计案例
第一课时
1.1
回归分析的基本思想及其初步应用(一)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用
教学重点:了解线性回归模型与函数模型的差异,了解判断刻画模型拟合效果的方法-相关指
数和残差分析
?
教学难点:解释残差变量的含义,了解偏差平方和分解的思想
教学过程:
一、复习准备:
1.
提问:名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这
两者之间是否有
关?
2.
复习:函数关系是一种确定性关系,而相关关系是一种非确定性关系
关关系的两个变量进行统计分析的一种常用方法,其步骤:收集数据
线方程
利用方程进行预报
.
.
回归分析是对具有相
作散点图 求回归直
二、讲授新课:
1.
教学例题:
①
例
1
从某大学中随机选取
8
名女大学生,其身高和体重数据如下表所示:
编号
身高
cm
体重
kg
1
165
48
2
165
57
3
157
50
4
170
54
5
175
64
6
165
61
7
155
43
8
170
59
求根据一名女大学生的身高预报她的体重的回归方程,
并预报一名身高为
172cm
的女大学生的
体重
.
(分析思路
教师演示 学生整理)
计算器得:
重
体
<7=-85.712,
I ---- S = 0.S43 ”
当X = 172时
F
j- 0.343x172-85.712
=60 31
&优或 Q
一故绽性回归方程:
身高cm
第一步:作散点图
--------- > 第二步:求回归方程 ---------------
二A
第三步:代值计算
1 34
②
提问:身高为
172cm
的女大学生的体重一定是
60.316kg
吗?
不一定,但一般可以认为她的体重在
③ 解释线性回归模型与一次函数的不同
事实上,观察上述散点图,我们可以发现女大学生的体重
函数
y bx
a
来严格刻画(因为所有的样本点不共线,
60.316kg
左右
.
y
和身高
x
之间的关系并不能用一次
所以线性模型只能近似地刻画身高和体
重的关系)
.
在数据表中身高为165cm
的
3
名女大学生的体重分别为
48kg
、
57kg
和
61kg
,如
果能用一次函数来
描述体重与身高的关系,
那么身高为
165cm
的
3
名女在学生的体重应相同
.
这
就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果
变量)引入到线性函数模型中,得到线性回归模型
不能由身高的线性函数解释的所有部分
e
(即残差变量或随机
y bx a
e
,其中残差变量
e
中包含体重
.
当残差变量恒等于
0
时,线性回归模型就变成一次函
数模型
.
因此,一次函数模型是
线性回归模型的特殊形式,线性回归模型是一次函数模型的一 般形式
.
2.
关系越强,它们的散点图越
相关系数:相关系数的绝对值越接近于
1
,两
个变量的线性相关
接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是
有意义
.
3?
小结:求线性回归方程的步骤、线性回归模型与一次函数的不同
第二课时 1.1回归分析的基本思想及其初步应用(二)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用
教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和
教学难点:了解评价回归效
果的三个统计量:总偏差平方和、残差平方和、回归平方和 教学过程:
一、复习准备:
1
?由例
1
知,预报变量(体重)的值受解释变量(身高)或随机误差的影响
2
?为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与
随机误差有关?我
们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平
方和
?
二、讲授新课:
1.
教学总偏差平方和、残差平方和、回归平方和:
n
(
1
)总偏差平方和:所有单个样本值与样本均值差的平方和,即
SST
(y
i
寸.
i 1 n
2 34
残差平方和:回归值与样本值差的平方和,即
SSE (y
屮
)
2
.
i 1
n
回归平方和:相应回归值与样本均值差的平方和,即
SSR (y
j
y)
2
.
i 1
(
2
)学习要领:
①注意
y
、
y
j
、
~y
的区别;②预报变量的变化
程度可以分解为由解释变量引
n _ n n _
起的变化程度与残差变量的变化程度之和,即
(比
y)
2
i 1
(y
i
y
j
)
2
i
1
(y
j
y)
2
;③当总
i 1
偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;
n
④
(y
i
y,)
2
来刻画回归的效果,它表
对于多个不同的模型,我们还可以引入相关指数
R
2
1
冷
(y
y)
2
i 1
示解释变量对预报变量变化的贡献率
的效果越好
?
?
R
2
的值越大,说明残差平方和越小,也就是说模型拟合
2.
教学例题:
例
2
关于
x
与
Y
有如下数据:
x 2
30
4
40
5
60
6
50
8
70
y
为了对
x
、
Y
两个变量进
行统计分析,现有以下两种线性模型:
y 6.5x 17.5 , $$ 7x 17
,
试比较哪一个模型拟合的
效果更好
.
分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两
种模型下的相关指数,然后再进行比较,从而得出结论
5 5
(答案:
& 此
)
2
155
(% 屮)
2
180
R
;
1
詈
-
1000 '
-
1000
(y
i
y)
1 5
2
5
2
1
一
0.845
,
R
2
1
弋
(y
i
y)
1
——0.82
,
84.5%
>
82%
,所以甲选
用的模型拟合效果较好
.
)
3.
小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合
3
34
效果的好坏
第三课时
1.1回归分析的基本思想及其初步应用(三)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用
教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解
决实际问题的过程中
寻找更好的模型的方法
?
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模
型进行比较
.
教学过程:
一、复习准备:
1.
据列于下表中,试建
立
y
与
x
之间的回归方程
温度
x
°
C
产卵数
y
个
给出例
3
: —只红铃虫的产卵数
y
和温度
x
有关,现收集了
7
组观测数
21
7
23
11
25
21
27
24
29
66
32
115
35
325
(学生描述步骤,教师演示)
2.
讨论:观察右图中的散点图,发现样本点并没有分布在某
个带状区域内,即两个变量不呈线性相关关系,所以不能直接
用线性回归方
程来建立两个变量之间的关系
二、讲授新课:
数
卵
产
.
温度
1.
探究非线性回归方程的确定:
①
如果散点图中的点分布在一个直线状带形区域, 可以选线性回归模型来建模; 如果散点图中
的点分布在一个曲线状带形区域,就需选择非线性回归模型来建模
②
根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线
y=G
e
C
X
的周围(其中
2
c
1,c
2
是待定的参数),故可用指数函数模型来拟合这两个变量
.
③
在上式两边取对数,得
In y C
2
X In?
,再令
z
In y
,则
z C
2
X In
G
,而
z
与
x
间的关系
如下:
------------------------------
X
4
34
X
Z
21
1.946
23 25 27 29 32 35
2.398 3.045
3.178 4.190 4.745 5.784
观察
z
与
x
的
散点图,可以发现变换后样本点分布在一条直线的附近,因此可以用线性回归方 程来拟合
?
④利用计算器算得
a 3.843,b
0.272
,
z
与
x
间的线性回归方程为
Z
0.272x 3.843
,因此
红铃虫的产卵数对温度的非线性回归方程为
⑤
利用回归方程探究非线性回归问题,可按
e
0.272X 3.843
作散点图 建模 确定方程”这三个步骤进行
其关键在于如何通过适当的变换,将非线性回归问题转化成线性回归问题
2.
小结:用回归方程探究非线性回归问题的方法、步骤
三、巩固练习:
为了研究某种细菌随时间
x
变化,繁殖的个数,收集数据如下:
天数
X
天
繁殖个数
y
个
1
6
2
12
3
25
4
49
5
95
6
190
(1)
用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
(2)
性回归方程为
试求出预报变量对解释变量的回归方程
.
(答案:所求非线
?=e
0.69x 1.112
.
)
第四课时 1.1回归分析的基本思想及其初步应用(四)
教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用
教学重点:通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解
决实际问题的过程中
寻找更好的模型的方法,了解可用残差分析的方法,比较两种模型的拟合
效果
.
教学难点:了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模
型进行比较
.
教学过程:
一、复习准备:
1.
中,观察散点图,我们选择用指数函数模型来拟合红铃虫的产卵数
间的关系,还可用其它函数模型来拟合吗?
提问:在例
3
y
和温度
x
5 34
2
2.
讨论:能用二次函数模型
y
C
3
X C
4
t
441 529 625
11 21
729 841 1024
24 66 115
1225
325
y
7
来拟 合上述两个 变量间的关 系吗?(令
t
X
2
,则
y C
3
t
C
4
,
此时
y
与
t
间的关系如下:
观察
y
与
t
的散点图,可以发现样本点并不分布在一条
直线的周
围,因此不宜用线性回归方程来拟合它,即不
宜用二次曲线
y
C
3
X
2
C
4
来拟合
y
与
x<
br>之间的关系
.
)小结:也就是说,我们可以通过观察变
换后的散点图来判断能否用此种模型来拟合
?
事实上,除了观察散点图以外,我们也可先求出
函数模型,然后利用残差分析的方法来比较模型的好坏
二、讲授新课:
1.
教学残差分析:
① 残差:样本值与回归值的差叫残差,即
申%
屮
.
判断原始数据中是否存在可疑数据, 这方面的 ②
残差分析:通过残差来判断模型拟合的效果,
分析工作称为残差分析
.
③
残差图:以残差为横坐标,以样本编号,或身高数据,或体重估计值等为横坐标,作出的图 形称为残差图
.
观
察残差图,如果残差点比较均匀地落在水平的带状区域中,说明选用的模型
比较合适,这样的带状区域的宽度越
窄,模型拟合精度越高,回归方程的预报精度越高
2.
例
3
中的残差分析:
计算两种模型下的残差
艾4
214
23
P
11^
-0 167^
2
屛
2
ZW
-9 14
如
354J
严
e Q
e
中
E
1 760^
-5.8354J
115*
-14153Q
325*
32.
77.965-
1
4Z693P 13.3P7P -41.003P -40 107^
-58J68P
一般情况下,比较两个模型的残差比较困难(某些样本点上一个模型的残差的绝对值比另
一个模型的小,而另一些样本点的情况则相反),故通过比较两个模型的残差的平方和的大小来
判断模型的拟合效
果
.
残差平方和越小的模型,拟合的效果越好
由于两种模型下的残差平方和分别为
效果远远优于选用二次函数模型
.
1450.673
和
15448.432
,故选用指数函数模型的拟合
.
(当然,还可用相关指数刻画回归效果)
6 34
3.
小结:残差分析的步骤、作用
7 34