关键词不能为空

当前您在: 主页 > 数学 >

高中数学选修2-3人教A教案导学案3.1.1回归分析的基本思想及其初步应用

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-09-19 07:32
tags:高中数学思想方法

高中数学画三视图的软件-高中数学必修五不等式专题讲解

2020年9月19日发(作者:卫觐)



3. 1.1回归分析的基本思想及其初步应用
【教学目标】1.了解回归分析的基本思想方法及其简单应用.
2.会解释解释变量和预报变量的关系.
【教学重难点】
教学重点:回归分析的应用.
?
公式的推到.
?

b
教学难点:
a
【教学过程】
一、设置情境,引入课题
引入:对于一组具有线性相关关系的数据
(x
1< br>,y
1
),(x
2
,y
2
),(x
3
,y
3
),?,(x
n
,y
n
).
其回归直线< br>方程的截距和斜率的最小二乘法估计公式分别为:
?
?y?bx
?

b
?
?
a
?
(x?x)(y?y)
ii
i ?1
n
?
(x?x)
i
i?1
n

2
1
n
1
n
称为样本点的中心。
x?
?
x
i

y?
?
y
i

(x,y)
n
i?1
n
i?1
如何推到着两个计算公式?
二、引导探究,推出公式
?
和斜率
b
?
分别是使
Q(
?
,
?
)?(y?
?
x?
?
)
2
取最小值时从已经学过的知识,截距
a
?
ii
i?1
n
?
,
?
的值,由于
Q(
?
,
?
)?
?
[y
i
?
?
x
i
?(y?
?
x)+(y?
?
x)?
?
]
2
i?1
n
?
?
{[y
i
?
?
x
i
?(y?
?
x)]
2
?2[y
i
?
?
x
i
?(y?
?
x)]
?
[(y?
?
x)?
?
]?[(y?
?
x)?
?
]
2
}
i?1< br>n
2
?
?
[y
i
?
?
x
i
?(y?
?
x)]?2
?
[y
i
?
?x
i
?(y?
?
x)]
?
[(y?
?
x)?
?
]?n(y?
?
x?
?

2
i? 1i?1
n
n
因为
?(y?
?
x?
?

?
[y?
?
x?(y?
?
x)](y?
?
x?
?

?
[y?
?
x?(y?
?
x)]
iiii
i?1i?1
nn
?(y?
?
x?
?)[
?
y
i
?
?
?
x
i
?n (y?
?
x)]?(y?
?
x?
?
)[ny?n
?
x?n(y?
?
x)]?0,
i?1i?1
nn

所以

1



Q(
?

?
)?
?
[y
i
?
?
x
i
?(y ?
?
x)]
2
?n[(y?
?
x)?
?
]
2
i?1
n
?
?
2
?
(x?x)
i
i?1
n
22
?2
?
?
(x
i
?x)(y
i
?y)?
?
(y
i
?y)
2
?n(y?
?
x?
?

i?1i?1
nn
?n(y ?
?
x?
?
)?
?
(x
i
?x)[
?
?
22
i?1
n
?
(x?x)(y?y)
ii
i?1
n
?
(x?x)
i
i?1
n
]?< br>2
[
?
(x
i
?x)(y
i
?y)]
2
i?1
n
2
?
(x?x)
i
i?1
n
2
?
?
(y
i
?y)
2
i?1
n
在上式中,后两项和
?
,
?
无关,而前两项为非负数,因此要使Q取 得最小值,当且仅当前
两项的值均为0.,既有
?
?
?
(x?x) (y?y)
ii
i?1
n
?
(x?x)
i
i?1< br>n

?
?y?
?
x

2
通 过上式推导,可以训练学生的计算能力,观察分析能力,能够很好训练学生数学能力,必
须在老师引导下 让学生自己推出。
?
?y?bx
?

b
?
?
所以:
a
?
(x?x)(y?y)
ii
i?1
n
?
(x?x)
i
i?1
n

2
三、例题应用,剖析回归基本思想与方法
例1、 从某大学中随机选取8名女大学生,其身高和体重的数据如图所示:
编号
身高cm
体重kg
1
165
48
2
165
57
3
157
50
4
170
54
5 6
165
61
7
155
43
8
170
59
175
64
(1) 画出以身高为自变量x,体重为因变量y的散点图
(2) 求根据女大学生的身高预报体重的回归方程
(3) 求预报一名身高为172cm的女大学生的体重
解:(1)由于问题中要求根据身高 预报体重,因此选取身高为自变量x,体重为因变量y作散
点图
?
?0.849,a
?
??85.712
?
b
(2)
?
?回归方程: y?0.849x?85.712.
(3)对于身高172cm的女大学生,由回归方程可以预报体重为 :
?
y?0.849?172?85.712?60.316(kg)

四、当堂练习
观察两相关变量得如下数据

2



x
y
—1
—9
—2
—7
—3
—5
—4
—3
—5
—1
5
1
3
5
4
3
2
7
1
9
求两个变量的回归方程.
答:
?
x?0,y?0,
10
?
x
i?1
10
2
i
?110,
?
x
i
y
i
?110,

i?1
10
?b?
?
xy?10xy
ii
i?1
10
?
x
i
2
?10x
i?1
2
?
110?10?0
?1,a?y?b x?0?0
?
b?0.

110?10?0
y?x
所以所求回归直线方程为
?
五、课堂小结
?

b
?
公式的推到过程。 1.
a
?
?a
?
通过(x,y)

y?bx
2.
?
六、布置作业
课本90页习题1

3



3.1.1回归分析的基本思想及其初步应用
课前预习学案
一、预习目标
n
?
与斜率
b
?< br>分别是使
Q(
?
,
?
)?(y?
?
x??
)
2
取最小值时,求
?
,
?
的值。 通过截距
a
?
ii
i?1
二、预习内容:
1. 对于一组 具有线性相关关系的数据
(x
1
,y
1
),(x
2
,y
2
),(x
3
,y
3
),?,(x
n
,y
n
).
其回归直线方
程的截距和斜率的最小二乘法估计公式:
?
= ,
b
?
=
a
2.
x
= ,
y
=
3.样本点的中心
三、提出问题
如何使
Q(
?
,
?
)
值最小,通过观察分析式子进行试探推到
课内探究学案
一、学习目标
1. 了解回归分析的基本思想和方法
2. 培养学生观察分析计算的能力
二、学习重难点
?
?a
?

y?bx
学习重点:回归方程
?
?
公式的推到
?

b
学习难点:
a
三、学习过程
1.使
Q(
?
,
?
)
值最小时,
?
,
?
值的推到
2.结论
?
?
?
(x?x)(y?y)
ii
i?1
n
?
(x?x)
i
i?1
n

?
?y?
?
x

2
?
?a
?

a
?
的含义是什么
?

b
y?bx
3.
?
4.
(x,y)
一定通过回归方程吗?
四、典型例题
例1.研究某灌溉倒水的流速y与水深x之间的关系,测得一组数据如下:
1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10
水深x(m)

4



流速y(ms)
1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21
(1) 求y与x的回归直线方程;
(2) 预测水深为1.95m时水的流速是多少?
y?0.733x?0.6948
分析:(1)y与x的回归直线方程为
?
(2)当水深为1.95m时,可以预测水的流速约为2.12ms
五、当堂练习
(x1
,y
1
),(x
2
,y
2
),(x
3
,y
3
),?,(x
n
,y
n
).
1. 对两个变量y和x进行回归分析,得到一组样本数据:
则下列说法不正确的是( )
?
?a
?
必过样本中心
(x,y)

y?bxA.由样本数据得到的回归方程
?
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数
R
2
来刻画回归效果,
R
2
越小,说明模型 的拟合效果越好
D.若变量y与x之间的相关系数
r??0.9362
,则变量y与 x之间具有线性相关关系
2.已知某地每单位面积菜地年平均使用氮肥量xkg与每单位面积蔬菜年平 均产量yt之间的关
系有如下数据:
1985 1986 1987 1988 1989 1990 1991 1992
年份
x(kg)
y(t)
年份
x(kg)
y(t)
70
5.1
1993
92
11.5
74
6.0
80
6.8
1994
108
11.0
78
7.8
1995
115
11.8
85
9.0
1996
123
12.2
92
10.2
1997
130
12.5
90
10.0
1998
138
12.8
95
12.0
1999
145
13.0
若x与y之间线性相关,求蔬菜年平均产量y 与使用氮肥量x之间的回归直线方程,并估计
每单位面积蔬菜的年平均产量.(已知
x?101 ,y?10.11,
?
x
i?1
15
2
i
?161 ,
?
x
i
y
i
?16076.8

i?1
15
y?bx?a
,则 解:设所求的回归直线方程为
?

?b?
?
xy?15xyii
i?1
15
15
?
x
i
2
?15 x
i?1
2
?
16076.8?15?101?10.11
?0.0 937,a?y?bx?10.11?0.0937?101?0.6463.
2
161125 ?15?101
y?0.0937x?0.6463
所以,回归直线方程为:
?

5



y?0.0937?150?0.6463?14.701(kg)
当x=150kg时,每单位面积蔬菜的年平均产量
?
课后练习与提高
1、 下表提 供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生
产能耗y(吨标准煤)的 几组对照数据:
x 3 4 5 6
y 2.5 3 4 4.5
(1) 请画出上表数据的散点图;
y?bx?a
; (2) 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程
?
(3) 已知该厂技改前 100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归
方程,预测生产100吨甲产 品的生产能耗比技改前降低多少吨标准煤?
(参考数值:
3?2.5?4?3?5?4?6?4.5?66.5

解:(1)由题设所给数据,可得散点图如下图
(2)由对照数据,计算得:
4< br>3?4?5?62.5?3?4?4.5
x
i
?86,x??4.5,y??3 .5,
已知
?
x
i
y
i
?66.5
?
44
i?1i?1
2
4
所以,由最小二乘法确定的回归方程的 系数为:
b?
?
xy?4x
?
y
ii
i?14
4
?
x
i
2
?4x
i?1
2
?
66.5?4?4.5?3.5
?0.7,a?y?bx?3.5?0.7?4.5?0. 35.

86?4?4.5
2
y?0.7x?0.35
因此,所求的线性回归方程为
?
(4) 由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为

90?(0.7?100?0.35)?19.65
(吨标准煤)

6



3.1.2 回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用
【教学目标】1.了解相关系数r;2 了解随机误差;3 会简单应用残差分析
【教学重难点】
教学重点:相关系数和随机误差
教学难点:残差分析应用。
【教学过程】
一、设置情境,引入课题
上节例题中,身高172cm女大学生,体重一定是60kg吗?如果不是,其原因是什么?
二、引导探究,发现问题,解决问题
?
?0.849
是斜率的估计值,说明 身高x每增加1个单位,体
y?0.849x?85.712
对于
b
1
?
重就 ,表明体重与身高具有 的线性相关关系。
2 如何描述线性相关关系的强弱?
r?
?
(x?x) (y?y)
ii
i?1
n
?
(x?x)
?
(y?y )
2
ii
i?1i?1
nn

2
(1)r>0表明两个变量正相关;(2)r<0表明两个变量负相关;
(3)r的绝对值越接近1,表明相关性越强,r的绝对值越接近0,表明相关性越弱。
(4)当r的绝对值大于0.75认为两个变量具有很强的相关性关系。
3 身高172cm 的女大学生显然不一定体重是60.316kg,但一般可以认为她的体重接近于
60.316kg.
①样本点与回归直线的
②所有的样本点不共线,而是散布在某一条直线的附近,该直线表示身 高与体重的关系的线
性回归模型表示
y?bx?a?
?

y?bx?a
的误差,e为随机变量,e称为随机误差。 e是y与
?
③E(e)=0,D(e)=
?
>0.④D(e)越小,预报真实值y的精度越高。
2
y
与真实值y之间的误差之一。 ⑤随机误差是引起预报值
?
?< br>,b
?
为截距和斜率的估计值,与a,b的真实值之间存在误差,这种误差也引起
?
y
与真实值⑥
a
y之间的误差之一。
4 思考
产生随机误差项e的原因是什么?
y
预报真实值y的误差,它是一个不可观测的量,那么应5 探究在线性回归模型中,e是用
?
该怎样研究随机误差?如何衡量预报的精度?
2
?
?y?
??
?a
?

y
i

ey
i
?y
i
?bx

D(e)?
?
来衡量随机误差的大小。②
e
i
?yi
?
?
iii

7



21
n
?
2
1
??
,b
?
)(n?2)

?
?e?Q(a
?
n?2
i?1
n?2
?
越小,预报精度越高。
?
,b
?
)
称为残差平方和,
?

Q(a
6 思考
当样本容量为1或2时,残差平方和是多少? 用这样的样本建立的线性回归方程的预报误差
为0吗?
7 残差分析
2
①判断原始数据中是否存在可疑数据;②残差图 ③相关指数
R?1?
2< br>y)
?
(y?
?
ii
n
2
?
(y? y)
i
i?1
22
i?1
n

2
④R越大,残差平方和越小,拟合效果越好;R越接近1,表明回归的效果越好。
8 建立回归模型的基本步骤:
①确定研究对象,明确哪个变量时解释变量,哪个变量时预报变量。
②画出确定好的解释变量和预报变量得散点图,观察它们之间的关系;
③由经验确定回归方程的类型;
④按一定规则估计回归方程中的参数;
⑤得出结果后分析残差图是否异常。
三、典型例题
例1 下表是某年美国旧轿车价 格的调查资料,今以x表示轿车的使用年数,y表示响应的年
均价格,求y关于x的回归方程
使用
1
年数x
年均
2651
价格y
(美
元)
2
1943
3
1494
4
1087
5
765
6
538
7
484
8
290
9
226
10
204
分析:由已知表格先画出散点图,可以看出随着使用年数的增加,轿车的平均价格在递减,
但不 在一条直线附近,但据此认为y与x之间具有线性回归关系是不科学的,要根据图的形
状进行合理转化, 转化成线性关系的变量间的关系。
解:作出散点图如下图
可以发现,各点并不是基本处于一 条直线附近,因此,y与x之间应是非线性相关关系.
?
?
?
bxa
??
?ln
?
?
?bx
?
?a
?

y?ey
,则
z
与已学函数图像比较,用来刻画题中模型更为合理,令
z< br>
题中数据变成如下表所示:
x
y
1
7.883
2
7.572
3
7.309
4
6.991
5
6.640
6
6.288
7
6.182
8
5.670
9
5.421
10
5.318 < br>在散点图中可以看出变换的样本点分布在一条直线附近,因此可以用线性回归模型方程拟
合,由表 中数据可得
r??0.996,r?0.75
,认为x与z之间具有线性相关关系,由表中数< br>
8



?
??0.298,a
?
? 8.165,
所以
z
?
?ln
?
?
??0.298 x?8.165
,最后回代
zy
, 据的
b
y?e

?
?0.298x?8.165

四、当堂练习:
1 两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指 数R
2
如下,其
中拟合效果最好的模型是( )
A 模型1的
R?0.98
B 模型2的
R?0.80

C 模型3的
R?0.50
D模型4的
R?0.25

答案 A
五、课堂小结
1 相关系数r和相关指数R
2

2 残差分析
六、作业布置
课本90页习题3
22
22

9



3.1.2回归分析的基本思想及其初步应用回归分析的基本思想及其初步应用
课前预习学案
一、预习目标
1 了解相关系数r和相关指数R
2
2 了解残差分析 3 了解随机误差产生的原因
二、预习内容
1 相关系数r

r?
?
(x?x)(y?y)
ii
i?1
n
?< br>(x?x)
?
(y?y)
2
ii
i?1i?1
nn< br>
2
②r>0表明两个变量 ;r<0表明两个变量 ;r的绝对值越接近1,表明
两个变量相关性 ,r的绝对值越接近0,表示两个变量之间 当r的绝对值大
于 认为两个变量具有很强的相关性关系。
2 随机误差
y?bx?a
①在线性回归模型:
y?bx?a?e
中,a和b为模型的 ,e是y与
?
之间的 ,通常e为随机变量,称为随机误差,它的均值E(e)= ,方
差D(e)=
?
0
②线性回归模型的完整表达式为
?
2
?
y?bx?a?e
?
E(e)?0,D(e)?
?
2
随机 误差e的方差
?
越小,通过回
2
y?bx?a
预报真实值y的精确度 归直线
?
3 残差分析
①残差对于样本点
(x
1
,y1
),(x
2
,y
2
),(x
3
,y
3
),?,(x
n
,y
n
).
而言,相应于它们的随机误差 为
e
i
= = (i=1,2,3,…,n)
?
= = (i=1,2,3,…,n). 称为相应于点
(x,y)
其估算值为
e
i
ii
的残差。
2
?
②残差平方和:类比样本方差估计总体方差的思想,可以用
?
= =
?
?y?bx
?

b
?
?
(n>2)作为
?
的估计量,其中
a
2
?
(x ?x)(y?y)
ii
i?1
n
?
(x?x)
i
i ?1
n
?
,b
?
)
称为残差,
Q(a
2< br>22
??
平方和,可以用
?
衡量回归方程的预报精度,
?越小,预报精度
③用图形来分析残差特性:用
R?1?
来刻画回归的效果。
2

10



三、提出问题
1 随机误差产生的原因是什么?
2如何建立模型拟合效果最好?
课内探究学习
一、学习目标
1 了解相关系数和相关指数的关系.
2 理解随机误差产生的原因.3
3 会进行简单的残差分析
二、学习重难点
学习重点 1 相关系数r 2相关指数R
2
3 随机误差
学习难点 残差分析的应用
三、学习过程
1 相关系数r=
2 r的性质:
3 随机误差的定义:
4相关指数R
2
=
5 R
2
的性质:
6 残差分析的步骤:
四、典型例题
例 随着我国经济的快速发展,城乡居民的审核水平不断提高,为研究某市家庭 平均收入与
月平均生活支出的关系,该市统计部门随机调查10个家庭,得数据如下:
1 2 3 4 5 6 7 8 9 10
家庭编号
x收入(千元)
y支出千元
0.8
0.7
1.1
1.0
1.3
1.2
1.5
1.0
1.5
1.3
1.8
1.5
2.0
1.3
2.2
1.7
2.4
2.0
2.8
2.5
(1) 判断家庭平均收入与月平均生活支出是否相关?
(2) 若二者线性相关,求回归直线方程。
思路点拨:利用散点图观察收入x和支出y是否 线性相关,若呈现线性相关关系,可利用公
式来求出回归系数,然后获得回归直线方程。
解:作散点图
观察发现各个数据对应的点都在一条直线附近,所以二者呈现线性相关关系。
(2)
x?
1
(0.8?1.1?1.3?1.5?1.5?1.8?2. 0?2.2?2.4?2.8)?1.74,

10
y?
1
(0.7 ?1.0?1.2?1.0?1.3?1.5?1.3?1.7?2.0?2.5)?1.42,
10
?b?
?
xy?nxy
ii
i?1
n
n< br>?
x
i
2
?nx
i?1
2
?0.8136, a?1.42?1.74?0.0043.

y?0.8136x?0.0043
所以回归方程
?
五、当堂练习

11



1 山东鲁洁棉业公式的可按人员在7块并排形状大小相同的试验田上对某棉花新品种进行
施化 肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg)
施化肥量x
15 20 25 30 35 40 45
产量y
330 345 365 405 445 450 455
(1) 画出散点图;
(2) 判断是否具有相关关系
思路点拨 (1)散点图如图所示
(2)由散点图可知,各组数据对应点大致都在一条直线附近,所以施化肥量x 与产量y具
有线性相关关系.
六、课后练习与提高
1 在对两个变量x、y进行线性回归分析时有下列步骤:
①对所求出的回归方程作出解释;②收集数据< br>(x
i
,y
i
),i?1,2,?,n
;③求线性回归方程; ④
求相关系数;⑤根据所搜集的数据绘制散点图。如果根据可靠性要求能够作出变量x、y具
有 线性相关结论,则在下列操作顺序中正确的是( )
A ①②⑤③④ B ③②④⑤① C ②④③①⑤ D ②⑤④③①
2 三点(3,10),(7,20),(11,24)的线性回归方程为( )
y?1.75x?5.75
B
?
y?1.75x?5.75
C
?
y??1.75x?5.75
D
?
y??1.75x?5.75
A
?
y?a?bx
中,回归系数b ( ) 3 对有线性相关关系的两个变量建立的回归直线方程
?
A.可以大于0 B 大于0 C 能等于0 D只能小于0
y?256?2x
,表明( ) 4 废品率
x
0
0
和每吨生铁成本y(元)之间的回归直线方程为
?
A 废品率每增加
1
0
0
,生铁成本增加258元; B废品率每增加
1
0
0
,生铁成本增加2元;
C废品率每增加1
0
0
,生铁成本每吨增加2元;D废品率不变,生铁成本增加256元;
答案 1 D 2 B 3 A 4 C

12

2019高中数学全国联赛一等奖-高中数学老师兼职出题


高中数学掌握道例题-高中数学选修1-1第三章常考题目


2008全国高中数学联赛-学高中数学的感悟800字


高中数学符号lg-高中数学必修三教师用书学科网


高中数学网络补课-高中数学竞赛及答案


刘荣老师中山高中数学-高中数学评高级职称考试试题


高中数学选修回归方程基本原理-高中数学选修有几个


高中数学为什么那么难感觉听不懂-高中数学竞赛177分



本文更新与2020-09-19 07:32,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/404053.html

高中数学选修2-3人教A教案导学案3.1.1回归分析的基本思想及其初步应用的相关文章

高中数学选修2-3人教A教案导学案3.1.1回归分析的基本思想及其初步应用随机文章