关键词不能为空

当前您在: 主页 > 数学 >

高中数学选修2-3优质学案:3.1 回归分析的基本思想及其初步应用

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-09-19 07:40
tags:高中数学思想方法

高中数学文科大题第一道-教学资格证考试高中数学

2020年9月19日发(作者:康月天)


高中数学选修2-3学案

3.1 回归分析的基本思想及其初步应用
[学习目标] 1.了解随机误差、残差、残差图的概念.2.会通过分析残差判断线性回归模型的拟< br>合效果.3.掌握建立线性回归模型的步骤.

[知识链接]
1.什么叫回归分析?
答 回归分析是对具有相关关系的两个变量进行统计分析的一种方法.
2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?
答 不一定是真实值,利 用线性回归方程求的值,在很多时候是个预报值,例如,人的体重
与身高存在一定的线性关系,但体重除 了受身高的影响外,还受其他因素的影响,如饮食、
是否喜欢运动等.

1


高中数学选修2-3学案
[预习导引]
1.线性回归模型
(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系.
(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
(3)对于一组 具有线性相关关系的数据(x
1
,y
1
),(x
2
,y2
),…,(x
n
,y
n
),回归直线的斜率和截
n< br>?x
i

i

1
x??y
i
-y?
x?
2

?
x
i
y
i
-nx y
i

1
n
n
^
距的最小二乘估计公式分别为b=
i

1
n
?x
i

^^
,a=y -bx,其中
2
?
x
2
i
-nx
i
1
(x,y)称为样本点的中心.
(4)线性回归模型y=bx+a+e,其中a和b是 模型的未知参数,e称为随机误差,自变量x
称为解释变量,因变量y称为预报变量.
2.残差的概念
对于样本点(x
1
,y
1
),(x
2
,y
2
),…,(x
n
,y
n
)而言,它们的 随机误差为e
i
=y
i
-bx
i
-a,i=1,2,…,< br>^^^^^
n,其估计值为e
i
=y
i
-y
i
=y
i
-bx
i
-a,i=1,2,…,n,e
i
称为相 应于点(x
i
,y
i
)的残差.
3.刻画回归效果的方式
(1)残差图法
作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值 等,这样作出
的图形称为残差图.在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模
型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高.
(2)残差平方和法 < br>^
残差平方和
n
(y
i
-y
i
)
2
,残差平方和越小,模型拟合效果越好.
i

1
(3)利用R
2
刻画回归效果
^
n
?y
i
-y
i
?
2
i

1R
2
=1-
n
?y
i

i

1
y?
2
;R
2
表示解释变量对于预报变量变化的贡献率.R
2
越接近于1,表示回归
的效果越好.

2


高中数学选修2-3学案

要点一 求线性回归方程
例1 某班5名学生的数学和物理成绩如下表:
学生
学科
数学成绩(x)
物理成绩(y)
(1)画出散点图;
(2)求物理成绩y对数学成绩x的线性回归方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
解 (1)散点图如图.
A
88
78
B
76
65
C
73
71
D
66
64
E
63
61

1
(2)x=×(88+76+73+66+63)=73.2,
5

3


高中数学选修2-3学案
1
y=×(78+65+71+64+61)=67.8.
5
?
x
i
y
i
=88×78+76×65+73×71+66×64+63×61= 25054.
i

1
5
5
22222
?
x
2
i
=88+76+73+66+63=27174.
i
1
?
x
i
y
i
-5xy
^
所以b=< br>i

1
5
5
?
x
i
2
-5 x
i

1
25054-5×73.2×67.8

27174-5×73.2
2
2
≈0.625.
^^
a=y-bx≈67.8-0.625×73.2=22.05.
^
所以y对x的线性回归方程是y=0.625x+22.05.
^
(3)x=96,则y=0.625×96+22.05≈82,
即可以预测他的物理成绩是82.
规律方法 (1)散点图是定义在具有相关关系的两个变量 基础上的,对于性质不明确的两组数
据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后 再进行相关回归分析.
(2)求线性回归方程,首先应注意到,只有在散点图大致呈线性时,求出的线 性回归方程才有
实际意义,否则,求出的线性回归方程毫无意义.
跟踪演练1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
x
y
6
2
8
3
10
5
12
6
(1)请画出上表数据的散点图(要求:点要描粗);
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)试根据求出的线性回归方程,预测记忆力为9的同学的判断力.
解 (1)如图:
^^^

4


高中数学选修2-3学案

(2)
i
∑x
i
y
i
=6×2+8×3+10×5+12× 6=158,

1
x=
y=
n
n
6+8+10+ 12
=9,
4
2+3+5+6
=4,
4
i
=< br>1
^
2222
∑x
2
i
=6+8+10+12=34 4,
158-4×9×4
14
b===0.7,
20
344-4×9
2
a=y-bx=4-0.7×9=-2.3,
故线性回归方程为y=0.7x-2.3.
(3)由(2)中线性回归方程当x=9时,y= 0.7×9-2.3=4,预测记忆力为9的同学的判断力约
为4.
要点二 线性回归分析
例2 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物体进行测量,数据如下表所示:
x
y
5
7.25
10
8.12
15
8.95
20
9.90
25
10.9
30
11.8
^
^
^^
(1)作出散点图并求线性回归方程;
(2)求出R
2;

(3)进行残差分析.
解 (1)散点图如图

5


高中数学选修2-3学案

1
x=(5+10+15+20+25+30)=17.5,
6
1
y=(7.25+8.12+8.95+9.90+10.9+11.8)≈9.487,
6
6
2
x
i
=2275,x
i
y
i
=107 6.2

i
1
i

1
?
6
?< br>^^
计算得,b≈0.183,a≈6.285,
^
所求线性回归方程为y=0.183x+6.285.
(2)列表如下:
^
y
i
-y
i

y
i
-y
0.05
-2.24
0.005
-1.37
-0.08
-0.54
-0.045
0.41
0.04
1.41
0.025
2.31
^
所以
6
(y
i
-y
i
)
2
≈0.01318,
6
(y
i
-y)
2
=14.6784.
i

1
i

1
0.01318
所以,R
2
=1-≈0.9991,
14.6784
回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个 样本点的残差比较大,需要确认在采集这个数据的时候
是否有人为的错误,如果有的话,需要纠正数据, 重新建立回归模型;由表中数据可以看出
残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中 ,说明选用的线性回归模型的精
度较高,由以上分析可知,弹簧长度与拉力成线性关系.
规律方法 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,
^^ ^
是否可以用线性回归模型来拟合数据.然后,通过残差e
1
,e
2
,…,e
n
来判断模型拟合的效果,
判断原始数据中是否存在可疑数据.若残差点比较 均匀地分布在水平带状区域内,带状区域

6


高中数学选修2-3学案
越窄,说明模型拟合精度越高,回归方程预报精度越高.
跟踪演练2 关于x与y有如下数据:
x
y
2
30
4
40
5
60
6
50
8
70
^^
为 了对x,y两个变量进行统计分析,现有以下两种线性模型:甲:y=6.5x+17.5,乙:y=
7 x+17,试比较哪个模型拟合的效果更好.
解 由题意得y=50.
由甲模型可得yi
-y
i
与y
i
-y的关系如下表:
y
i
-y
i

y
i
-y
5^5
^
^
-0.5
-20
-3.5
-10
10
10
-6.5
0
0.5
20
∴∑ (y
i
-y
i
)
2
=155,
i
∑ (y
i
-y)
2
=1000,

1i

1
∴R
2

=1-
155
=1-=0.845.
1000
2
∑ ?y
i
-y?
i

1i

1
5
^
∑ ?y
i
-y
i
?
2
5^
由乙模型可得y
i
-y
i
与y
i
-y的关系如下表:
y
i
-y
i

y
i
-y
5
2
∴∑ (y
i
-y
i
)=180,
i


1i

1
2
∑ ?y
i
-y
i
?

i1
5^
5^
^
-1
-20
-5
-10
8
10
-9
0
-3
20
(y
i
-y)
2
=1000,
∴R
2

=1-
180
=1-=0.82.
5
1000
2
∑ ?y
i
-y?
i
1
2
∵0.845>0.82,∴R
2

>R


∴甲模型的拟合效果比乙模型的拟合效果好.
要点三 非线性回归分析
例3 下表为收集到的一组数据:
x
y
21
7
23
11
25
21
27
24
29
66
32
115
35
325
(1)作出x与y的散点图,并猜测x与y之间的关系;
(2)建立x与y的关系,预报回归模型并计算残差;
(3)利用所得模型,预报x=40时y的值.
解 (1)作出散点图如下图,从散点图可以 看出x与y不具有线性相关关系,根据已有知识可
c
1
e
c
2
x

7


高中数学选修2-3学案
以发现样本点分布在某 一条指数函数曲线y=的周围,其中c
1
,c
2
为待定的参数.

(2)对两边取对数把指数关系变为线性关系,令z=lny,则有变换后的样本点应分布在直线z=bx+a(a=lnc
1
,b=c
2
)的周围,这样就可以利用线性回 归模型来建立y与x之间的非线性回
归方程了,数据可以转化为
x
z
21
1.946
23
2.398
25
3.045
27
3.178
29
4.190
32
4.745
35
5.784
^
求得回归直线方程为z=0.272x-3.849,
^

∴y=e
0.272
x
3.849
.
残差
y
i

^
y
i

^
e
i

7
6.443
0.557
11
11.101
-0.101
×
40

3.849
21
19.125
1.875
≈1131.
24
32.950
-8.950
66
56.770
9.23
115
128.381
-13.381
325
290.325
34.675
(3)当x=40时,y=e
0.272
规律方法 解决非线性回归问题的方法及步骤
(1)确定变量:确定解释变量为x,预报变量为y;
(2)画散点图:通过观察散点图并与 学过的函数(幂、指数、对数函数、二次函数)作比较,选
取拟合效果好的函数模型;
(3)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;
(4)分析拟合效果:通过计算相关指数等来判断拟合效果;
(5)写出非线性回归方程.
跟踪演练3 在试验中得到变量y与x的数据如下表:
试求y与x之间的回归方程,并预测x=40时,y的值.

8


高中数学选修2-3学案
x
y
解 作散点图如图所示,
19
4
23
11
27
24
31
109
35
325

从散点图可以看出,两个变量x,y不呈 线性相关关系,根据学过的函数知识,样本点分布的
曲线符合指数型函数
y=c
1e
bx+a(a=lnc
1
,b=c
2
).
列表:
x
z
作散点图如图所示,
19
1.386
23
2.398
27
3.178
31
4.691
35
5.784
c
2
x
,通过对数变化把指数关系变为线性关系,令z =lny,则z=

从散点图可以看出,两个变量x,z呈很强的线性相关关系.由表中的数据 得到线性回归方程
为:

9


高中数学选修2-3学案
z=0.277x-3.998.
所以y关于x的指数回归方程为:y=e
0.27 7
x
所以,当x=40时,y=e
0.277
×
40
3.998
^
^

3.998
.
≈1190.347.

10


高中数学选修2-3学案

1.下列各组变量之间具有线性相关关系的是( )
A.出租车费与行驶的里程
B.学习成绩与学生身高
C.身高与体重
D.铁的体积与质量
[
答案
] C
^
2.若劳动生产率x(千元)与月工资y(元)之 间的线性回归方程为y=50+80x,则下列判断正确
的是( )
A.劳动生产率为1000元时,月工资为130元
B.劳动生产率提高1000元时,月工资平均提高80元
C.劳动生产率提高1000元时,月工资平均提高130元
D.月工资为210元时,劳动生产率为2000元
[
答案
] B
3.某商品销售量y(件)与销售价格x(元件)负相关,则其回归方程可能是( )
^
A.y=-10x+200
^
C.y=-10x-200
[
答案
] A
[
解析
] 由于销售量y与销售价格x成负 相关,故排除B、D.又当x=10时,A中y=100,
而C中y=-300,C不符合题意,故选A .
4.对两个变量x,y取得4组数据(1,1)(2,1.2),(3,1.3),(4,1.37 ),甲、乙、丙三人分别求得数
学模型如下:
甲:y=0.1x+1,乙:y=-0.05x
2
+0.35x+0.7,丙:y=-0.8·0.5
x
+1.4,试判断三 人谁的数
^
B.y=10x+200
^
D.y=10x-200

11


高中数学选修2-3学案
学模型更接近于客观实际.
解 对甲模型:y=0.1x+1,
^
4
残差平方和(y
i
-y
i
)
2
=0.0109;
i

1
对乙模型:y=-0.05x
2
+0.35x+0.7,
残差平方和
4(y
i
-y
i
)
2
=0.0049.
^^
i

1
对丙模型:y=-0.8·0.5
x
+1.4 ,
残差平方和
4
(y
i
-y
i
)
2=0.0004.
^
i

1
显然丙的残差平方和最小,故丙模型更接近于客观实际.

回归分析的基本思路
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的 解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系
等);
^^^(3)由经验确定回归方程的类型(如果呈线性关系,则选用线性回归方程y=bx+a);
(4)按一定规则估计回归方程中的参数;
(5)提出结果后分析残差图是否有异常(个别数 据对应的残差过大,或残差呈现不随机的规律性
等),若存在异常,则检查数据是否有误或模型是否合适 等.


12

高中数学人教版名师视频-高中数学题库基本不等式


高中数学课题题目开题报告-高中数学试卷写完的图片


高中数学微积分例题讲解视频教程-高中数学教师说课稿范例52份


高中数学选修一思维导图-高中数学小题狂做2-1答案RJ


高中数学基本公理-陈景润高中数学能考满分吗


高中数学如何上到140以上-高中数学手写错题笔记


错在哪里 高中数学-高中数学选修电子书湘教版


高中数学会考常考计算题-高中数学必修四答题模板



本文更新与2020-09-19 07:40,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/404064.html

高中数学选修2-3优质学案:3.1 回归分析的基本思想及其初步应用的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
高中数学选修2-3优质学案:3.1 回归分析的基本思想及其初步应用随机文章