高中数学理科期末期末试卷-高二高中数学
数学人教B选修1-2第一章1.2 回归分析
^^
1.掌握回归直线方程的形式,理解a,b及样本中心点的含义,并会求回归直线方程.
2.理解样本相关系数r的含义,掌握如何用样本相关系数r来衡量两个变量之间的线
性相关程
度.
1.回归直线方程
1
n
1
n
^^^^^
^
回归直线方程y=a+bx,其中b=________,a=y-b x(x=
?
x
i
,y=
?
y
i
).______
n
i
=
1
n
i
=
1
称为样本点的中心.
<
br>^
(1)b=
i
=
1
?
x
i
yi
-nx y
^
,其统计学的意义是:x每增加(或减少)一个单位,y平均改变
b个
n
2
n
i
=
1
?
x
i
2
-n x
^^
单位.a=y-bx,它的意义是y不受x变化影响的部分. ^^
(2)回归直线方程的求法及步骤:借助计算器进行运算求出系数b与a,也可以用相应的计算机软件求出方程.具体计算步骤:①分别计算
?
x
i
,
?<
br>y
i
,
?
x
i
2
,
?
y<
br>i
2
,
?
x
i
y
i
;②计算xi
=
1i
=
1i
=
1i
=
1i
=
1
nnnnn
1
n
1
n
^^^^^
=
?
x
i
,y=
?
y
i
;③根据公式求出b
和a;④写出回归直线方程y=a+bx,并利用回归直
n
i
=
1
n
i
=
1
线方程求相应变量的值.
【做一做1-1】两个相关变量满足如下数据关系:
x
y
^
A.y=0.56x+997.4
^
B.y=0.63x-231.2
^
C.y=50.2x+501.4
10
1 003
15
1 005
20
1 010
25
1 011
30
1 014
则y对x的回归直线方程为( )
^
D.y=60.4x+400.7
^
【做一做1-2】设有一个回归直线方程为y=3-5x,则当变量x增加1个单位时(
)
A.y平均增加3个单位
B.y平均减少5个单位
C.y平均增加5个单位
D.y平均减少3个单位
2.样本相关系数
r=
∑?x
i
-x?∑?y
i
-y?
22
∑?xi
-x??y
i
-y?
=______________ .
r具有以下性质:|r|≤1,并且|r|越接近____,线性相关程度越强;|r|越接近____,线性<
br>相关程度越弱.
检验的步骤如下:
(1)作统计假设:x与Y不具有线性相关关系.
(2)根据小概率0.05与n-2在附表中查出r的一个临界值______.
(3)根据样本相关系数计算公式算出r的值.
(4)作统计推断.如果|r|>r
0.05
,表明有____的把握认为x与Y之间具有线性相关关系.
如果|r|≤r
0.05
,我们没有理由拒绝原来的假设.这时寻找回归直线方程是毫无意义的.
(1)当r>0时,表示两个变量正相关;当r<0时,表示两个变量负相关;(2)判断两个
变量间
是否有线性相关关系,应该先求样本相关系数r,再根据r的具体数值进行判断.
【做一做2-1】下列有关样本相关系数r的说法不正确的是( )
A.|r|≤1,且|r|越接近1,线性相关程度越强
B.|r|≤1,且|r|越接近0,线性相关程度越弱
C.|r|≥1,且|r|越接近1,线性相关程度越强
D.用样本相关系数r来衡量x与y之间的线性相关程度
^
【做一做2-2】若回归直线方程中的回归系数b=0,则相关系数( )
A.r=1 B.r=-1
C.r=0 D.无法确定
1.如何进行线性回归分析?
剖析:(1)从一组数据出发,求出两个变量的相关系数r,确
定二者之间是否具有线性相
关关系.
^^^^^
(2)如果具有线性相关关系,求出
线性回归方程y=a+bx,其中a是常数项,b是回归系
数.
(3)根据回归方程,由一个变量的值预测或控制另一个变量的值.
特别说明:①回归方程只
适用于所研究的样本总体.②所建立的回归方程一般都有时效
性,如不能用根据20世纪80年代中学生
的身高、体重数据所建立的回归方程来描述现在中
学生的身高和体重的关系.③样本取值的范围会影响回归方程的适用范围.
2.怎样处理非线性回归问题?
剖析:两个变量不具有线性相关关系,不能直接利用线性回归
方程建立两个变量之间的
关系,可以通过变换的方法转化为线性回归模型.如y=c
1
ec
2
x,我们可以通过对数变换把
指数关系变为线性关系.令z=ln
y,则变换后样本点应该分布在直线z=a+bx(a=ln
c
1
,b
=c
2
)的附近.
题型一
求线性回归方程
【例题1】假设关于某设备的使用年限x(年)和所支出的维修费用y(万元),有如
下的统
计资料:
使用年限x
维修费用y万元
2
2.2
3
3.8
4
5.5
5
6.5
6
7.0
若由资料知y与x具有线性相关关系.试求:
^^^^^
(1)线性回归方程y=bx+a的回归系数a,b;
(2)估计使用年限为10年时,维修费用是多少?
分析:因为y与x具有线性相关关系,所以可以用求线性回归方程的方法解决问题.
^
(1)利用公式b=
i
=
1
?
x
i
y
i
-nx y
?
x
i
2
-nx
n
n
^^
,a=y-b x来计算回归系数.
2
i
=
1
(2)获得回归直线方程后,取x=10代入,即得所求.
反思:知道y与x具有线性相关关系,就无须进行相关性检验,否则,应首先进行相关
性检验.
如果本身两个变量不具有相关关系,或者说,它们之间相关关系不显著,即使求出
回归方程也是毫无意义
的,而且用其进行的预测也是不可信的.
题型二 相关性检验与回归分析的综合运用
【例题
2】要分析学生高一入学时的数学成绩对高一年级数学学习有什么影响,在高一
年级学生中随机抽取10
名学生,分析他们高一入学的数学成绩(x)和高一期末考试数学成绩
(y)(如下表):
编号
x
y
1
63
65
2
67
78
3
45
52
4
88
82
5
81
92
6
71
89
7
52
73
8
99
98
9
58
56
10
76
75
(1)画出散点图;
(2)计算高一入学数学成绩(x)与高一期末考试数学成绩(y)的相关系数;
(3)对变
量x与y进行相关性检验,如果x与y之间具有线性相关关系,求出y对x的线
性回归方程;
(4)若某学生高一入学数学成绩为80分,试估计他高一期末考试数学成绩.
分析:(1)
借助于散点图可大致判定两变量间的相关性,用相关系数公式可准确判定两
变量间的相关程度.(2)先
作统计假设,由小概率0.05与n-2在附表中查得相关系数的临界
值r
0.05
,
若|r|>r
0.05
,则两变量线性相关,否则两变量不具有线性相关性.
反思:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、认真
地计算.另外,利用计算机中有关应用程序也可以对这些数据进行处理.
题型三 易错题型
易错点:求回归直线方程和进行回归分析的题目的计算量较大,公式较多,
所以在求解
时易出现公式错用、数据求错的现象.
【例题3】英语老师为了了解学生的词汇量
,设计了一份包含100个单词的试卷,现抽
取15名学生进行测试,得到学生掌握试卷中单词个数x与
该学生实际掌握单词量y的对应
数据如下:
x
y
x
y
61
2 030
63
2 100
65
2 140
72
2 300
70
2 270
71
2 300
69
2 250
68
2 200
83
2 240
65
2 200
75
2 220
67
2 200
58
1 970
74
2 370
73
2 330
(1)对变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,则
①求y对x的回归直线方程;
②求x对y的回归直线方程.
错解:(1)由计算器求下列数据:
i
x
i
y
i
x
i
y
i
i
x
i
y
i
x
i
y
i
1
61
2 030
123 830
9
63
2
100
132 300
2
65
2 140
139 100
10
72
2 300
165 600
3
70
2 270
158 900
11
71
2 300
163 300
4
69
2 250
155 250
12
68
2 200
149 600
5
83
2 240
185 920
13
65
2 200
143 000
6
75
2 220
166 500
14
67
2 200
147 400
7
58
1 970
15
74
2 370
8
73
2 330
114 260 170 090
175 380
x=68.93,y=2 208,
1515
22
x
i
=71 822,y
i
=73
298 600,x
i
y
i
=2 290 430
i
=<
br>1i
=
1i
=
1
?
15
??
于是<
br>?
x
i
2
-15x=71 822-15×68.93=70
788.05,
i
=
1
15
i
=
1
?<
br>y
i
2
-15y=73 298 600-15×2 208=73 265
480,
15
15
i
=
1
?
x
i
y
i
-15xy=2 290 430-15×68.93×2 208=7 468.4,
15
i
=
1
?
x
i
y
i
-15x y
x??
?
y
i
2
-15y?
i
=
1
15
r=
?x
i
2
-15
i
=
1
?
15
=
7
468.4
=0.003 3.
70 788.05×73 265
480
查相关系数检验的临界值表,得r
0.05
(15-2)=0.514.
由于|r|<r
0.05
,故y与x无线性相关关系.
(2)由(1)得x与y的回归直线方程不存在.
1设两个变量x和y之间具有线
性相关关系,它们的相关系数是r,y关于x的回归直线
^^
的斜率是b,纵截距是a,那么必
有( )
^^
A.b与r的符号相同 B.a与r的符号相同
^^
C.b与r的符号相反 D.a与r的符号相反
^
2工人月
工资y(元)依劳动生产率x(千元)变化的回归直线方程为y=50+80x,则下列判
断正确的是(
)
①劳动生产率为1 000元时,工资为130元;
②劳动生产率提高1
000元时,工资平均提高80元;
③劳动生产率提高1 000元时,工资平均提高130元;
④当月工资为210元时,劳动生产率为2 000元.
A.① B.②
C.③ D.④
3已知y与x之间的一组数据如下:
x
y
0
1
1
3
2
5
3
5
4
6
则拟合这5对数据的回归直线一定经过点__________.
4许多因素都会影响贫穷,教育就是其中之一.在研究贫穷和教育的关系时收集了美国
50个州的成年人
受过9年或更少时间教育的人数占本州人数的百分比(x)和收入低于官方规
^
定的贫困线的人
数占本州人数的百分比(y)的数据,建立回归直线方程为y=0.8x+4.6,斜率
的估计值等于0
.8说明____________________,成年人受过9年或更少时间教育的人数占本
州人
数的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数
_____
_____(填“大于0”或“小于0”).
答案:
基础知识·梳理
i
=
1
?
x
i
y
i
-nx
y
(x,y)
i
=
1
n
1.
?
xi
2
-n x
n
2
^
【做一做1-1】A
b=
i
=
1
?
x
i
y
i
-5x
y
=0.56,
i
=
1
5
?
x
i
2
-5x
5
2
^^
a=y-b x=997.4.
^
∴y对x的回归直线方程为y=0.56x+997.4.
【做一做1-2】B
因为-5是斜率的估计值,说明x每增加1个单位时,y平均减少
5个单位.
2.
∑x
i
y
i
-nx y
?∑x
2i
-nx
2
??∑y
i
2
-n
1 0
(2)r
0.05
y?
2
(4)95%
【做一做2-1】C 根据样本相关系数的性质可知选项A,B,D均正确.
^
【做一做2-2】C 当b=
i
=
1
?
?x
i
-x??y
i
-y?
=0时,
i
=
1
n
?
?x
i
-x?
2
n
有
?
(x
i
-x)(y
i
-y)=0,
i
=
1
n
i
=
1
?
?x
i
-x??y
i
-y?
=0.
n
故相关系数
r=
n
2
n
i
=
1i
=
1
? ?x
i
-x?
?
?y
i
-y?
2
典型例题·领悟
【例题1】解:(1)制表:
i
x
i
y
i
x
i
y
i
x
i
2
1
2
2.2
4.4
4
2
3
3.8
11.4
9
3
4
5.5
22.0
16
4
5
6.5
32.5
25
5
6
7.0
42.0
36
合计
20
25
112.3
90
x=4;y=5;
i
=
1
?
x
i
2
=90;
?
x
i
y
i=112.3.
i
=
1
55
^112.3-5×4×5
12.3
于是有b===1.23;
10
90
-5×4
2
^^
a=y-bx=5-1.23×4=0.08.
^
(2)回归直线方程是:y=1.23x+0.08,当x=10时,y=1.23×10+0.08=12.3
+0.08=
12.38(万元),即估计使用10年时维修费用是12.38万元.
【例题
2】解:(1)高一入学数学成绩(x)与高一期末考试数学成绩(y)两组变量的散点图
如图,从散点
图看,这两个变量间具有线性相关关系.
1
(2)因为x=(63+67+?+76)=70,
10
y=
10
1
(65+78+?+75)=76,
10
10
i
=
1
?
(x
i
-x)(y
i
-y)=1 894,
?
(x
i
-x)
2
=2 474,
i
=
1
10
i
=
1
?
(y
i
-y)
2
=2 056,
因此求得相关系数为:
i
=
1
?
?x
i
-x??y
i
-y?
=0.839 786.
10
r=
i
=
1
?
?x
i
-x?
2
10
i
=
1
?
?y
i
-y?
2
10
结果说明这两组数据的相关程度是比较高的.
(3)查表求得显著性水平0.05和自由度10-2=8的相关系数临界值r
0.05
=0.632,因|r|
>r
0.05
,这说明高一入学数学成绩与高一期末考试数
学成绩之间存在线性相关关系.
^^^^
设线性回归方程为y=a+bx,在两组变量具有显
著的线性相关关系的情况下,求得b=
^^
0.765 56,a=y-bx=22.410
8.
^
因此所求的线性回归方程是y=22.410 8+0.765 56x.
^
(4)若某学生高一入学数学成绩为80分,代入上式可求得,y=84分,
即这个学生高一
期末考试数学成绩的预测值为84分.
【例题3】错因分析:本题由于对公式
i
=
1
?
x
i
y
i
-nx
y
的错误记忆而导致错误.
n
n
r=
n
i
=1i
=
1
?
?
x
i
2
-nx
2
??
?
yi
2
-ny
2
?
正解:(1)
列表并用计算器进行计算:
i
x
i
y
i
x
i
y
i
i
x
i
y
i
x
i
y
i
1
61
2 030
123 830
9
63
2
100
132 300
2
65
2 140
139 100
10
72
2 300
165 600
3
70
2 270
158 900
11
71
2 300
163 300
4
69
2 250
155 250
12
68
2 200
149 600
5
83
2 240
185 920
13
65
2 200
143 000
6
75
2 220
166 500
14
67
2 200
147 400
7
58
1 970
114 260
15
74
2 370
175 380
8
73
2 330
170 090
x=68.93,y=2 208,
i
=
1
?
x
i
2
=71
822,
?
y
i
2
=73 298
600,
?
x
i
y
i
=2 290 430
i<
br>=
1i
=
1
151515
于是
?
x
i
2
-15x
2
=71
822-15×68.93
2
=551.83,
i
=
1
1
5
i
=
1
?
y
i
2
-15y
2<
br>=73 298 600-15×2 208
2
=169 640,
1515
i
=
1
?
x
i
y
i
-1
5x y=2 290 430-15×68.93×2 208=7 468.4,
15
i
=
1
?
x
i
y
i
-15x y
15
r=
15
i
=
1i
=
1
?<
br>?
x
i
2
-15x
2
??
?
yi
2
-15y
2
?
7 468.4
=0.772.
551.83×169 640
=
查相关系数检验的临界值表,得r
0.05
(15-2)=0.514.
由于|r|>r
0.05
,故y与x有线性相关关系.
^^^
(2)①设y对x的回归直线方程为y=bx+a,
15^
则b=
i
=
1
?
x
i
y
i
-15x y
=
i
=
1
?
x
i
2
-15x
15
2
7 468.4
=13.5,
551.83
^^
a=y-b x=2 208-13.5×68.93=1
277.445,
即所求的y对x的回归直线方程为
^
y=13.5x+1
277.445.
^^^
②设x对y的回归直线方程为x=dy+c,则
15^
d=
i
=
1
?
x
i
y
i<
br>-15x y
=
i
=
1
?
y
i
2<
br>-15y
15
2
7 468.4
=0.044,
169
640
^^
c=x-d y=68.93-0.044×2 208=-28.222,
^
即所求的x对y的回归直线方程为x=0.044y-28.222.
随堂练习·巩固
^
1.A
由回归直线方程的斜率b与相关系数r的计算公式可以得出结论.
^
2.B 回归直线方程本
身就不够精确,y
i
与数据y
i
很可能不相等,所以①④不正确.由
^^
回归系数b的意义,知b是一个估计值.
^^^
3.(2,4)
回归直线y=bx+a一定过样本点的中心(x,y).
4.一个地区受过9年或更少时间教育的人数
占本州人数百分比每增加1%,收入低于
官方规定的贫困线的人数占本州人数的百分比将增加0.8%左
右 大于0