高中数学重难点解决方案-江苏高中数学计算
1.1 回归分析的基本思想及其初步应用
?达标训练
1.下列结论正确的是( )
①函数关系是一种确定性关系;②相关
关系是一种非确定性关系;③回归分析是对具有函
数关系的两个变量进行统计分析的一种方法;④回归分
析是对具有相关关系的两个变量进
行统计分析的一种常用方法.
A.①②
B.①②③ C.①②④ D.①②③④
解析:根据函数关系、相关关系、回归关系的概念可知选C.
答案:C
2.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( )
2
A.总偏差平方和 B.残差平方和 C.回归平方和
D.相关指数
R
答案:B
3.下表是某工厂6~9月份用电量(单位:万度)的一组数据:
月份
x
6
7
8
9
用电量
y
6
5
3
2
^
由散点图可知,用电量
y
与月份
x
间有较好的线性相关关系,其线性回归直线
方程是y
=-1.4
x
+
a
,则
a
等于( )
A.10.5 B.5.25 C.5.2 D.14.5
解析:
答案:D
4.某产品的广告费用
x
与销售额
y
的统计数据如下表:
广告费用
x
(万元)
4
2
3
5
销售额
y
(万元)
49
26
39
54
^
^^^
根据上表可得回归方程y=b
x
+a中的b为9.4,据此模型预报广告费用为
6万元时销售
额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
答案:B
5.设
(
x
1,
y
1),(
x
2,
y
2),…,
(
xn
,
yn
)是变量
x
和
y
的
n
个样本点,直线
l
是由这些样
本点通过最小二乘法得到的线性回归直线(如右图),以下结论正确的是( )
--
A.直线
l
过点(x,y)
B.
x
和
y
的相关系数为直线
l
的斜率
C.
x
和
y
的相关系数在0到1之间
D.当
n
为偶数时,分布在
l
两侧的样
本点的个数一定相同
答案:A
2
6.两个变量y
与
x
的回归模型中,分别选择了4个不同模型,它们的相关指数
R如下,其
中拟合效果最好的模型是( )
2
A.模型1:相关指数
R
为0.98
2
B.模型2:相关指数
R
为0.80
2
C.模型3:相关指数
R
为0.50
2
D.模型4:相关指数
R
为0.25
答案:A
?素能提高
1.对两个变量
x
和
y
进行回归分析,得到一
组样本数据:(
x
1
,
y
1
),(
x
2<
br>,
y
2
),…,(
x
n
,
y
n),
则下列说法中不正确的是( )
^^^--
A.由样本数据得到的回归方
程y=b
x
+a必过样本点的中心(x,y)
B.残差平方和越小的模型,拟合的效果越好
22
C.用
R
来刻画
回归效果,
R
的值越小,说明模型的拟合效果越好
2
D.在研究身高和体重
关系时,求得
R
=0.64,可以叙述为“身高解释了64%的体重变
化,而随机误差
贡献了剩余的36%”,所以身高对体重的效应比随机误差的效应大
2
解析:R
的值越大,说明残差平方和越小,也就是说模型的拟合程度效果越好.
答案:C
2.相关
x
,
y
的样本数据如下表:
x
y
^^^
经回归分析可得
y
=2
x
线
性相关,并由最小乘法求得回归直线方程为y=1.1
x
+a,则a=
( )
A.0.1 B.0.2 C.0.3 D.0.4
^-^-
解析:a=y-bx=3.6-3.3=0.3
答案:C
3.有下列关系:①人的年龄与他(她)拥有的财富之间的关系;②曲线上的点与该
点的坐标
之间的关系;③苹果的产量与气候之间的关系;④森林中的同一种树木,其断面直径与高
度之间的关系;⑤学生与他(她)的学号之间的关系,其中有相关关系的是____________.
答案:①③④
4.某工厂的某种型号的机器的使用年限
x
和所支出的维修费
用
y
(万元)有下表的统计资料:
1
2
2
2
3
3
4
5
5
6
x
y
^^
根据上表可得回归方程y=1.23
x
+a,据此模型估计,该型号机器使用年限为1
0年的
2
2.2
3
3.8
4
5.5
5
6.5
6
7.0
维修费用约________万元(结果保留两位小数).
答案:12.38
5.已知
x
,
y
之间的一组数据如下:
x
y
^^^
则线性回归方程y=a+b
x
所表示的直线必
经过点________.
3
?
答案:
?
?
2
,5
?
6.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量
x
(吨)与相应的生
产
能耗
y
(吨标准煤)的几组对照数据.
0
8
1
2
2
6
3
4
x
y
(1)请画出上表数据的散点图. ^^
(2)请根据上表提供的数据,用最小二乘法求出
y
关于
x
的线性回归方程
y
=b
x
+a.
(3)已知该厂技改前100吨甲
产品的生产能耗为90吨标准煤.试根据(2)求出的线性回
归方程,预测生产100吨甲产品的生产能
耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解析:(1)所求散点图如下图所示:
3
2.5
4
3
5
4
6
4.5
(2)
?
x
i
y
i<
br>=3×2.5+4×3+5×4+6×4.5=66.5,
i
=
1
4
-
3+4+5+6
x==4.5,
4
-
2.5+3+4+4.5
y==3.5,
4
2222
?
x
2
i
=3+4+5+6=86,
i
=
1
4
--
?
x
i
y
i
-4xy
^
b=
i
=
1
4
4
=
-
2
?
x
2
i
-4x
i
=
1
66.5-4×4.5×3.5
86-4×4.5
2
=
66.5-63
=0.7,
86-81
^-^-
a=y-bx=3.5-0.7×4.5=0.35,
故所求线性回归方程为y=0.7x+0.35.
(3)根据回归方程的预测,现
在生产100吨产品消耗的标准煤的数量为0.7×100+0.35
=70.35,故耗能减少了90
-70.35=19.65吨标准煤.
7.关于
x
与
y
有如下数据:
x
2
4
5
6
8
y
30
40
60
50
70
^^
有如下两个线性模型:①y=6.5
x
+17
.5;②y=7
x
+17.试比较哪个拟合效果好.
解析:
^
由①可得yi-y
i
与y
i
-y的关系如下表:
^
y
i
-y
i
y
i
-y
5
-0.5
-20
-3.5
-10
10
10
-6.5
0
0.5
20
?
(y<
br>i
-y
i
)
2
=(-0.5)
2
+(-3.
5)
2
+10
2
+(-6.5)
2
+0.5
2=155.
i
=
1
^
?
(y
i
-
y
i
)
2
=(-20)
2
+(-10)
2
+10
2
+0
2
+20
2
=1 000.
i
=
1
5
5
-
?
?y
i
-y
i
?
2
i
=
1
^
∴R
2<
br>1=1-
?
?y
i
-y
i
?
2
i
=
1
5
-
155
=1-=0.845.
1 00
0
^-
由②可得y
i
-y
i
与y
i
-y的
关系如下表:
^
-1 -5
y
i
-y
i
y
i
-y
5
8
10
-9
0
-3
20 -20 -10
?
(y
i
-y
i
)
2
=(-1)
2
+(-5)
2
+8
2<
br>+(-9)
2
+(-3)
2
=180.
i
=
1
^
?
(y
i
-y
i)
2
=(-20)
2
+(-10)
2
+10
2
+0
2
+20
2
=1 000.
i
=
1
5
5
-
?
?y
i
-y
i
?
2
i
=
1
^
∴R
2<
br>2=1-
?
?y
i
-y
i
?
2
i
=
1
5
-
180
=1-=0.820.
1
000
∴R
2
1>R
2
2,∴①的拟合效果好于②的似合效果.
8.为了研究某种细菌随时间
x
变化繁殖的个数,收集数据如下:
天数
x
天
1
2
3
4
5
繁殖个数
y
个
6
12
25
49
95
6
190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散点图;
解析:所求散点图如下图所示:
(2)求
y
与
x
之间的回归方程;
解析:由散
点图看出样本点分布在一条指数函数
y
=
c
1
e
c
2
x
的周围,于是令
z
=ln
y
,
则得下列数据表:
x
z
1
1.79
2
2.48
3
3.22
4
3.89
5
4.55
6
5.25
^
由计算器算得z=0.69x+1.112,则有
^
0.69
x
+
1.112
y=e.
2
(3)计算残差、相关指数
R
,并描述解释变量与预报变量之间的关系.
解析:(3)由题意得:
^
6.06 12.09 24.09
48.04 95.77 190.9
y
y 6 12 25 49 95 190
?
e2i=
?
(y
i
-y
i
)
2
=3.164 3,
i
=
1
6
i
=
1
6
6
^
-
2
6
2
-
?
(y
i
-y
i
)=
?
y
i
-n
y
2
=25 553.3,
i
=
1
i
=
1
3.164
3
≈0.999 9.
25
553.3
即解释变量天数对预报变量繁殖细菌的个数解释了99.99 %。
?品味高考
1.四名同学根据各自的样本数据研究变量
x
,
y
之间的相关关系,
并求得回归直线方程,
分别得到以下四个结论:
^^
①
y
与
x
负相关且y=2.347
x
-6.423;②
y
与
x<
br>负相关且y=-3.476
x
+5.648;
^^
③
y与
x
正相关且y=5.347
x
+8.493;④
y
与
x
正相关且y=-4.326
x
-4.578.
其中一定不正确的结论的序号是( )
A.①② B.②③ C.③④
D.①④
^^^^^
解析:由回归直线方程y=bx+a,知当b>0时,y与x
正相关;当b<0时,y与x负
相关.∴①④一定错误.故选D.
答案:D
2.已知
x
与
y
之间的几组数据如下表:
R
2
=1-
x
1
2
3
4
5
6
3
3
4
^^^
假设根据上表数据所得线性回归直线方程为y=b
x
+a,若某同学根据上表中的前两组
数据(1,0)和(2,2)求得的直线方程为
y
′=
b
′
x+
a
′,则以下结论正确的是( )
^^^^
A.b>
b
′,a>
a
′
B.b>
b
′,a<
a
′
^^^^
C.b<
b
′,a>
a
′
D.b<
b
′,a<
a
′
713
58-6××
26
5
-
217
-
13
^
解析:x==,
y=,代入公式求得b==,
6267
?
2
7
91-6×
?
?
2
?
1
^-^--
1357
a=y-bx-y
=-×=-,
6723
^^
而b′=2,a′=-2,∴b<b′,a>a′,故选C.
答案:C
3.从某居民区随机抽取10个家庭,获得
i
个家庭的月收入x
i
(单位:千元)与月储蓄
y
i
(单
1010101
0
2
位:千元)的数据资料,算得
?
x
i
=80,
?
y
i
=20,
?
x
i
y
i
=1
84,
?
x
i
=720.
i
=1
i
=1
i
=1
i
=1
^^^
(1)求家庭的月储蓄
y对月收入
x
的线性回归方程y=b
x
+a;
1n
801
n
20
解析:由题意知:n=10,x=
?
x
i
==8,y=
?
y
i
==2.
n
i<
br>=
1
n
i
=
1
1010
22
又l<
br>xx
=
?
x
2
i
-nx=720-10×8=80,
i
=
1
n
y
0
2
1
l
xy
=
?
x
i
y
i
-n
i
=
1
n
=184-10×8×2=24, ^
l
xy
24
^^
由此得b===0.3,a=y-bx=2-
0.3×8=-0.4.
l
xx
80
故所求回归方程为:y=0.3x-0.4.
(2)判断变量
x
与
y
之间是正相关还是负相关;
^
解析:由于变量y的值随x的值增加而增加(b=0.3>0),故x与y之间是正相关.
(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
<
br>解析:将
x
=7代入回归方程可以预测该家庭的月储蓄为:
y
=0.3
×7-0.4=1.7(千元).
--
?
x
i
y
i
-nxy
i
=
1
n
附:线性回归方程y=bx+a中,
b=
2
?
x
2
i
-nx
i
=
1<
br>n
----
,a=y-bx,其中x,y为样本平均值,
-
^^^
线性回归方程也可写为y=bx+a.