高中数学必修三第一章讲解视频-特级教师讲座视频高中数学

1.1 回归分析的基本思想及其初步应用
[核心必知]
1.预习教材,问题导入
根据以下提纲,预习教材P
2
~P
8
的内容,回答下列问题. (1)在数学《必修3》中,我们利用回归分析的方法对两个具有线性相关关系的变量进
行了研究,
其步骤是什么?所求出的线性回归方程是什么?
提示:步骤为:画出两个变量的散点图,求回归直线方
程,并用回归直线方程进行预
^^^
报.线性回归方程为
y
=
bx<
br>+
a
.
(2)所有的两个相关变量都可以求回归方程吗?
提示:不一定.
2.归纳总结,核心必记
(1)回归分析
回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)回归直线方程
^^^
方程
y
=
bx
+
a
是两个具有线性
相关关系的变量的一组数据(
x
1
,
y
1
),(
x
2
,
y
2
),…,(
x
n
,
y<
br>n
)的回归方程,其中
a
,
b
是待定参数,其最小二乘估计分
别为:
^^
?
?
x
-
x
?
^
b
=
-
?
?
x
-
x
?
^^-
?
a
=
y
-
bx
,
ni
--
y
i
-
y
=
--
?
x
i
y
i
-
nxy
i
=1
n
i=1
,
n
i
-
nx
?
x
2
i
=1
2
n
2
i
i
=1
nn
-
1
-
1
--
其中
x
=
?
x
i
,
y
=
?
y
i
,(
x
,
y
)称为样本点的中心.
n
i
=1
n
i
=1
(3)线性回归模型
线性回归模型用
y
=
bx
+
a
+
e
来表示,其中
a
和
b
为模型的未知参数,
e
称为随
机误差.
(4)刻画回归效果的方式
残差
残差图
^
把随机误差的估计值
e
i
称为相应于点(
x
i<
br>,
y
i
)的残差
作图时纵坐标为残差,横坐标可以选为样本编号,或
身高数据,或体重估
计值等,这样作出的图形称为残差图
残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这
残差图法
样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度
越高
残差
平方和
^
2
残差平方和为
?
(
y
i
-
y
i
),残差平方和越小,模型拟合效果越好
i
=1
n
^
?
y
i
-
y
i
i
=1
n
2
相关
指数
R
2
R
=1-
n
2
,
R
表示解释变量对于预报变量变
化的贡献率,
R
22
?
y
i
-
y
i
=1
2
越接近于1,表示回归的效果越好
[问题思考]
^<
br>(1)通过教材P
2
中的例1计算出的回归方程
y
=0.849
x
-85.712可以预报身高为172 cm
的女大学生的体重为60.316
kg.请问,身高为172 cm的女大学生的体重一定是60.316 kg
吗?为什么?
提示:不一定.从散点图可以看出,样本点散布在一条直线的附近,而不是在一条直线
上,所以不能用一
次函数
y
=
bx
+
a
表示.
(2)下列说法正确的有哪些?
①在线性回归模型中,
e
是
bx<
br>+
a
预报真实值
y
的随机误差,它是一个可观测的量;②
残差
平方和越小的模型,拟合的效果越好;③用
R
来刻画回归效果,
R
越小,拟合
的效果越
好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
提示:
e是一个不可观测的量,故①不正确;
R
越小,残差平方和越大,即模型的拟合
效果
越差,故③不正确;②④是正确的.
[课前反思]
(1)回归分析的定义是什么?如何求回归直线方程?
2
22
(2)线性回归模型是什么?
(3)残差、残差图的定义是什么?如何作残差图?
(4)残差平方和和相关指数
R
的定义是什么?它们与回归效果有什么关系?
2
[思考]
求线性回归方程的步骤是什么?
名师指津:(1)列表表示
x
i
,
y
i
,
x
i
y
i
,
x
i
;
n
2
2
n
(2)计算
x
,
y
,
?
x
i
,
?
x
i
y
i
;
i
=1
i
=1
^^
(3)代入公式计算
a,
b
的值;
(4)写出线性回归方程.
讲一讲
1.(链接
教材P
2
-例1)某种产品的广告费用支出
x
与销售额
y
(
单位:百万元)之间有如
下的对应数据:
x
百万元
y
百万元
(1)画出散点图;
(2)求线性回归方程;
2
30
4
40
5
60
6
50
8
70
(3)试预测广告费用支出为10百万元时的销售额.
[尝试解答] (1)散点图如图所示:
(2)列出下表,并用科学计算器进行有关计算:
i
x
i
y
i
x
i
y
i
x
2
i
1
2
3
6
4
2
4
3
5
4
6
5
8
合计
25
0
1 380
145
16
25
36
60
64
5
252
50
2
所以,
x
==5,
y
==50,
?
x
i
=145,
55
i
=1
5
?
xi
y
i
=1 380.
i
=1
--
?
x
i
y
i
-5
xy
^
于是可得
b
=
i
=1
5
5
i
-5
x
?<
br>x
2
i
=1
2
=
^
1
380-5×5×50
=6.5,
2
145-5×5
-^-
a=
y
-
bx
=50-6.5×5=17.5.
^
所以所求的线性回归方程为
y
=6.5
x
+17.5.
(3)根据(2)中求得的线性回归方程,当广告费用支出为10百万元时,
^
y
=6.5×10+17.5=82.5(百万元),
即广告费用支出为10百万元时,销售额大约为82.5百万元.
(1
)求线性回归方程前必须判断两个变量是否线性相关,如果两个变量本身不具备相关
关系,或者它们之间
的相关关系不显著,那么即使求出回归方程也是毫无意义的.
^^^
(2)写出回归直线方程
y
=
bx
+
a
,并用回归直线方程进行预测说明:当
x
取
x
0
时,由线
^
性回归方程可得y
0
的值,从而可进行相应的判断.
练一练
1.某班5名学生的数学和物理成绩如下表:
学生
学科成绩
数学成绩(
x
)
物理成绩(
y
)
(1)画出散点图;
(2)求物理成绩
y
对数学成绩
x
的回归直线方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
解:(1)如图所示.
A
88
78
B
76
65
C
73
71
D
66
64
E
63
61
1
(2)因为
x
=×(88+76+73+66+63)=73.2,
5
y
=×(78+65+71+64+61)=67.8,
5
1<
br>5
?
x
i
y
i
=88×78+76×65+73×7
1+66×64+63×61
i
=1
=25 054,
5
22222
i
=88+76+73+66+63=27 174.
?
x
2
i
=1
--
?
x
i
y<
br>i
-5
xy
^
所以
b
=
i
=15
5
25 054-5×73.2×67.8
=
2
27 17
4-5×73.2
2
i
-5
x
?
x
2
i<
br>=1
^^-
≈0.625,
a
=
y
-
bx<
br>≈67.8-0.625×73.2=22.05.
^
故
y
对
x
的回归直线方程是
y
=0.625
x
+22.05.
^
(3)
x
=96,则
y
=0.625×96+22.05≈82,
即可以预测他的物理成绩是82.
[思考]
如何用残差图、残差平方和、相关指数
R
分析拟合效果?
名师指津:残差图的带状区
域的宽度越窄,模型拟合精度越高;残差平方和越小,模型
拟合效果越好;
R
越接近于
1,模型拟合效果越好.
讲一讲
2.假定小麦基本苗数
x
与成熟期有效穗
y
之间存在相关关系,今测得5组数据如下:
2
2
x
y
15.0
39.4
25.8
42.9
30.0
42.9
36.6
43.1
44.4
49.2
(1)以
x
为解释变量,
y
为预报变量,作出散点图;
(
2)求
y
与
x
之间的回归方程,对于基本苗数56.7预报有效穗;
(3)计算各组残差,并计算残差平方和;
(4)求
R
,并说明残差变量对有效穗的影响占百分之几?
[尝试解答]
(1)散点图如下.
2
(2)由(1)中散点图看出,样本点大致分布在一条直线
的附近,有比较好的线性相关关系,
因此可以用线性回归方程刻画它们之间的关系.
^^^<
br>设回归方程为
y
=
bx
+
a
.
x
=
30.36,
y
=43.5,
5
2
5
i
=9
511.43.
?
x
i
=5 101.56,
?
y
2
i
=1
i
=1
--
xy
=1
320.66,
x
2
=921.729 6,
5
?
x
i
y
i
=6 746.76.
i
=1
5
?
x
i
y
i
-5
x
y
^
则
b
=
i
=1
^^
≈0
.29,
a
=
y
-
b
x
≈34.70.
5
i
-5
x
?
x
2
i
=1
2
^
故所求的回归直线方程为
y
=0.29
x+34.70.
^
当
x
=56.7时,
y
=0.29
×56.7+34.70=51.143.
估计成熟期有效穗为51.143.
^^^^^
^^^^
(3)由于
y
i
=
bx
i
+
a<
br>,可以算得
e
i
=
y
i
-
y
i分别为
e
1
=0.35,
e
2
=0.718,
e
3
=-0.5,
e
4
=
^^
2
-2.2
14,
e
5
=1.624,残差平方和:
?
e
i
≈8.43.
i
=1
5
5
(4)
?
(
y
i
-
y
)=50.18,
2
i
=1
8.43
2
故
R
=1-≈0.832.
50.18
所以解释变量小麦基本苗数对总效应约贡献了83.2%,残差变量贡献了约1-83.2%=
16.
8%.
(1)利用残差分析研究两个变量间的关系时,首先要根据散
点图来判断它们是否线性相
^^^
关,是否可以用线性回归模型来拟合数据,然后通过残差e
1
,
e
2
,…,
e
n
来判断模型拟
合的
效果.
(2)若残差点比较均匀地分布在水平带状区域中,带状区域越窄,说明模型拟合
度越高,
回归方程预报精确度越高.
练一练
2.某运动员训练次数与运动成绩之间的数据关系如下:
次数(
x
)
成绩(
y
)
(1)作出散点图;
(2)求出线性回归方程;
(3)作出残差图,并说明模型的拟合效果;
(4)计算
R
,并说明其含义.
解:(1)作出该运动员训练次数
x
与成绩
y
之间的散点图,如图所示,由散点图可知,
它们之间具有线性相关
关系.
2
3
3
46
48
50
51
8
(2)∵
x
=39.25,
y
=40.875,
?
x
i=12 656,
2
i
=1
8
2
8
?
y
i
=13
731,
?
x
i
y
i
=13 180,
i
=1
i
=1
8
?
x
i
-
x
^
∴
b
=
i
=1
8
yi
-
y
=
--
?
x
i
y
i<
br>-8
xy
i
=1
8
≈1.041 5,
8
?
x
i
-
x
i
=1
2
i
-8
x
?
x
2
i
=1
2^
a
=
y
-
bx
≈-0.003 875,
^
∴线性回归方程为
y
=1.041 5
x
-0.003
875.
(3)残差分析
^^^^^^^
计算得
e
1
≈
-1.24,
e
2
≈-0.366,
e
3
≈0.551,<
br>e
4
≈0.468,
e
5
≈1.385,
e
6
≈0.178,
e
7
^
^
≈0.095,
e8
≈-1.071.作残差
图如图所示,由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比
较合适.
(4)计算相关指数
R
计算相关指数
R
≈0.985
5,说明了该运动员成绩的差异有98.55%是由训练次数引起的.
讲一讲
3.(链接教材P
6
-例2)某地区六年来轻工业产品利润总额
y
与
年次
x
的试验数据如下
表所示:
2
2
年次
x
利润总额
y
1
11.35
2
11.85
3
12.44
4
13.07
5
13.59
6
14.41
x
由
经验知,年次
x
与利润总额
y
(单位:亿元)近似有如下关系:
y<
br>=
abe
0
.其中
a
,
b
均
为正数
,求
y
关于
x
的回归方程.
[思路点拨] 解答此题可根据散点图
选择恰当的拟合函数,而本题已经给出,只需将其
转化为线性函数,利用最小二乘法求得回归直线方程,
再将其还原为非线性回归方程即可.
[尝试解答]
对
y
=
abe
0
两边取自然对数,得ln
y
=ln
ae
0
+
x
ln
b
,令
z
=ln
y
,则
z
与
x
的数据如下表:
x
x
z
1
2.43
2
2.47
3
2.52
4
2.57
5
2.61
6
2.67
由
z
=ln
ae
0
+
x
ln
b
及最小二乘法公式,得
ln
b
≈0.047 7,ln
ae
0
=2.378,
^^
x
即
z
=2.378+0.047
7
x
,故
y
=10.8×1.05.
非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与
学过的各种函
数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得
最好的函数,然后采用适
当的变量变换,把问题化为线性回归分析问题,使之得到解决.其
一般步骤为:
练一练
3.某电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压<
br>U
随时
间
t
变化的规律用公式
U
=
A
e(
b
<0)表示,现测得时间
t
(s)时的电压
U
(V
)如下表:
bt
t
s
U
V
1
0
15
10
10
5
0
5
试求:电压
U
对时间
t
的回归方程(提示:对公式两边取自然对数,
把问题转化为线性
回归分析问题).
解:对
U
=
A
e两边取对数得ln
U
=ln
A
+
bt
,
令
y
=ln
U
,
a
=ln
A
,
x
=
t
,
则
y
=
a
+
bx
,
y
与
x
的数据如下表:
bt
x
y
4.6
4.3
4.0
3.7
3.4
3.0
2.7
2.3
2.3
1.6
0
1.6
根据表中数据画出散点图,
如图所示,从图中可以看出,
y
与
x
具有较好的线性相关关系,
由表中数据求得
x
=5,
y
≈3.045,
^^^-由公式计算得
b
≈-0.313,
a
=
y
-
b
x
=4.61,
^
所以
y
对
x
的线性回归方程为
y
=-0.313
x
+4.61.
^
所以ln
U
=-0.313
t
+4.61,
^
-0.313
t
+4.61-0.313
t
4.61
即
U
=e=e·e
,
^
-0.313
t
4.61
因此电压
U
对时间
t
的回归方程为
U
=e·e.
————————————[课堂归纳·感悟提升]————————
1.本节课
的重点是线性回归方程的求法及线性回归分析,难点是残差分析和非线性回
归分析问题.
2.本节课要重点掌握的规律方法
(1)线性回归分析,见讲1;
(2)残差分析,见讲2;
(3)非线性回归分析,见讲3.
课下能力提升(一)
[学业水平达标练]
题组1 线性回归分析
1.关于回归分析,下列说法错误的是( )
A.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确
定
B.线性相关系数可以是正的也可以是负的
C.在回归分析中,如果
r
=1
或
r
=±1,说明
x
与
y
之间完全线性相关
D.样本相关系数
r
∈(-1,1)
解析:选D
样本的相关系数应满足-1≤
r
≤1.
2.为了研究变量
x
和y
的线性相关性,甲、乙两人分别利用线性回归方法得到回归直
线
l
1<
br>和
l
2
,已知两人计算过程中
x
,
y
分别相
同,则下列说法正确的是( )
A.
l
1
与
l
2
一定平行
B.
l
1
与
l
2
重合
C.
l<
br>1
与
l
2
相交于点(
x
,
y
)
D.无法判断
l
1
和
l
2
是否相交
解析:选C 回归直线一定过样本点的中心(
x
,
y
),故C正确.
^^^
3.若某地财政收入
x
与支出
y
满足回归方程
y
=
bx
+
a
+
e
i
(单位:亿元)(
i
=1,2,…),
^^
其中
b
=0.8,
a=2,|
e
i
|<0.5,如果今年该地区财政收入10亿元,年支出预计不会超
过( )
A.10亿元 B.9亿元
C.10.5亿元
D.9.5亿元
^
解析:选C
y
=0.8×10+2+
e
i
=10+
e
i
,
∵|
e
i
|<0.5,
^
∴9.5<
y
<10.5.
4.甲、乙、丙、丁四位同学在建立
变量
x
,
y
的回归模型时,分别选择了4种不同模型,
2
计算可得它们的相关指数
R
分别如下表:
2
R
2
甲
0.98
乙
0.78
丙
0.50
丁
0.85
哪位同学建立的回归模型拟合效果最好?( )
A.甲 B.乙 C.丙 D.丁
解析:选A 相关指数
R
越大,表示回归模型的拟合效果越好.
5 .某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试
销,得到如下数据:
单价
x
(元)
销量
y
(件)
8
9
8.2
8.4
8.6
8.8
9
2
^^^^^-^-
(1)求回归直线方程
y
=
bx
+
a
,其中
b
=-20,
a
=
y
-
bx
;
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元
件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
1
解 :(1)由于
x
=(8+8.2+8.4+8.6+8.8+9)=8.5,
6
y
=(90+84+83+80+75+68)=80.
^^^
所以
a
=
y
-
bx
=80+20×8.5=250,从而回 归直线方程为
y
=-20
x
+250.
(2)设工厂获得的利润为
L
元,依题意得
1
6
L
=
x
(-20
x
+250)-4(-20
x
+250)
=-20
x
+330
x
-1 000
2
?
33
?
2
=-20
?
x
-
?
+361. 25.
4
??
当且仅当
x
=8.25时,
L
取得最大值.
故当单价定为8.25元时,工厂可获得最大利润.
题组2 残差分析
6.关于残差图的描述错误的是( )
A.残差图的横坐标可以是样本编号
B.残差图的横坐标也可以是解释变量或预报变量
C.残差点分布的带状区域的宽度越窄相关指数越小
D.残差点分布的带状区域的宽度越窄残差平方和越小
解析:选C 残差点分布的带状区域的 宽度越窄,说明模型拟合精度越高,则残差平方
和越小,此时,相关指数
R
的值越大, 故描述错误的是选项C.
7.对变量
x
,
y
进行回归分析时,依据 得到的4个不同的回归模型画出残差图,则下列
2
模型拟合精度最高的是(
)
解析:选A 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,
说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.
8.在回归分析中,相关指数
R
的值越大,说明残差平方和( )
A.越大 B.越小
C.可能大也可能小 D.以上均错
^
?
y
i
-
y
i
i
=
1
n
2
2
解析:选B
因为
R
=1-
n
2
,
?
y
i
-
y
i
=1
2
^
2
所以当
R越大时,
?
(
y
i
-
y
i
)越小,
2
n
i
=1
即残差平方和越小.
9.通过下面的残差图,我们发现在采集样本点的过程中,样本点数据不准确的为( )
A.第四个 B.第五个
C.第六个 D.第七个
解析:选C
由题图可知第六个数据的偏差最大,故选C.
10.在一段时间内,某淘宝网店一种商品的销售价格<
br>x
元和日销售量
y
件之间的一组数
据为:
价格
x
元
日销售量
y
件
22
37
20
41
18
43
16
50
14
56
求出
y
关于
x
的回归方程,并说明该
方程拟合效果的好坏.
55
2
参考数据:
?
x
i
y
i
=3 992,
?
x
i
=1 660.
i<
br>=1
i
=1
解:作出散点图(此处略),观察散点图,可知这些点散布在一条直
线的附近,故可用线
性回归模型来拟合数据.
因为
x
=
22+20+18+16+14
=18,
5
y
=
37+41+43+50+56
=45.4.
5
^
3
992-5×18×45.4
所以
b
==-2.35,
2
1
660-5×18
^
a
=45.4-(-2.35)×18=87.7.
^
所以回归方程为
y
=-2.35
x
+87.7.
y
i
-
y
i
与
y
i
-
y
的值如下表:
y
i
-
y
i
y
i
-
y
5
^-
^
1
-8.4
0.3
-4.4
-2.4
-2.4
-0.1
4.6
1.2
10.6
^
2
计算得
?
(
y
i
-
y
i
)=8.3,
i
=1
5
?
(
y
i
-
y
)
2
=229.2,
i=1
-
8.3
2
所以
R
=1-≈0.964.
229.2
因为0.964很接近于1,所以该模型的拟合效果比较好.
[能力提升综合练]
1.如图所示是四个残差图,其中回归模型的拟合效果最好的是( )
解析:选B 选项A与B中的残差图都是水平带状分布,并且选项B的残差图
散点分布
集中,在更狭窄的范围内,所以B中回归模型的拟合效果最好,选B.
2.某产品的广告费用
x
与销售额
y
的统计数据如下表:
广告费用
x
(万元)
销售额
y
(万元)
^^^^
根据上表可得回归方程
y
=
bx
+a
中的
b
为9.4,据此模型预报广告费用为6万元时销售
额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析:选B 样本点的中心是(3.5,42),
^^
则
a
=y
-
bx
=42-9.4×3.5=9.1,
^
所以回归直线方程是
y
=9.4
x
+9.1,
^
把
x
=6代入得
y
=65.5.
3.某饮料店
的日销售收入
y
(单位:百元)与当天平均气温
x
(单位:度)之间有下列数
据:
--
4
49
2
26
3
39
5
54
x
y
-2
5
-1
4
0
2
1
2
2
1
甲、乙、丙三位同学对上述数据进行了研究,分别得到了
x
与
y
之间的三个线性回归方
^^^
程:①
y
=-
x
+2
.8,②
y
=-
x
+3,③
y
=-1.2
x
+2.6;其中正确的是( )
A.① B.②
C.③
D.①③
^^^
解析:选A 回归方程
y
=
bx
+
a
表示的直线必过点(
x
,
y
),即必过点(0,2.8),而给
出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①,故选A.
4.已知
x
与
y
之间的几组数据如下表:
x
y
1
0
2
2
3
1
4
3
5
3
6
4
^^^
假设根据上表数据所得线性回归直线方程为
y
=
bx
+
a
,若某同学根据上表中的前两组数
据(1,0)和(2,2)求得的直线方程为
y
′=
b
′
x
+
a
′,则以下结论正确的是( )
^^^^
A.
b
>
b
′,
a
>
a
′ B.
b
>
b
′,
a
<
a
′
^^^^
C.
b
<
b
′,
a
>
a
′ D.
b
<
b
′,
a
<
a
′
解析:选C
过(1,0)和(2,2)的直线方程为
y
′=2
x
-2,
画出六点的散点图,回归直线的大概位置如图所示,
^^
显然,
b
′>
b
,
a
>
a
′,故选C.
5.某
种商品的广告费支出
x
与销售额
y
之间有如下关系:(单位:万元)
x
y
^
2
30
4
40
5
60
6
50
8
70
y
与
x
的线性回归方程
为
y
=6.5
x
+17.5,当广告费支出5万元时,残差为_______
_.
^
解析:当广告费
x
=5时,
y
=6.5×5+17
.5=50,残差为60-50=10.
答案:10
6.在研究气温和热茶销售杯数的关系
时,若求得相关指数
R
≈0.85,则表明气温解释
了________的热茶销售杯
数变化,而随机误差贡献了剩余的________,所以气温对热茶销
售杯数的效应比随机误差的效应
大得多.
解析:由相关指数
R
的意义可知,
R
≈0.85表明气温
解释了85%,而随机误差贡献了剩
余的15%.
答案:85% 15%
7.从某
居民区随机抽取10个家庭,获得第
i
个家庭的月收入
x
i
(单位:
千元)与月储蓄
10101010
22
2
y
i
(单位:千元
)的数据资料,算得
?
x
i
=80,
?
y
i
=20,
?
x
i
y
i
=184,
?
x<
br>2
i
=720.
i
=1
i
=1
i
=1
i
=1
^^^
(1)求家庭的月储蓄
y
关于月收入x
的线性回归方程
y
=
bx
+
a
;
(2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
解:(1)由题意知
n
=10,
x
=
1
10
x
i
=×80=8,
n?
10
i
=1
1
y
=
1
10
n
i
=1
?
y
i
=×20=2,
--
?
x
i
y
i
-
nxy
10
1
10<
br>^
所以
b
=
i
=1
10
2
i
-
nx
?
x
2
-
i
=1
=<
br>184-10×8×2
2
720-10×8
24
==0.3,
80
^
a
=
y
-
bx
=2-0.3×8=-0.4,
^
故所求线性回归方程为
y
=0.3
x
-0.4.
^
(2)将
x
=7代入回归方程,可以预测家庭的月储蓄约为
y
=
0.3×7-0.4=1.7(千元).
^-