关键词不能为空

当前您在: 主页 > 数学 >

适用于教育机构高考数学专题辅导讲义《27统计(二)》

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-09-17 21:51
tags:高中数学辅导

高中数学曲线轨迹方程-2019年河南省普通高中数学

2020年9月17日发(作者:颜道岸)



适用于教育机构高考数学专题辅导讲义

年 级: 辅导科目:数学 课时数:
课 题
教学目的
教学内容
统计(二)
第三节 变量间的相关关系
(一)高考目标
考纲解读
1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
考向预测
1.以考查线性回归系数为主,同时可考查利用散点图判断两个变量间的相关关系.
2.以实际生活为背景,重在考查回归方程的求法.
3.在高考题中本部分的命题主要是以选择题、填空题为主,属于中档题目.
(二)、课前自主预习
知识梳理
1.散点图
(1)将变量所对应的点描出来,就组成了变量之间的一个图, 这种图为变量之间的 .
(2)从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势可用一条
来近似,这种近似的过程称为曲线拟合.
若两个变量
x

y< br>的散点图中,所有点看上去都在一条直线附近波动,则称变量间是 的.若所有点看上去都在
某条曲线(不是一条直线)附近波动,则称此相关为 的.如果所有的点在散点图中没有显示任何关系,则
称变量间是不相关的.
2.回归方程
(1)最小二乘法
如果有
n
个点:(
x
1,
y< br>1),(
x
2,
y
2),…,(
xn

yn
)可以用下面的表达式来刻画这些与 的接近程度:
[
y
1-(
a

bx
1)]2+[
y
2-(
a
bx
2)]2+…+[
yn
-(
a

bxn
) ]2
使得上式达到最小值的 就是我们要求的直线,这种方法称为最小二乘法.
(2)回归直线方程
回归直线方程y=a+bx中
?
?x
i< br>-x??y
i
-y?
i

1
n
?
?x
i
y
i
-n x y?
i

1
n
b=
?
?x
i
-x?
2
i

1
n

?
x
i
2
-n x
i

1
n

2
a= y-b x
1



x
1
+x
2
+…+x
n
y
1
+y
2
+…y
n
其中x=,y=
nn
(三)、基础自测
1.已知回归直线斜率的估计值为1.23,样本的中心为点(4,5),则回归直线的方程为( )
A.y=1.23x+4 B.y=1.23x+5 C.y=1.23x+0.08 D.y=0.08x+1.23
[分析] 回归直线必过样本中心点(x,y),又回归直线的斜率为1.23 ,可代入直线的点斜式方程解决.
[答案] C
[解析] 回归直线必过点(4,5),故其方程为y-5=1.23(x-4),即y=1.23x+0.08,故选C.
2.(2009·海南宁夏理3)对变量x,y有观测数据(xi,yi)(i=1,2,…,10), 得散点图1;对变量u,v有观测数据(ui,
vi)(i=1,2,…,10),得散点图2.由这两 个散点图可以判断.( )

A.变量
x

y
正相关,
u

v
正相关
B.变量
x

y
正相关,
u

v
负相关
C.变量
x

y
负相关,
u

v
正相关
D.变量
x
与< br>y
负相关,
u

v
负相关
[答案] C
[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.
用散点图 可以判断变量
x

y
负相关,
u

v
正相 关.
3.下列两个变量之间的关系:
①角度和它的余弦值;
②正
n
边形的边数与内角和;
③家庭的支出与收入;
④某户家庭用电量与电价间的关系.
其中是相关关系的有( )
A.1个 B.2个 C.3个 D.4个
[答案] A
4.某考察团对全国1 0大城市的职工人均工资水平
x
(千元)与居民人均消费水平
y
(千元)进行 统计调查,
y

x
具有
相关关系,回归方程
y
=0 .66
x
+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消 费额占人均
工资收入的百分比约为( )
A.83% B.72% C.67% D.66%
[答案] A
[解析] 由7.675=0.66
x
+1.562得
x
=9.2621,则城市居民人均消费水平为7.675÷9. 2621≈83%.
--
5.线性回归方程y=bx+a 中,b的意义是______________.
[答案] x每增加一个单位,y就平均增加b个单位
6.下面是水稻产量与施化肥量的一组观测数据:
2




(1)将上述数据制成散点图;
(2)你 能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?
[分析] 描点可画出散点图,观察散点图中的点大致分布在一条直线附近,则线性相关.
[解析] (1)散点图如下:


(2)从图中可以发现数据点大致分布 在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,当施化肥量
由小到大变化时,水稻产 量由小变大,但水稻产量只是在一定范围内随着化肥施用量的增加而增长.
(四)典型例题
1.命题方向:利用散点图判断两个变量的相关关系
[例1] 5个学生的数学和物理成绩如下表:

画出散点图,并判断物理成绩和数学成绩是否有相关关系.
[解析]把数学成绩作为横坐标, 把相应的物理成绩作为纵坐标,在直角坐标系中描点(
xi

yi
)(
i
=1,2,…,5),作
出散点图如图.

从图中可以直观地看出数学 成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它
们正相关.
[点评] 在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系 ,即变量之间
具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如 果所有的样本点都落在某
一直线附近,变量之间就有线性相关关系.
3



提醒:函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.
跟踪练习1:
下表是某地的年降雨量(mm)与年平均气温(℃)的数据资料,两者是线性相 关关系吗?求回归直线方程有意义吗?

[解析] 以
x
轴为年平均气温,
y
轴为年降雨量,可得相应的散点图如图所示.因为图中各点并不在一条直线的附近,
所以两者不具有线性相关关系,没必要用回归直线进行拟合.如果用公式求得回归直线方程是没有意义的.
[点评] 如果两个变量不具有线性相关关系,即使求出回归方程也毫无意义,而且用其进行估计和预测也是不可信的.
2.命题方向:求回归直线方程
[例2] 在研究硝酸钠的可溶性程度时,对于不同的温度观测它在水中的溶解度,得观测结果如下:
温度(
x
)
溶解度(
y
)
0 10 20 50 70
66.7 76.0 85.0 112.3 128.0
55
2由资料看
y

x
呈线性相关,试求回归直线方程. (参考值:
?
x
i
y
i
=17035,
?
x
i
=7900)
i
=1
i
=1

0+10+20+50+ 70
[解析]
x
==30.
5

y

66.7+76.0+85.0+112.3+128.0
=93.6,
5
--?
x
i
y
i
-5
xy
i
=1
5
b

5
≈0.8809,
?
x
i
2< br>-5
x
2
i
=1

a

y

bx
=93.6-0.8809×30≈67.173
∴回归直线方程为
y
=0.8809
x
+67.173.
跟踪练习2
某工厂某产品产量与单位成本成线性相关关系,数据如下:
月份
1
2
3
4
5
6
合计

4
--
产量(千件)
x

2
3
4
3
4
5
21
单位成本(元
件)
y

73
72
71
73
69
68
426
x
2
4
9
16
9
16
25
79
xy

146
216
284
219
276
340
1481



根据以上数据求线性回归方程.
[解析] 设回归直线方程为
y

bx

a

66
21426
2
x
=,
y
==71,
?
x
i
=79,
?
x
i
y
i
=1481,
66
i
=1
i
=1
所以代入公式,
21
1481-6××71
6
-10
b
==≈-1.82,
21
?
2
5.5
?
79-6×
??
?6
?
a
=71-(-1.82)×≈77.66,
故回归直线方程为
y
=77.66-1.82
x
.
[点评] 最小二乘法
(1)最小二乘法是一种有效地求回归方程的方法,它保证了各点与此 直线在整体上最接近,最能反映样本观测数据的
规律.
(2)用最小二乘法求回归直线方程的步骤:

21
6

3.命题方向:利用回归方程对总体进行估计
[例3] (07·广东)下表提供了某厂节能 降耗技术改造后生产甲产品过程中记录的产量
x
(吨)与对应的生产能耗
y
( 吨
标准煤)的几组对应数据.
x

y

3
2.5
4
3
5
4
6
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出
y
关于
x
的线性回归方程
y

bx

a< br>;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性 回归方程,预测生产100吨甲产
品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
[解析] (1)由题设所给数据,可得散点图如下图.
5



4
(2)由表中数据,计算得:
?
x
i
=86,
2
i
=1
x

3+4+5+62.5+3+4+4.5
=4 .5,
y
==3.5,
44
4
已知
?
x
i
y
i
=66.5,
i
=1

所以,由最小二乘法确定的回归直线方程的系数为:
4
?
x
iy
i
-4
x
i
=1
·
y

6 6.5-4×4.5×3.5
=0.7,
2
86-4×4.5
b

4
?
x
i
2
-4
x
i
=1
2
a

y

bx
=3.5-0.7×4.5=0.35.
因此,所求的线性回归方程为
y
=0.7
x
+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90-(0.7×1 00+0.35)=
19.65(吨)标准煤.
跟踪练习3
下表是几个国家近年来的男性与女性的平均寿命情况(单位:岁).
国家
中国
韩国
马来西亚
美国
法国
日本
男性平均寿命(
x
) 女性平均寿命(
y
) 调查年号
70
73.4
71
78.1
75.5
78.6
73
80.4
75.5
82.6
82
85.6
2000
2002
2003
2005
2001
2004
^

(1)如果男性与女性的平均寿命近似成线性关系,求它们之间的回归直线方程;
(2)科学 家预测,到2075年,加拿大男性平均寿命为87岁.现请你预测,到2075年,加拿大女性的平均寿命(精 确
到0.1岁).
6



[分析] (1)本题若没有告诉 我们
y

x
间是呈线性相关的,应首先进行相关性检验.如果两个变量不具备 线性
相关关系,或者说它们之间相关关系不显著时,即使求出回归直线方程也没有意义的,而且其估计与 预测也是不可信
的.
--
2
(2)求回归直线方程的关键:计算出
x

y

?
x
i

?
x
i
y
i
.
i
=1
i
=1
nn
[解析] 列表如下
i
1
70
73

6
2
73.4
80.4
3
71
75.5
4
78.1
82.6
6451.06
5
75.5
82
6191
6
78.6
85.6
6728.16
x

i
y
i
i

x
y
i
5110 5901.36 5360.5
6
2< br>可得
?
x
i
y
i
=35742.08,
?< br>x
i
=33306.38,
i
=1
i
=1

x
≈74.43,
y
=79.85,
x
2
≈55 39.82.
--
^
(1)设所求回归直线的方程为
y

bx

a
,则
6
?
x
i
y
i
-6
x

y
^
i
=1
--
82.667
^--
=≈1.23 ,
a

y

bx
≈-11.7.
67.46b

6
?
x
i
2
-6
x
2< br>i
=1

^
∴所求回归直线方程为
y
=1.23x
-11.7.
(2)当
x
=87时,=1.23×87-11.7=95.31≈95.3.
∴可预测,到2075年,加拿大女性的平均寿命为95.3岁.

(五)思想方法点拨:
1.线性相关关系的理解:相关关系与函数关系不同.函数关系中的两 个变量间是一种确定性关系.例如正方形面积
S
与边长
x
之间的关系
S

x
2就是函数关系.相关关系是一种非确定性关系,即相关关系是非随机变量与随 机变量之
间的关系.例如商品的销售额与广告费的相关关系.两个变量具有相关关系是回归分析的前提.
2.求回归方程,关键在于正确求出系数
a

b
,由于
a< br>,
b
的计算量大,计算时应仔细谨慎,分层进行,避免因计算
而产生错误.(注 意回归直线方程中一次项系数为
b
,常数项为
a
,这与一次函数的习惯表示不 同).

(六)课后强化作业
一、选择题
1.(2010·湖南文)某 商品销售量
y
(件)与销售价格
x
(元件)负相关,则其回归方程可能是( )
7



^
A.
y
=-10
x
+200
[答案] A
^^
B.
y
=10
x
+200 C.
y
=-10
x
-200
^
D.
y
=10
x
-200
[解析] 本题主要考查变量的相关性.
由负相关的定义知,A正确.
2.下列有关线性回归的说法,不正确的是( )
A.变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B.在平面直角坐标系中用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图
C.线性回归方程最能代表具有线性相关关系的
x

y
之间的关系
D.任何一组观测值都能得到具有代表意义的线性回归方程
[答案] D
[解析] 只有对两个变量具有线性相关性作出判断时,利用最小二乘法求出线性方程才有意义.
3.设有一个回 归方程为
y
=2-2.5
x
,则变量
x
增加一个单位时,则 ( )
A.
y
平均增加2.5个单位 B.
y
平均增加2个单位
C.
y
平均减少2.5个单位 D.
y
平均减少2个单位
[答案] C
[解析] 由回归方程的系数b
=-2.5可知,
x
每增加一个单位,则
y
平均减少2.5个 单位
4.下列两个变量之间的关系不是函数关系的是( )
A.角度和余弦值
B.正
n
边形的边数和一个内角的度数
C.棱锥的体积和底面积
D.某种物质的溶解度和温度
[答案] D
5.已知某车间加工零件的个数
x
与所花费时间
y
(
h
)之间的线性回归方程为
y
=0.01
x
+0.5,则加工600个零件
大约需要__________
h
.( )
A.6.5
[答案] A
[解析] 将
x
=600代入回归方程即得
A
.
6.工人月工资
y< br>(元)依劳动生产率
x
(千元)变化的回归方程
y
=50+80
x
,下列判断正确的是( )
(1)劳动生产率为1000元时,工资为130元;
(2)劳动生产率提高1000元时,则工资提高80元;
(3)劳动生产率提高1000元,则工资提高130元;
(4)当月工资为210元时,劳动生产率为2000元.
A.(1)
[答案] B
7.在一次实验中,测得(
x

y
)的四组 值分别是
A
(1,2),
B
(2,3),
C
(3,4),< br>D
(4,5),则
y

x
之间的回归直线方
程为( )
8
B.5.5 C.3.5 D.0.5
B.(2) C.(3) D.(4)



A.
y

x
+1
[答案] A
B.
y

x
+2 C.
y
=2
x
+1 D.
y

x
-1
[解析] A、B、C、D四点在同一条直线上.
8.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是( )
A.
y
=1.23
x
+4 B.
y
=1.23
x
+5
C.
y
=1.23
x
+0.08 D.
y
=0.08
x
+1.23
[答案] C
[解析] 回归直线方程一定经过样本点的中心,检验知
y
=1.23
x
+0.08符合 题意.
二、填空题
9.(2010·广东文)某市居民2005~2009年家庭年平均收 入
x
(单位:万元)与年平均支出
Y
(单位:万元)的统计
资料如下 表所示:
年份

收入
x
支出
Y
2005

11.5

6.8

2006

12.1

8.8

2007

13

9.8

2008

13.3

10

2009
15
12
根据统计资料,居民家庭平均收入的中位数是___ _______,家庭年平均收入与年平均支出有__________线性相关
关系.
[答案] 13 正
[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是 中位数,而偶数个时须取中间两数的平均
数.,
r
≈0.97,正相关.
1 0.为考虑广告费用
x
与销售额
y
之间的关系,抽取了5家餐厅,得到如下数 据:
广告费用(千元)

销售额(千元)

1.0

19.0

4.0

44.0

6.0

40.0

10.0

52.0

14.0
53.0
现在使销售额达到6万元,则需广告费用为________.(保留两位有效数字)
[答案] 1.5万元
[解析] 先求出回归方程
y

bx

a
,令
y
=6,得
x
=1.5万元.
11.已知在某种实践运动中获得一组数据:
i
x
i

y
i

1

12

5.4

2

17



3

21

9.3

4
28
13.5
其中不慎将数据
y
2
丢失,但知道这四组数据符合线性关系:
y
=0.5
x

a
,则
y
2

a
的近似值为________.
[答案] 8,-0.7
[解析] 由题意,得
x
=19.5,
y

28.2+
y
2
.
4
9



4
?

x
i

x
i
=1
y
i

y
=0.5中,得
y
2< br>≈8. 代入
4
?

x
i

x
i< br>=1
2
所以
y
=9.05,
a

y

b

x
≈9.05-0.5×19.5=-0.7.
三、解答题
12.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如下表:
身高(cm)

体重(kg)

143

41

156

49

159

61

172

79

165

68

171

69

177

74

161

69

164

68

160
54
根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.
[解析] 以
x
轴表示身高,
y
轴表示体重,可得到相应的散点图如图所示:

由散点图可知,两者之间具有相关关系,且为正相关.
13.某种产品的广告费支出
x
与销售额(单位:百万元)之间有如下对应数据:
x
y
如果
y

x
之间具有线性相关关系.
(1)作出这些数据的散点图;
(2)求这些数据的线性回归方程;
2

30

4

40

5

50

6

60

8
70
(3)预测当广告费支出为9百万元时的销售额.
[解析] (1)

10



--
2
(2)
x
=5,< br>y
=50,
?
x
i
y
i
=1390,
?
x
i
=145,
i
=1
i
=1
55
5
?
x
i
y
i
-5
x
·
y
i
=1
--
--
=7,
a

y

bx
=15,
b

5
?
x
i
2
-5
x
2
i
=1

∴线性回归方程为
y
=7
x
+15.
(3)当
x
=9时,
y
=78.
即当广告费支出为9百万元时,销售额为78百万元.
14.某车间为了规定工时定额,需要 确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:

零件的个数
x
(个)

加工的时间
y
(小时)

(1)在给定的坐标系中画出表中数据的散点图;
2

2.5

3

3

4

4

5
4.5

^
(2)求出
y
关于
x
的线性 回归方程
y

bx

a
,并在坐标系中画出回归直线;
(3)试预测加工10个零件需要多少时间?
--
?
x
i
y
i

nxy
i
=1
n
(注:
b

n
--

a

y

bx
) < br>-
?
x
i
2

nx
2
i
= 1
[解析] (1)散点图如右图.
4
(2)由表中数据得
?
x< br>i
y
i
=52.5,
i
=1
--
x
=3.5,
y
=3.5,
?
x
i
2
=54, < br>i
=1
4

b
=0.7.∴
a
=1.05.

y
=0.7
x
+1.05.回归直线如图所示.
11



(3)将
x
=10代入回归直线方程得,
y
=0.7×10+1.05=8.05(小时),
∴预测加工10个零件需要8.05小时.
15.某电脑公司有6名产品推销员,其工作年限与年推销金额的数据如下表:
推销员编号

工作年限
x


推销金额
y
万元

1

3

2

2

5

3

3

6

3

4

7

4

5
9
5
(1)以工作年限为自变量
x
,推销金额为因变量
y
,作出散点图;
(2)求年推销金额
y
关于工作年限
x
的线性回归方程;
(3)若第6名推销员的工作年限为11年,试估计他的年推销金额.
[解析] (1)依题意,画出散点图如图所示.

--
(2)从散点图可以看出,这些点大致 在一条直线附近,设所求的线性回归方程为
y

bx

a
. 由题意知
x
=6,
y

3.4,

?

x
i

x
i
=1
5
y
i

y

10
--
==0.5,
a

y
bx
=0.4,
20

b


?

x
i

x
i
=1
5
2
∴年推销金额
y
关于工作 年限
x
的线性回归方程为
y
=0.5
x
+0.4.
(3)由(2)可知,当
x
=11时,
y
=0.5
x
+0.4=0.5×11+0.4=5.9(万元).
∴可以估计第6名推销员的年推销金额为5.9万元.


第四节 统计案例
(一)高考目标
考纲解读
1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
2.了解回归分析的基本思想、方法及其简单应用.
考向预测
12



1.对独立性检验及回归分析的考查是高考的热点.
2.预计本部分内容在高考中出选择题、填空题,常以判断命题正误的形式出现,为中低档题.
(二)课前自主预习
知识梳理
1.线性相关系数
(1)公式
两个随机变量的数据分别为(
x
1

y
1
)(
x< br>2

y
2
)…(
x
n

y
n
),
n
?
x
i
y
i

n

x

y
i
=1
则变量间线性相关系数
r

nn
22

?
x
i

n

x
i
=1
?
y
i
2

n

y
2
i
=1
(2)性质

r
∈ ;
②|
r
|值越大,变量之间的线性相关程度 ;
|
r
|越接近0,变量之间线性相关程度越低.
③当
r
>0,两个变量 ;

r
<0,两个变量负相关;

r
=0,两个变量线性不相关.
2.独立性检验

A

B
为两个变量,每一个变量都可以取两个值,变量
A

A
1

A
2

A
1
;变量
B

B
1

B
2

B
1
.
通过观察得到下表所示数据:

B
1

a

c

a

c

B
2

b

d

b

d

合计
A
1

A
2

总计
a

b

c

d

n

a

b

c

d

其中,
a
表示变量
A

A
1
,且变量B

B
1
时的数据;
b
表示变量
A

A
1
,且变量
B

B
2
时的数据;
c
表示变量
A

A
2

且变量
B

B
1
时的数据;
d
表示变量
A

A< br>2
,且变量
B

B
2
时的数据.

χ
2= .
(1)当
χ
2≤ 时,认为变量
A

B
是没有关联的;
(2)当
χ
2>2.706时,有 的把握判定变量
A

B
有关联;
(3)当
χ
2> 3.841时,有95%的把握判定变量
A

B
有关联;
(4)当
χ
2> 时,有99%的把握判定变量
A

B
有关联.

(三)基础自测
1.对于独立性检验,下列说法中错误的是( )
A.
χ
2值越大,说明两事件相关程度越大
B.
χ
2值越小,说明两事件相关程度越小
13



C.
χ
2≤3.841时,有95%的把握说事件
A

B< br>无关
D.
χ
2> 6.635时,有99%的把握说事件
A

B
无关
[答案] C
2.为了研究性格和血型的关系,抽查80人实验,血型和性格情况如下:
O
型或A
型者是内向型的有18人,外向型
的有22人,
B
型或
AB< br>型是内向型的有12人,是外向型的有28人,则有多大的把握认为性格与血型有关系( )
P
(
χ

k
0)
k
0
0.5
0.455
0.10
2.706
0.010
6.635
0.001
10.828
D.1% A.99.9% B.99% C.没有充分的证据显示有关
[答案] C
[解析]

外向
内向
总计
2
O
型或
A

22
18
40
2
B
型或
AB

28
12
40
总计
50
30
80 < br>2
80×22×12-28×18
χ
==
50×30×40×4050 ×30×40×40
nn
11
n
22

n
12n
21
≈1.92<3.841,∴没有充分的证据显示有关.
3.下列有关样本相关系数的说法不正确的是( )
A.相关系数用来衡量
x

y
之间的线性相关程度
B.|
r
|≤1,且|
r
|越接近于1,相关程度越大
C.|
r
|≤1,且|
r
|越接近于0,相关程度越小
D.|
r
|≥1,且|
r
|越接近于1,相关程度越大
[答案] D
4.
r
是相关系数,则下列叙述中正确的个数为( )

r
∈[-1,-0.75]时,两变量负相关很强;

r
∈[0.75,1]时,两变量正相关很强;

r
∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般;

r
=0.1时,两变量相关性很弱.
A.1 B.2 C.3 D.4
[答案] D
5.下面是一个2×2列联表

y
1

a

12
y
2

21
25
46
总计
73
37

x
1

x
2

总计
b

则表中
a

b
处的值分别为________.
[答案] 52 64
[解析] ∵
a
+21=73,∴
a
=52.
又∵
a
+12=
b
,∴
b
=64.
6.下列是某厂1~4月份用水量(单位:百吨)的一组数据,
月份
x
1 2 3 4
14



用水量
y
4.5 4 3 2.5
由其散点图可知,用水量
y
与月份
x
之间有较好的线性相关 关系,其线性回归方程是
y
=-0.7
x

a
,则
a
=______.
[答案] 5.25
[解析]
a?y?bx?3.5?0.7?2.5?5.25

7.某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:

学习积极性高
学习积极性一般
合计
积极参加班级工作
18
6
24
不太主动参加班级工作
7
19
26
合计
25
25
50
(1)如果随机抽查这个 班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作
且学习积极 性一般的学生的概率是多少?
(2)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级 工作的态度是否有关系?并说明理由.
241212
[解析] (1)积极参加班级工作的学生有24人,总人数为50,频率为=,∴概率约为;
50252519
不太主动参加班级工作且学习积极性一般的学生有19人,∴概率约为.
50
50×18×19-6×7
(2)
χ

25×25×24×26
2
2

150
≈11.5,
13

χ
>6.635,
∴有99%的把握认为学习积极性与对待班级工作的态度有关系.

2
(四)典型例题
1.命题方向:线性回归分析
[例1] 一个车间为了 规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下表所
示:
零件数
10 20 30 40 50 60 70 80 90 100
x
(个)
加工时间
y
(min)
62 68 75 81 89 95 102 108 115 122
(1)画出散点图,并初步判断是否线性相关;
(2)若线性相关,求出回归直线方程;
(3)求出相关系数.
[分析] 由散点图进行判断是否存在线性相关,再进行求解.
[解析] (1)由
x

y
数据得散点图,由散点图可以认为样本点大致分布在某条直线的附近,因此可以用线性回归模型来拟合.设回归模型为
y

a

bx
,散点图如下:
15





由散点图可以看出所描点大致分布在一条直线附近,所以初步判定数据线性相关.
n
(2)由数据表得:
?
x
i
y
i
=55 950,
i
=1
n
x
=55,
y
=91.7,< br>?
x
i
2
=38 500.
i
=1
55 950-10×55×91.7
由以上数据得
b
=≈0.668.
2
38 500-10×55
^
a

y

b

x
=91.7-0.668×55=54.96.
∴回归直线方程为
y
=0.668
x
+54.96.
(3 )相关系数
r
≈0.9998>0.632.即
y

x
具有 相关关系.
[点评] 借助作图和制表可以做到准确无误,也可以借助科学计算器和计算机进行计算.
跟踪练习1
(2011·广州模拟)许多因素都会影响贫穷,教育也许是其中之一,在研究这 两个因素的关系时收集了美国50个州的
成年人受过9年或更少教育的百分比(
x
)和 收入低于官方规定的贫困线的人数占本州人数的百分比(
y
)的数据,建立的
回归直线 方程为
y
=0.8
x
+4.6,斜率的估计值等于0.8说明_______ _______________________,成年人受过9年或
更少教育的百分比(
x
)和收入低于官方规定的贫困线的人数占本州人数的百分比(
y
)之间的相关系数__ ______(填“大
于0”或“小于0”).
[答案] 一个地区受9年或更少教育的百分 比每增加1%,收入低于官方规定的贫困线的人数占本州人数的百分比将
增加0.8%左右 大于0
[解析] 由回归方程知
b
=0.8,
a
=4.6,再由
x

y
表示的实际意义可知0.8的含义,相关系数
r
>0

2.命题方向:独立性检验
[例2] 在一次恶劣的气候的飞行航程中调查男女乘客在飞机上 晕机的情况,共调查了89位乘客,其中男乘客有24
人晕机,31人不晕机,女乘客有8人晕机,26 人不晕机.根据此材料您是否认为在恶劣气候飞行中男人比女人更容
易晕机?
[分析] 作出2×2列联表并进行独立性检验.
[解析] 由已知数据制成下表.
晕机 不晕机 合计
16



男人
女人
合计
2
24
8
32
31
26
57
2
55
34
89

χ
的计算公式得
χ
的观测值为
89×24×26-31 ×8
k

55×34×32×57
2
≈3.689.
24
由于
k
>2.706,我们有90%的把握认为在本次飞机飞行中,晕机与男女有关. 尽管这次航班中男人晕机的比例()
55
8
比女人晕机的比例()高,但我们不能认为 在恶劣气候飞行中男人比女人更容易晕机.
34
[点评] 进行独立性检验时,通常有以下几个步骤:
①根据数据绘制成表格;
②根据公式求出
χ
2值;
③比较
χ
2与临界值的关系;
④作出统计推断.
跟踪练习2
为了调查胃病是否与生活规律有关,对某地540名40岁以上的人进行调查,结果如下:

生活无规律
生活有规律
合计
患胃病
60
20
80
未患胃病
260
200
460
合计
320
220
540

根据以上数据,你认为40岁以上的人患胃病与生活规律有关吗?
[解析] 根据计算公式有
540×60×200-20×260
χ

80×460×220×320< br>2
2


540×6 800×6 800135×17×17
=≈9.6
80×460×220×32046×11×8
因为9.6>6.635,所以有99%的把握说“40岁以上的人患胃病与生活规律是有关的”.
3.命题方向:非线性回归分析
[例3] 下表是某年美国旧轿车价格的调查资料,今以x
表示轿车的使用年数,
y
表示相应的年均价格,求
y
关于x
的回归方程.
使用年数
x

年均价格
y
(美元)
1 2 3 4 5 6 7 8 9 10
2 651 1 943 1 494 1 087 765 538 484 290 226 204
[解析] 作出散点图如图1,
17












可以发现,各点并不是基本处于一条直线附近, 因此,
y

x
之间应是非线性相关关系.与已学函数图像比较,用
y

ebx

a
来刻画题中模型更为合理,令
z
=l n
y
,则
z

bx

a
,题中数据变成如 下表所示:
x
1 2
7.572
3
7.309
4
6.991
5
6.640
6
6.288
7
6.182
8
5.670
9
5.421
10
5.318
y
7.883
相应的散点图如图2,从图2 可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归方程拟合.

由表中数据 可得
r
≈-0.996.|
r
|>0.75.认为
x
z
之间具有线性相关关系,由表中数据得
b
≈-0.298,
a
≈8.165,
所以
z
=-0.298
x
+8.165,最后回代< br>z
=ln
y
,即
y

e
-0.298
x
+8.165为所求.
跟踪练习2
调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况获得数据如下:

吸烟
不吸烟
合计
患慢性气管炎
43
13
56
未患慢性气管炎
162
121
283
总计
205
134
339

试问:(1)吸烟习惯与患慢性气管炎是否有关?
(2)用假设检验的思想给予证明.
[解析] 这是2×2的列联的独立性检验.
(1) 根据列联表的数据,得到
?
2
?
339?
(43 ?121?162?13)
205?56?283?134
2
?7.469?6.63 5

18



所以有99%的把握认为“吸烟与患慢性气管炎有关”.
(2)假设“吸烟与患慢性气管炎之 间没有关系”,由于事件
A
={
χ
2≥6.635}≈0.01,即
A
为小概率事件,而小概率事
件发生了,进而得假设错误,这种推断出错的可能性约有1%.
[点评] 根据假设检验的思想,比较计算出的
χ
2与临界值的大小,选择接受假设还是拒绝假设.

(五)思想方法点拨
1.独立性检验的一般步骤
(1)根据样本数据制成2×2列联素.
(2)根据公式
χ

2< br>2
a

b
nad

bc
2
c

da

cb

d
,计算
χ
的值.
2
(3)比较
χ
与临界值的大小关系作统计推断.
2.回归方程
(1)线性回归方程:我们把相关关系(不确定性关系)转化为函数关系(确定性关系),当两个具有相 关关系的变量近似
^
地满足一次函数关系时,我们所求出的函数关系
y
bx

a
就是回归直线方程.求回归直线方程的一般方法是借助于
--^
工作软件求出回归直线方程,也可利用计算器计算出
b
,再由
a
=< br>y

bx
,求出
a
,写出回归直线方程
y

bx

a
.
^
可以利用回归直线方程
y

a

bx
求出
x
取某一个值时,
y
的估 计值.
(2)非线性回归方程:非线性回归问题有时并不给出经验公式,此时我们可以由已知的数据画 出散点图,并把散点图
与已经学习过的各种函数如幂函数、指数函数、对数函数、二次函数等作比较,挑 选出跟这些散点拟合最好的函数,
然后再采用变量的置换,把问题转化为线性回归分析问题,使问题得以 解决.
注意:线性回归方程中的
a

b
都是通过样本估计出来的, 存在随机误差,这种误差可以导致预测结果的偏差,另外,
我们选用的线性模型只是一种近似模型.

(六)课后强化作业
一、选择题
1.对于事件
A
和 事件
B
,通过计算得到
χ
的观测值
χ
≈4.514,下列说 法正确的是( )
A.有99%的把握说事件
A
和事件
B
有关
B.有95%的把握说事件
A
和事件
B
有关
C.有99%的把握说事件
A
和事件
B
无关
D.有95%的把握说事件
A
和事件
B
无关
[答案] B
[解析] 由独立性检验知有95%的把握说事件
A

B
有关. < br>2.某化工厂为预测某产品的回收率
y
,需要研究它和原料有效成分含量
x之间的相关关系,现取了8对观察值,
888
2
22
n
计算得< br>?
x
i
=52,
?
y
i
=228,
?
x
i
=478,
?
x
i
y
i
= 1849,则
y

x
的回归方程是( )
i
=1
i
=1
i
=1
i
=1
^^
A.
y
=11.47+2.62
x
B.
y
=-11.47+2.62
x

19



^^
C.
y
=2.62+11.47
x
D.
y
=11.47-2.62
x

[答案] A
3.假 设有两个分类变量
X

Y
,它们的可能取值分别为{
x
1< br>,
x
2
}和{
y
1

y
2
},其2×2列联表为:

x
1

x
2

总计

y
1

a
c
a

c
y
2

b
d
b

d
总计
a

b

c

d

a

b

c

d

以下各组数据 中,对于同一样本能说明
X

Y
有关系的可能性最大的一组为( ) A.
a
=5,
b
=4,
c
=3,
d
= 2 B.
a
=5,
b
=3,
c
=4,
d
=2
C.
a
=2,
b
=3,
c
=4,
d
=5 D.
a
=2,
b
=3,
c
=5,
d
=4
[答案] D
n

ad

bc

2
[解析] 可以由公式
χ


a

b
)(
c

d
)(
a

c
)(
b

d< br>)
2
分别计算
χ
的观测值,用
χ
的大小来决定
X

Y
有关系的可能性的大小.
4.某卫生机构对366人进行健康体检 ,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者
糖尿病发病的有17人,不发 病的有240人,有______的把握认为糖尿病患者与遗传有关系.( )
A.99.9%
[答案] D
[解析] 可以先作出如下列联表(单位:人):
糖尿病患者与遗传列联表
B.99.5% C.99% D.97.5%
22

阳性家族史

阴性家族史

总计

糖尿病发病

16

17

33

糖尿病不发病

93

240

333

总计
109
257
366
根据列联表中的数据,得到
χ
的观测值为
366×16×240-17×9 3
χ

109×257×33×333
2
2
2
≈6 .067>5.024.
故我们有97.5%的把握认为糖尿病患者与遗传有关系.
5.下列关于
χ
的说法中正确的是( )
A.
χ
在任何相互独立问题中都可以用来检验有关还是无关
B.
χ
的值越大,两个事件的相关性就越大
C.
χ
是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.
χ
的观测值的计算公式为
χ

[答案] C
22
2
2
2
2
a

b
nad
-< br>bc
c

da

cb

d

20



[解析]
χ
值是用来判断两个分类变量是 否有关系的一个随机变量,并不是适应于任何独立问题的相关性检验.
6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若
χ
的观测值为
k
=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在1 00个吸烟的人中必有99人患
有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患 肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误
D.以上三种说法都不正确
[答案] C
[解析] 通过
χ
的观 测值对两个变量之间的关系作出的判断是一种概率性的描述,是一种统计上的数据,不能
把这种推断结果 具体到某一个个体上.
7.为调查中学生近视情况,某校男生150名中有80名近视,女生140名 中有70名近视,在检验这些中学生眼
睛近视是否与性别有关时用什么方法最有说服力( )
A.期望与方差
[答案] C
8.(2011·南通模拟)对两个变量y

x
进行回归分析,得到一组样本数据:(
x
1
,< br>y
1
),(
x
2

y
2
),…,(
x
n

y
n
),
则下列说法中不正确的是( )
^--
A.由样本数据得到的回归方程
y

bx

a
必过样本中心(
x

y
)
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数
R
来刻画回归 效果,
R
越小,说明模型的拟合效果越好
D.若变量
y

x
之间的相关系数为
r
=-0.9362,则变量
y

x< br>之间具有线性相关关系
[答案] C
[解析] C中应为
R
越大拟合效果越好.
二、填空题
9.若两个分类变量
x

y
的列联表为:
2
22
2
2
2
B.排列与组合 C.独立性检验 D.概率

x
1

x
2

则变量
y

x
有关系的可能性应为________.
[答案] 0.999
70×5×10-40×15
[解析]
χ

45×25×20×50
2
2
y
1

5

40

y
2

15
10
≈18.82>10.828,
故有99.9%的把握认为
x

y
有关系.
10.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:

冷漠

不冷漠

总计
21



多看电视

少看电视

总计

68

20

88

42

38

80

110
58
168
则大约有________的把握认为多看电视与人变冷漠有关系.
[答案] 99.9%
[解析] 首先算得
χ
的值,然后查表可得概率.
11.已知两个变量
x

y
线性相关,5次试验的观测数据如下:
2
x
y
100

45

120

54

140

62

160

75

180
92
那么变量
y
关于
x
的回归方程是________.
^
[答案]
y
=0.575
x
-14.9
^
[解析] 由线性回归参数公式可求出
b
=0.575,
a
=-14.9,∴回归方程为
y
=0.575
x
-14.9.
三、解答题
12.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表. 试问能以多大把握认为婴儿的性
别与出生时间有关系.
出生时间
性别

男婴

女婴

合计

2
晚上

24

8

32

白天

31

26

57

合计
55
34
89
[分析] 利用表中的数据通过公式计算出
χ
统计量,可以用它的值的大小来推断独立性是否成立.
89×24×26-8×31
[解析] 由公式
χ

55×34×3 2×57
2
2
≈3.68892>2.706,有90%把握认为有关系.
13.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示:

黑穗病

无黑穗病

合计

试按照原试验目的作统计分析推断.
种子灭菌

26

50

76

种子未灭菌

184

200

384

合计
210
250
460
[解析] 假设种子灭菌与黑穗病没有关系,则有
a
=26,b
=184,
c
=50,
d
=200,
a
+< br>b
=210,
c

d
=250,
a

c
=76,
b

d
=384,
n
=460,
代入公式求得
n

ad

bc

2460×26×200-184×50
χ
==

a

b
)(
c

d
)(
a

c
)(b

d
)250×210×76×384
2
2
≈4.8 04.
22



因为
χ
≈4.804>3.841 ,因此我们有95%的把握认为种子灭菌与小黑穗病有关系.
14.在调查的180名男性中有38名 患有色盲,520名女性中有6名患有色盲,分别利用图形和独立性检验的方
法来判断色盲是否与性别有 关,你所得到的结论在什么范围内有效?
[分析] 本题应首先作出调查数据的2×2列联表,并进行分析,最后利用独立检验作出判断.
[解析] 根据题目所给的数据作出如下的列联表:
2





合计

根据2×2列联表所给的数据可以有
1000×38×514-44 2×6
χ

480×520×44×956
2
2
2
色盲

38

6

44

不色盲

442

514

956

合计
480
520
1000
≈27.1.

χ
=27.1>6. 635,所以我们有99%的把握认为性别与患色盲有关系.这个结论只对所调查的480名男性和520
名女性有效.
[点评] 在利用
χ
统计量进行独立性检验时,应该熟练掌握计算公 式,注意准确地代入数据和计算,牢记临界
值,将计算结果与临界值进行比较,得出相应的结论,并且结 论都是概率性的描述.
15.假设关于某设备的使用年限
x
和所支出的维修费用y
(万元)有如下统计资料:
2
x
y
2

2.2

3

3.8

4

5.5

5

6.5

6
7.0
若由资料知,
y

x
呈线性关系,试求:
^
(1 )回归直线方程
y

bx

a
的回归系数;
(2)估计使用年限为10年时,维修费用约是多少?
[解析] (1)列表:
i
x
i

y
i

x
i
y
i

1

2

2.2

4.4

2

3

3.8

11.4

3

4

5.5

22.0

4

5

6.5

32.5

5
6
7.0
42.0
--
x
=4,
y
=5,
5
2
5
?
x
i
=90,
?
x
i
yi
=112.3.
i
=1
i
=1
23



--
?
x
i
y
i
-5< br>xy
i
=1
5
其中,
b

5
?x
i
2
-5
x
2
i
=1

1 12.3-5×4×512.3
===1.23,
2
90-5×410
a< br>=
y

bx
=5-1.23×4=0.08,
(2)回归直线方程为
y
=1.23
x
+0.08.
^< br>当
x
=10时,
y
=1.23×10+0.08=12.38(万元) ,
即估计用10年时,维修费约为12.38万元.


--
24

高中数学有专题有几个-高中数学1-1期末考试


高中数学课本文档-高中数学练与考


全国高中数学竞赛试题 pdf-高中数学函数典例训练


高中数学中设而不求思想的运用-高中数学必修1试卷 7c


教资2019下半年高中数学科目三-高中数学必做的题


高中数学解答题答题技巧-高中数学有用冷门公式


高中数学考点包括什么区别-高中数学倒数选择题


高中数学分数低要注意的方法和细节-高中数学教师资格证考试答题技巧



本文更新与2020-09-17 21:51,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/401982.html

适用于教育机构高考数学专题辅导讲义《27统计(二)》的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
适用于教育机构高考数学专题辅导讲义《27统计(二)》随机文章