什么是高中数学必修12345-动画课堂 高中数学
【高中数学】统计案例
§1.1.1回归分析的基本思想及其初步应用(一)
学习目标
1. 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2. 了解线性回归模型与函数模型的差异,了解衡量两个变量之间线性相关关系得方法---
相关系数.
学习过程
一. 课前准备
(预习教材P
2
~
P
4
,找出疑惑之处)
问题1:“名师出高徒”这句彦语的意思是什么?有名气的老
师就一定能教出厉害的学生吗?这两者之间是否有关?
复习1:函数关系是一种
关系,而相关关系是一种 关系.
复习2:回归分析是对具有
关系的两个变量进行统计分析的一种常用方法,其步骤:
?
?
?
.
二. 新课导学
※ 学习探究
实例:从某大学中随机选取8名女大学生,其身高cm和体重kg数据如下表所示:
编号
身高
体重
1
48
2
57
3
50
4
54
5
64
6
61
7
43
8
59
165 165 157 170 175
165 155 170
问题:画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并
预报一名身高为172cm的女大学生的体重.
解:由于问题中要求根据身高预报体重,因此
选 自变量x, 为因变量.
(1)做散点图:
从散点图可以看出 和 有比较好的 相关关系.
(2)
x
=
y
=
?
xy
i
i?1
8
i
?
?
x
i?1
8
2
i
?
?
?
所以
b
?
xy
i
i?1
8
8
i
?8xy
?8x
2
?
?
?y?bx
?
?
a
?
x
i?1
2
i
于是得到回归直线的方程为
(3)身高为172cm的女大学生,由回归方程可以预报其体重为
?
y?
问题:身高为172cm的女大学生,体重一定是上述预报值吗?
思考:线性回归模型与一次函数有何不同?
第
1 页
新知:用相关系数r可衡量两个变量之间 关系。计算公式为:r =
r>0, 相关,r<0 相关。
相关系数的绝对值越接近于1,两个变量的线性相关关系 ,它们的散点图越接近
;
r?
,两个变量有 关系.
※
典型例题
例1:某班5名学生的数学和物理成绩如下表:
学生
学科
数学成绩(x)
物理成绩(y)
(1)画散点图.
(2)求物理成绩y对数学成绩x的回归直线方程.
(3)该班某学生数学成绩为96,试预测其物理成绩.
(4)变式:该班某学生数学成绩为55,试预测其物理成绩.
小结:求线性回归方程的步骤:
※ 动手试试
练习:(07广东文科卷)下表提供了某厂节能降耗技术
改造后生产甲产品过程中记录的产量
x
(吨)与相应的生产能耗
y
(吨
标准煤)的几组对照数据
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出
y
关于
x
的线性回归方程
y?bx?a
;
(3)已知该厂
技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品
的
生产能耗比技改前降低多少吨标准煤?
(参考数值
3?2.5?4?3?5?4?6?4.5?66.5
)
第 2 页
A B C D E
88
78
76
65
75
70
64
62
62
60
x
3
4
5
6
y
2.5
3
4
4.5
学习评价
※
当堂检测(时量:5分钟 满分:10分)
1. 下列两个变量具有相关关系的是( )
A. 正方体的体积与边长
C.人的身高与体重
B.
人的身高与视力
D.匀速直线运动中的位移与时间
B. 解释变量在x 轴上,预报变量在
y 轴上
D. 可选择两个变量中任意一个变量在 y 轴上
2.
在画两个变量的散点图时,下面哪个叙述是正确的( )
A. 预报变量在x 轴上,解释变量在
y 轴上
C. 可以选择两个变量中任意一个变量在x 轴上
?
?a
?
必过( ) 3.
回归直线
?
y?bx
A.
(0,0)
B.
(x,0)
C.
(0,y)
D.
(x,y)
4.
r
越接近于1,两个变量的线性相关关系
.
5. 已知回归直线方程
?
y?0.5x?0.81
,则
x?2
5
时,y的估计值为 .
课后作业
一台机器使用的时间
较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有
缺点零件的
多少,随机器的运转的速度而变化,下表为抽样试验的结果:
转速x (转秒)
有缺点零件数 y (件)
(1)画散点图;
(2)求回归直线方程;
(3)若实际生产中,允许每小时的产品中有缺点的零件最多为 10
个,那么机器的运转速度应控制在什么范围内?
§1.1.1回归分析的基本思想及其初步应用(二)
学习目标
1.
通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用;
2.
了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.
3.
会用相关指数,残差图评价回归效果.
学习过程
一、课前准备
(预习教材P
4
~ P
7
,找出疑惑之处)
复习:评价回归效果的三个统计量:总偏差平方和;残差平方和;回归平方和.
二、新课导学
※ 学习探究
探究任务:如何评价回归效果?
新知:
1.
评价回归效果的三个统计量
(1)总偏差平方和:
(2)残差平方和:
第 3 页
16
11
14
9
12
8
8
5
(3)回归平方和:
2. 相关指数:
R
2
表示 对
的贡献,公式为:
R
2
?
R
2
的值越大,说明残差平方和 ,说明模型拟合效果 .
3. 残差分析:通过
来判断拟合效果.通常借助 图实现.
残差图:横坐标表示
,纵坐标表示 .
残差点比较均匀地落在
的区的区域中,说明选用的模型 ,带状区域的宽度越 ,说明拟
合精度越
,回归方程的预报精度越 .
※ 典型例题
例1:关于
x
与y有如下数据:
x
2
30
4
40
5
60
6
50
8
70
y
为了对
x
、y两个变量进行统计分析,现有以下
两种线性模型:
?
y?6.5x?17.5
,
?
y?7x?17,试比较哪一个模型拟
合的效果更好?
小结:分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏.
例2:假定小麦基本苗数x与成熟期有效苗穗y之间存在相关关系,今测得5组数据如下:
x
15.0
39.4
25.8
42.9
30.0
42.9
36.6
43.1
44.4
49.2
y
(1)画散点图;
(2)求回归方程并对于基本苗数56.7预报期有效穗数.
(3)求
R
2
,并说明残差变量对有效穗数的影响占百分之几.
(参考数据:
?
x
i
?5101.51,
?
x
i<
br>y
i
?6746.76,
2
i?1i?1
nn55
?
(y
i?1
i
?y)?50.18
,
2
?
(y
i?1
i
?
?
y
i
)
2
?
9.117
)
第 4 页
※ 动手试试
练1:某班5名学生的数学和物理成绩如下表:
学生
学科
数学成绩(x)
物理成绩(y)
(导学案第2页例1)
88
78
76
65
75
70
64
62
62
60
A B C D E
?
?y?
?
(
4)求学生A,B,C,D,E的物理成绩的实际成绩和回归直线方程预报成绩的差
ey
i.并作出残差图评价拟合效果.
i2
小结:1.
评价回归效果的三个统计量.
2. 相关指数评价拟合效果.
3.
残差分析评价拟合效果.
小结:一般地,建立回归模型的基本步骤:
1.
确定研究对象,明确解释、预报变量;
2. 画散点图;
3.
确定回归方程类型(用r判定是否为线性);
4. 求回归方程;
5. 评价拟合效果.
※ 知识拓展
在现行回归模型中,相关指数
R
2
表示解
释变量对预报变量的贡献率,
R
2
越接近于1,表示回归效果越好.如果某组
数据可以采取几种不同的回归方程进行回归分析,则可以通过比较
R
2
作出选择,即选
择
R
2
大的模型.
学习评价
※
当堂检测(时量:5分钟 满分:10分)
1. 两个变量 y与x的回归模型中,分别选择了 4
个不同模型,它们的相关指数
R
2
如下 ,其中拟合效果最好的模型是( )
A. 模型 1 的相关指数
R
2
为 0.98
C. 模型
3 的相关指数
R
2
为 0.50
A. 残差
2. 在回归分析中,残差图中纵坐标为( )
B. 样本编号 C. x
D.
e
n
D. 散点图分析
3. 通过
e
1
,e
2
,?,e
n
来判断模拟型拟合的效果,判断原始数据中是否存
在可疑数据,这种分工称为( )
A.回归分析 B.独立性检验分析
C.残差分析
4.
R
2
越接近1,回归的效果
.
5. 在研究身高与体重的关系时,求得相关指数
R
2
?
,可以叙述为“身高解释了
69%
的体重变化,而随机误差
贡献了剩余
”所以身高对体重的效应比随机误差的 .
第 5 页
B. 模型 2 的相关指数
R
2
为 0.80
D. 模型 4
的相关指数
R
2
为 0.25
课后作业
练习:(07广东
文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量
x
(吨)与相应的生
产能耗
y
(吨
标准煤)的几组对照数据
(1)请画出上表数据的散点图.
(2)请根据上表提供的数据,用最小二乘法求出
y
关于
x
的线性回归方程
y?bx?a
.
(3)已知该厂
技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品
的
生产能耗比技改前降低多少吨标准煤?
(参考数值
3?2.5?4?3?5?4?6?4.5?66.5
)
(4)求相关指数评价模型.
§1.2.1独立性检验的基本思想及其初步应用
学习目标
1. 通过探究“
吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在
吸
烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的必要性.
2.
会根据
2?2
列联表求统计量
K
.
学习过程
一、课前准备
(预习教材P
12
~
P
14
,找出疑惑之处)
二、新课导学
※ 学习探究
新知1:1. 分类变量: .
2.
2?2
列联表:
.
试试:你能列举出几个分类变量吗?
探究任务:吸烟与患肺癌的关系
1. 由列联表可粗略的看出:
(1)不吸烟者有 患肺癌.
(2)不吸烟者有 患肺癌.
因此,直观上课的结论:
.
第 6
页
2
x
3
4
5
6
y
2.5
3
4
4.5
(2) 根据列联表的数据,作出二维条形图:
2.
用三维柱柱图和二维条形图直观反映.
(1)根据列联表的数据,作出三维柱形图:
由上图可以直观地看出,吸烟与患肺癌 .
(3)根据列联表的数据,作出等高条形图:
由上图可以直观地看出,吸烟与患肺癌 .
由上图可以直观地看出, 吸烟与患肺癌 .
反思:(独立性检
验的必要性)通过数据和图形,我们得到的直观印象是患肺癌有关。那是否有一定的把握认为“吸烟与
患
肺癌有关”呢?
新知2:统计量
K
吸烟与患肺癌列联表
假设
H
0
:吸烟与患肺癌没关系.
则在吸烟者和不吸烟者中患肺癌不患肺癌者的相应比例 .
即
2
K
2
=
因此,
越小,说明吸烟与患肺癌之间关系 ;反之, .
※ 典型例题
例1:吸烟与患肺癌列联表,求
K
.
※ 动手试试
练1:性别与喜欢数学课程列联表,求
K
.
第 7 页
2
2
不吸烟
吸 烟
总 计
不患肺癌
7775
2099
9874
患肺癌
42
49
91
总计
7817
2148
9965
男
女
总 计
喜欢数学
37
35
72
不喜欢数学
85
143
228
总 计
122
178
300
三、总结提升
※ 知识拓展
1. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女
两个值,商品的等
级变量只取一级、二级、三级,等等.
分类变量的取值有时可用数字
来表示,但这时的数字除了分类以外没有其他的含义。如用“0”表示“男”,用“1”表示“女”.
2. 独立性检验的步骤(略)及原理(与反证法类似):
反证法
要证明结论A
在A不成立的前提下进行推理
推出矛盾,意味着结论A成立
没有找到矛盾,不能对A下任何
结论,即反证法不成功
3. 查表得出结论
课后作业
某市为调查全市高中生学习状况是否对生理健
康有影响,随机进行调查并得到如下的列联表,求
K
.
※ 典型例题
不优秀
优 秀
总 计
不健康
41
37
78
健 康
626
296
922
总计
667
333
1000
2
假设检验
备择假设H
1
在H
1
不成立的条件下,即H
0
成立的条件下进行推理
推
出有利于H
1
成立的小概率事件(概率不超过
?
的事件)发生,
意味
着H
1
成立的可能性(可能性为(1-
?
))很大
推出有利于H
1
成立的小概率事件不发生,接受原假设
P(k
2
>k) 0.50
k
0.40 0.25
0.15 0.10 0.05 0.025 0.010 0.005 0.001
0.455
0.708 1..323 2.072 2.706 3.84 5.024 6.635 7.879
10..83
例1:在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶
;而另外772名不是因为患心脏病而住院
的男性病人中有175名秃顶。分别利用图形和独立性检验方
法判断秃顶与患心脏病是否有关系?你所得的结论在什么范
围内有效?
第 8 页
学习评价
※ 当堂检测(时量:5分钟 满分:10分)计分:
1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.
若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.
B. 从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99
%的可能性患肺病.
C.
若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误.
D. 以上三种说法都不对.
2.
下面是一个
2?2
列联表则表中a,b的之分别是( )
A. 94,96
B. 52,50 C. 52,54 D. 54,52
3. 某班主任对全班50名学生进行了作业量多少的调查,数据如下表:
则认为喜欢玩游戏与认为作业量多少有关系的把握大约为( )
A. 99%
4. 在独立性检验中,当统计量
K
满足
时,我们有99%的把握认为这两个分类变量有关系.
5.
在
2?2
列联表中,统计量
K
= .
课后作业
为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表能以97.5%的把握认
为药物有效吗?为什么?
用 药
不用药
总 计
患 病
41
37
78
未患病
626
296
922
总 计
667
333
1000
2
2
不优秀
优 秀
总 计
不健康
a
2
b
健 康
21
25
46
总计
73
27
100
玩游戏
不玩游戏
总 计
认为作业多
18
8
26
认为作业不多 总计
9
15
24
27
23
50
B. 95% C. 90%
D.无充分依据
第 9 页
高中数学题资料书-ln在高中数学中是啥
高中数学中的排列-人教版高中数学必修五试讲稿
高中数学易错题解析-南昌高中数学大学生家教时薪
高中数学学生反思范文-高中数学学到心累
高中数学概率统计茎叶图概念-2019年北京大学高中数学
教师证考试高中数学面试-广州市高中数学老师招聘
江西高中数学奥赛预赛-高中数学课堂有效提问的研究 研究的基本过程
高中数学数学公开课点评-高中数学函数表达式例题
-
上一篇:关于高级高中数学教学案例
下一篇:高中数学统计、统计案例知识点总结和典例说课讲解