高中数学曲线图汇总-高中数学教招面试真题
-------------------------天才是百分之一的灵感加百分之九十九的
勤奋------------------------------
3.2
独立性检验的基本思想及其初步应用
学习目标:1.了解分类变量、2×2列联表、随机变量
K
的意义.2.通过对典型案例的分
析,了解独立性检验的基本思想方法.(重点)3.通过对
典型案例的分析,了解两个分类变量
的独立性检验的应用.(难点)
[自 主 预 习·探
新 知]
1.分类变量和列联表
(1)分类变量
变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表
一般地,假设
有两个分类变量
X
和
Y
,它们的取值分别为{
x
1
,
x
2
}和{
y
1
,
y
2
},其
样本频
数列联表(称为2×2列联表)为
2
x
1
x
2
总计
2.等高条形图
y
1
a
c
a
+
c
y
2
b
d
b
+
d
总计
a
+
b
c
+
d
a
+
b
+
c
+
d
(1)等高条
形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等
高条形图展示列联表数据的频
率特征.
(2)观察等高条形图发现
3.独立性检验
定义
利用随机变量
K
来判断“两个分类变量有关系”的方法称为独立性检验
2<
br>a
a
+
bc
+
d
和
c
相差很大,就
判断两个分类变量之间有关系.
公式
K
=
2
a
+
b
nad
-
bc
2
c
+
da
+
cb
+
d
,其中
n
=
a
+
b+
c
+
d
金戈铁制卷
------
-------------------天才是百分之一的灵感加百分之九十九的勤奋-----------
-------------------
①确定
α
,根据实际问题的需
要确定容许推断“两个分类变量有关系”犯错
误概率的上界
α
,然后查表确定临界值<
br>K
a
具体步骤
②计算
K
,利用公式计算随机变量
K
的观测值
K
.
③下结论,如果
K
≥
K
0
,就推断“
X
与
Y
有关系”,这种推断犯错误的概率不
超过
α
;否则,就认为在犯错
误的概率不超过
α
的前提下不能推断“
X
与
Y
有关系”,或
者在样本数据中没有发现足够证据支持结论“
X
与
Y
有关系”
22
思考:独立性检验的基本思想与反证法的思想有何相似之处?
[提示]
反证法
要证明结论
A
在
A
不成立的前提下进行
推理
推出矛盾,意味着结论
A
成立
没有找到矛盾,不能对
A
下任何结论,即反证法不
成功
假设检验
要确认“两个变量有关系”
假设该结论不成立,即假设结论“两个变量没
有关系”成立,
在该假设下计算
K
由观测数据计算得到的
K
很大,则在一定可信程度上说明假设
不合理
根据随机变量
K
的含义,可以通过
K
的大小来判断“两个变量
有关
系”这一结论成立有多大把握
[基础自测]
1.判断(正确的打“√”,错误的打“×”)
(1)分类变量中的变量与函数中的变量是同一概念.
(2)独立性检验的方法就是反证法.
( )
( )
22
2
2
(3)独立性检验中可通
过统计表从数据上说明两分类变量的相关性的大小
[解析] (1)× 变量的不同“值”表示个体所
属的不同类别,象这样的变量称为分类
变量,有时可以把分类变量的不同取值用数字表示,但这时的数字
除了分类以外没
有其他含义,而函数中的变量分为自变量与因变量,都是数的集合,有它们各自的意义.
(2)× 独立性检验的思想类似于反证法,但不能说它就是反证法.
(3)√ 独立性检验
是对两个分类变量有关系的可信度的判断,其结论是有多大的把握
确认两个分类变量有关系,可以通过统
计表从数据上进行运算,再进行判断.
[答案] (1)× (2)× (3)√
金戈铁制卷
-------------------------天才是百
分之一的灵感加百分之九十九的勤奋------------------------------
2.下面是2×2列联表
x
1
x
2
总计
y
1
a
7
y
2
21
20
41
总计
73
27
100
b
则表中
a
,
b
处的值为( )
A.94,96
C.52,59
B.52,40
D.59,52
C [
a<
br>=73-21=52,
b
=
a
+7=52+7=59.]
3.调查男女学生购买食品时是否看出厂日期与性别有无关系时,最有说服力的是( )
【导学号:95032243】
A.期望
C.正态分布
B.方差
D.独立性检验
D [要判断两个事件是否相关时,用独立性检验.]
4.下面的等高条形图可以说明的问题是________(填序号).
图3?2?1
①“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的;
②“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同;
③此等高条形图看不出两种手术有什么不同的地方;
④“心脏搭桥”手术和“血管清障”手术
对“诱发心脏病”的影响在某种程度上是不同
的,但是没有100%的把握.
[答案] ④
[合 作 探 究·攻 重 难]
等高条形图的应用
为了解铅中毒病
人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿
液作尿棕色素定性检查,结果如下:
组别
阳性数
阴性数
总计
金戈铁制卷
-------------------------天才是百
分之一的灵感加百分之九十九的勤奋------------------------------
铅中毒病人
对照组
总计
29
9
38
7
28
35
36
37
73
试画出
列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅
中毒病人与尿棕色素为阳
性是否有关系?
[解] 等高条形图如图所示:
其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.
由图可以直
观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此
铅中毒病人与尿棕色素为阳性
有关系.
[规律方法]
1.利用等高条形图判断两个分类变量是否相关的步骤:
(1)统计:收集数据,统计结果.
(2)列表:列出2×2列联表,计算频率、粗略估计.
(3)绘图:绘制等高条形图,直观分析.
2.在等高条形图中,可以估计满足条件
X
=
x
1
的个体中具有
Y
=
y
1
的个体所占的比例
a
a
+
b
,也可以估计满足条件
X
=
x
2
的个体中具有
Y
=
y
1
的个体所
占的比例
c
c
+
d
.两个比例的值
相差越大,
X<
br>与
Y
有关系成立的可能性就越大.
[跟踪训练]
1.某学校对高三
学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426
人中332人在考前心情紧张,性
格外向的学生594人中有213人在考前心情紧张,作出等高
条形图,利用图形判断考前心情紧张与性
格类别是否有关系.
[解] 作列联表如下:
考前心情紧张
考前心情不紧张
总计
性格内向
332
94
426
性格外向
213
381
594
总计
545
475
1 020
在考前心情紧张的群体中,性格内向的约占61%,在考前心情
不紧张的群体中,性格内
向的约占20%.绘制相应的等高条形图如图所示:
金戈铁制卷 <
/p>
-------------------------天才是百分之一的灵感加百分之九
十九的勤奋------------------------------
图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出
考前心情紧张的样
本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例大,可
以认为考前紧张与性格类别有关
.
由
K
进行独立性检验
某校高三年级在一次全年级的大型考
试中,数学成绩优秀和非优秀的学生中,
物理、化学、总分也为优秀的人数如下表所示,则我们能否在犯
错误的概率不超过0.001
的前提下认为数学成绩优秀与物理、化学优秀有关系?
2
数学优秀
数学非优秀
物理优秀
228
143
化学优秀
225
156
总分优秀
267
99
注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.
【导学号:95032244】
[思路探究] 首先分别列出数学成绩与物理、化学、总分的2×2列
联表,再正确计算
K
2
的观测值,然后由
K
2
的值作出判断
.
[解] (1)根据已知数据列出数学与物理优秀的2×2列联表如下:
数学优秀
数学非优秀
总计
物理优秀
228
143
371
物理非优秀
总计
360
880
1 240
b
d
b
+
d
∴
b
=360-228=132,
d=880-143=737,
b
+
d
=132+737=869.
代入公式可得
K
的观测值为
k
1
≈270.114.
(2)按照上述方法列出数学与化学优秀的2×2列联表如下:
2
数学优秀
数学非优秀
总计
化学优秀
225
156
381
化学非优秀
135
724
859
总计
360
880
1 240
金戈铁制卷
-----------
--------------天才是百分之一的灵感加百分之九十九的勤奋----------------
--------------
代入公式可得
K
的观测值
k
2
≈240.611.
综上,由于
K
的观测值都大于10.828,因此说明都能在犯错误的概率不超过0.001
的
前提下认为数学成绩优秀与物理、化学优秀有关系.
[规律方法]
1.利用
K
进行独立性检验的步骤
(1)列表:列出2×2列联表.
(2)求值:求出
K
的观测值
k
.
(3)判断:与临界值比较,得出事件有关的可能性大小作出判断.
2.独立性检验的必要性
列联表中的数据是样本数据,它只是总体的代表,它具有随机性,所以只能利用列联表
的数据和
等高条形图粗略判断两个分类变量是否有关系.而
K
给出了不同样本容量的数据
的统一
评判标准.利用它能精确判断两个分类变量是否有关系的可靠程度.
[跟踪训练]
2.为了
探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在
校学生,调查结果如下:
理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有
兴趣的有73人,无兴趣的有52人
.能否在犯错误的概率不超过0.1的前提下,认为“学生
选报文、理科与对外语的兴趣有关”?
[解] 根据题目所给的数据得到如下列联表:
2
2
2
2
2
有兴趣
无兴趣
总计
理科
138
98
236
2
文科
73
52
125
总计
211
150
361
根据列联表中数据由公式计算得随机变量
K
的观测值
36
1×138×52-73×98
k
=
211×150×236×125
因为1
.871×10<2.706,
所以在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、
理科与对外语的兴
趣有关”.
-4
2
≈1.871×10.
-4
独立性检验与统计的综合应用
[探究问题]
1.从容量为
400人的中年人与容量为100人的老年人中抽出50人去体检某项健康指标,
若采取分层抽样方法,
应从中抽取老年人为多少人?
金戈铁制卷
---------------
----------天才是百分之一的灵感加百分之九十九的勤奋--------------------
----------
[提示]
50
×100=10(人).
400+100
2.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对
高
三文科学生的调查所得的数据:
数学成绩好
数学成绩不好
总计
总成绩好
478
399
总成绩不好
总计
490
423
913
a
24
b c
你能求出
a
,
b
,
c
的值吗?该问题中有几个分类变量?它们的取值分别是什么?
[提示]
a
=12,
b
=877,
c
=36.该
问题中有“总成绩”和“数学成绩”两个分类变量;
“总成绩”的取值有“总成绩好”与“总成绩不好”
两个值,“数学成绩”的取值也有“好”
与“不好”两个值.
3.在探究2中,你认为文科学生总成绩不好与数学成绩不好有关系吗?
[提示]
由探究2计算随机变量
K
的观测值:
913×478×24-399×12
k
=
490×423×877×36
∵
P
(
k
≥5
.024)≈0.025,
∴在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与
数学成绩不好有
关系.
为了比较注射
A
,
B
两种药物后
产生的皮肤疱疹的面积,选200只家兔做试验,
将这200只家兔随机地分成两组,每组100只,其
中一组注射药物
A
,另一组注射药物
B
.
(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率.
(2)下表1和表2分
别是注射药物
A
和
B
后的试验结果.(疱疹面积单位:mm)
表1:注射药物
A
后皮肤疱疹面积的频数分布表
疱疹面积
频数
[60,65)
30
[65,70)
40
[70,75)
20
[75,80)
10
2
2
2
≈6.233>5.024,
表2:注射药物
B
后皮肤疱疹面积的频数分布表
疱疹面积
频数
[60,65)
10
[65,70)
25
[70,75)
20
[75,80)
30
[80,85]
15
完成下面2×2列联表
注射药物
A
注射药物
B
合计
疱疹面积小于70 mm
2
疱疹面积不小于70 mm
2
合计
a
=
c
=
b
=
d
=
n
=
金戈铁制卷
------
-------------------天才是百分之一的灵感加百分之九十九的勤奋-----------
-------------------
C
2
C
198
100
[解]
(1)甲、乙两只家兔分在不同组的概率为
p
=
100
=.
C
200
199
(2)2×2列联表如下.
199
注射药物
A
注射药物
B
合计
疱疹面积小于70 mm
2
疱疹面积不小于70 mm
2
合计
100
100
a
=70
c
=35
105
b
=30
d
=65
95
n
=200
母题探究:1.(
改变问法)典例2中条件不变,改变问法:是否有99%的把握认为注射药
物
A
后的疱
疹面积与注射药物
B
后的疱疹面积有差异?
200×70×65-35×30
[解]
k
=
100×100×105×95
2
2
≈24.56.
由于
K
>6.635,所以有99%的把握认为“注射药物
A
后的疱
疹面积与注射药物
B
后的
疱疹面积有差异”.
2.(改变问法)在典例2(
2)中完成如图3?2?2所示的频率分布直方图,并比较注射两
种药物后疱疹面积的中位数大小.
图3?2?2
[解] 如图所示
图Ⅰ
注射药物
A
后皮肤疱疹面积的频率分布直方图
图Ⅱ
注射药物
B
后皮肤疱疹面积的频率分布直方图
金戈铁制卷
-------------------------天才是百分之一的灵感加百分之九十九的勤奋-----
-------------------------
可以看出注射药物
A后的疱疹面积的中位数在65至70之间,而注射药物
B
后的疱疹面
积的中位数在
70至75之间,所以注射药物
A
后疱疹面积的中位数小于注射药物
B
后疱疹
面
积的中位数.
[规律方法]
1.独立性检验在实际中有着广泛的应用,是对实
际生活中数据进行分析的一种方法,
通过这种分析得出的结论对实际生活或者生产都有一定的指导作用.
2.近几年高考中较少单独考查独立性检验,经常与统计、概率等知识综合,频率分布
表、频率
分布直方图与独立性检验融合在一起是常见的考查形式,一般需要根据条件列出2
×2列联表,计算K
的观测值,从而解决问题.
[跟踪训练]
3.某学生对其亲属30人的饮食
进行了一次调查,并用如图3?2?3所示的茎叶图表示
30人的饮食指数.(说明:图中饮食指数低于
70的人,饮食以蔬菜为主;饮食指数高于70
的人,饮食以肉类为主)
2
图3?2?3
(1)根据以上数据完成下列2×2列联表:
50岁以下
50岁以上
总计
主食蔬菜
主食肉类
总计
(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并
写出
简要分析.
[解] (1)2×2列联表如下:
50岁以下
50岁以上
总计
主食蔬菜
4
16
20
2
主食肉类
8
2
10
总计
12
18
30
30×8-128
(2)因为
k
==10>6.635,
12×1
8×20×10
2
P
(
K
2
>6.635)=0.01,
金戈铁制卷
-------------------------天才是百
分之一的灵感加百分之九十九的勤奋------------------------------
所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.
[当 堂 达 标·固 双 基]
1.与表格相比,能更直观地反映出相关数据总体状况的是( )
【导学号:95032245】
A.列联表
C.残差图
2
B.散点图
D.等高条形图
D
[对于A,列联表需要计算
K
的值,不是直观的分析;
对于B,散点图体现的是变量间相关性的强弱;
对于C,残差图体现预报变量与实际值之间的差距,
对于D,等高条形图能直观地反映两个分类变量是否有关系.]
2.对于分类变量
X
与
Y
的随机变量
K
的观测值
k
,下列说法正确的是
( )
A.
k
越大,“
X
与
Y
有关系”的可信程度越小
B.
k
越小,“
X
与
Y
有关系”的可信程度越小
C.
k
越接近于0,“
X
与
Y
没有关系”的可信程
度越小
D.
k
越大,“
X
与
Y
没有关系”的可信程度越大
B [
k
越大,“
X
与
Y
没有关系”的可信程度越
小,则“
X
与
Y
有关系”的可信程度越大,
2
k
越
小,“
X
与
Y
有关系”的可信程度越小.]
3.为了探究电离辐射
的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射
照射小白鼠.在照射后14天内的结果如
下表所示:
第一种剂量
第二种剂量
总计
死亡
14
6
20
存活
11
19
30
总计
25
25
50
进行统计分析时的统计假设是________.
假设电离辐射的剂量与人体受损程度无关
[根据假设性检验的概念知,应“假设电离
辐射的剂量与人体受损程度无关”.]
4.下列说法正确的有________(填序号).
【导学号:95032246】
①分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的;
②分类变量的取值也可以用数字来表示,但这时的数字除了分类以外没有其他的含义;
③2×2列联表是两个分类变量的频数汇总统计表;
④2×2列联表和等高条形图都能反映出两个分类变量间是否相互影响.
①②③④ [由分类
变量的定义可知①②正确;由2×2列联表的定义可知③正确;2×2
列联表和等高条形图都能展示样本
的频率特征,若在一个分类变量所取值的群体中,另一个
金戈铁制卷
----
---------------------天才是百分之一的灵感加百分之九十九的勤奋---------
---------------------
分类变量所取值的频率相差较小,则说明这
两个变量不相互影响,否则就相互影响.故④正
确.]
5.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1
000人
问卷,只有80人志愿加入西部建设.而国家公布实施西部开发战略后,随机抽取1
200名
应届大学毕业生问卷,有400人志愿加入国家西部建设.
问:能否在犯错误的概率
不超过0.001的前提下,认为实施西部开发战略的公布对应届
大学毕业生的选择产生了影响?
[解] 根据题意,列出2×2列联表:
开发战略公布前
开发战略公布后
总计
由公式计算
K
统计量得:
2
志愿者
80
400
480
非志愿者
920
800
1 720
总计
1 000
1 200
2 200
2 200×80×800-920×400
k
=
480×1 720×1
000×1 200
2
≈205.22.
因为205.22>10.828,因此在
犯错误的概率不超过0.001的前提下认为实施西部开发战
略的公布对应届大学毕业生的选择产生了影
响.
金戈铁制卷
上海高中数学竞赛有哪几个-高中数学解方程绝对值
高中数学内切球教学视频-2018全国高中数学联赛一试试题
高中数学矩阵应用-全国高中数学联赛报名流程
2018高中数学竞赛辽宁省成绩-桂林市高中数学会考试题
高中数学神级秒杀结论总结-深圳高中数学辅导班
教育机构里讲高中数学-高中数学考0分可能吗
高中数学必修4主要内容-高中数学必修一 二公式
广东高中数学预赛-高中数学人教版a版b版的区别
-
上一篇:(完整版)高中数学导数经典题型解题技巧(运用方法)
下一篇:高二数学学习方法