

8.1.2 样本相关系数
新课程标准解读 | 核心素养 |
1.结合实例,了解样本相关系数的统计含义 | 数学抽象 |
2.结合实例,会通过样本相关系数判断多组成对样本数据的相关性 | 数学运算、数据分析 |


观察如下散点图,由图可判断图①是负相关,图②是正相关.

【问题】 怎样定量刻画两个变量的相关性?

知识点一样本相关系数
对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分别为
和
.
r=
=
r为变量x和变量y的样本相关系数.
知识点二 样本相关系数r的性质
1.当r>0时,称成对样本数据 正 相关;当r<0时,称成对样本数据 负 相关;当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
2.样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越 强 ;
当|r|越接近0时,成对样本数据的线性相关程度越 弱 .

1.判断正误.(正确的画“√”,错误的画“×”)
(1)样本相关系数r的符号反映了相关关系的正负性.(√)
(2)对于简单随机样本而言,样本相关系数r是确定的.(×)
(3)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.(√)
(4)r=0表明成对样本数据间不存在相关性.(×)
2.由四组统计数据绘制的散点图如下,关于其相关系数的比较,正确的是()

A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3
C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3
解析:A 由相关系数的定义以及散点图可知r2<r4<0<r3<r1,故选A.

【例1】 为了对某班考试成绩进行分析,现从全班同学中随机抽取8位同学,他们的数学、物理成绩对应如表.根据表中数据计算y与x之间的样本相关系数.
学生编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
数学分数x | 60 | 65 | 70 | 75 | 80 | 85 | 90 | 95 |
物理分数y | 72 | 77 | 80 | 85 | 88 | 90 | 93 | 95 |
解:
=
×(60+65+70+75+80+85+90+95)=77.5,
=
×(72+77+80+85+88+90+93+95)=85.
(xi-
)(yi-
)=685,(xi-
)2=1050,(yi-
)2=456.
所以r=
=
≈0.99.
通性通法
样本相关系数的计算步骤
(1)求出
的值;
(2)求出
(xi-
)(yi-
),
(xi-
)2,(yi-
)2的值;
(3)代入公式计算得结果.
【跟踪训练】
暑期社会实践中,小娴所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y的情况,得到的数据如下表:
计算y与x之间的样本相关系数.
参考数据:
≈4.359.
解:由表中数据,计算得
=
×(2+4+5+6+8)=5,
=
×(20+30+50+50+70)=44,
=22+42+52+62+82=145,
=202+302+502+502+702=11200,
xiyi=2×20+4×30+5×50+6×50+8×70=1270,代入r的计算公式得
r=
≈0.975.
【例2】 某网店经销某商品,为了解该商品的月销量y(单位:千件)与售价x(单位:元/件)之间的关系,收集5组数据进行了初步处理,得到下表:
请根据表中数据计算y与x之间样本相关系数r,并利用r说明y与x之间是否具有较强的线性相关关系(精确到0.01).
参考数据及公式:
≈12.85;样本相关系数r=
.
解:由题意,得
=7,=5,
则
=10,=16.5,
(xi-
)(yi-
)=-12.5,
所以r=
≈-0.97.
因为|r|=0.97非常接近1,
所以y与x之间具有较强的线性相关关系.
通性通法
相关关系强弱的定量分析与定性分析
(1)定量分析:样本相关系数r的范围为-1≤r≤1,r为正时,成对样本数据正相关;r为负时,成对样本数据负相关;|r|越接近1,成对样本数据的线性相关程度越强;|r|越接近0,成对样本数据的线性相关程度越弱;当|r|=1时,所有数据点都在一条直线上;
(2)定性分析:相关关系的强弱体现在散点图中就是样本点越集中在某条直线附近,两变量的线性相关程度越强;样本点在某条直线附近越分散,两变量的线性相关程度越弱.
【跟踪训练】
为利于分层教学,某学校根据学生的情况分成了A,B,C三类,经过一段时间的学习后在三类学生中分别随机抽取了1个学生的5次考试成绩,其统计表如下:
A类
第x次 | 1 | 2 | 3 | 4 | 5 |
分数y(满分150) | 145 | 83 | 95 | 72 | 110 |
B类
第x次 | 1 | 2 | 3 | 4 | 5 |
分数y(满分150) | 85 | 93 | 90 | 76 | 101 |
C类
第x次 | 1 | 2 | 3 | 4 | 5 |
分数y(满分150) | 85 | 92 | 101 | 100 | 112 |
经计算已知A,B的样本相关系数分别为r1=-0.45,r2=0.25.请计算出C类学生的(xi,yi)(i=1,2,3,4,5)的样本相关系数,并通过数据的分析回答抽到的哪类学生的学习成绩最稳定.(结果保留两位有效数字,|r|越大认为成绩越稳定)
C类的参考数据:
·
≈64,
样本相关系数r=
.
解:根据C类学生的数据,得
=3,=98,则
(xi-
)·(yi-
)=62,所以相应的样本相关系数r3≈
≈0.97,从上述所求样本相关系数可知,从C类学生中抽到的学生的成绩最稳定.

1.两个变量x,y的样本相关系数r=-0.996 2,则下列说法中正确的是()
A.x与y正相关
B.x与y具有较强的线性相关关系
C.x与y不具有线性相关关系
D.x与y的线性相关关系还需进一步确定
解析:B x与y负相关,又|r|非常接近1,所以x与y具有较强的线性相关关系,故选B.
2.如图①②分别表示样本容量均为7的A,B两组成对数据的散点图,已知A组成对数据的样本相关系数为r1,B组成对数据的样本相关系数为r2,则r1与r2的大小关系为()

A.r1=r2B.r1<r2
C.r1>r2D.无法判断
解析:C 由题图①可知,散点几乎在一条直线上,且呈正相关,∴r1>0,由题图②可知,散点分布在一条直线附近,且呈正相关,∴r2>0.又A组成对数据的线性相关程度比B组强,∴r1>r2,故选C.
3.某厂生产A产品的产量x(单位:件)与相应的耗电量y(单位:度)的统计数据如表所示:
经计算
≈16.12.计算(xi,yi)(i=1,2,3,4,5)的样本相关系数.(结果保留两位小数)
解:从表中数据可知,=4,=5,
所以
(xi-
)(yi-
)=16,
所以r=
≈
≈0.99.


1.下面的散点图与样本相关系数r一定不符合的是()

A.①②③B.①②④ C.①③④D.②③④
解析:C ①中,由散点图可得,两相关变量呈负相关,样本相关系数r<0,故①错误;②中,由散点图可得,两相关变量呈正相关,则样本相关系数可能是r=0.75;③中,若样本相关系数r=-1,则所有的点应该分布在一条直线上,散点图显然不符合,故③错误;④中,若样本相关系数r=1,则所有的点应该分布在一条直线上,散点图显然不符合,故④错误.
2.第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),第二组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9),第一组变量的线性相关系数为r1,第二组变量的线性相关系数为r2,则()
A.r1>0>r2B.r2>0>r1
C.r1<r2<0 D.r2>r1>0
解析:A 观察第一组样本点,y随x的增大而增大,故r1>0;观察第二组样本点,y随x的增大而减小,故r2<0.综上:r1>0>r2.故选A.
3.在一组成对样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组成对样本数据的样本相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是()
A.y=-
x+1 B.y=x-1
C.y=x+1 D.y=-x2
解析:A ∵这组成对样本数据的样本相关系数为-1,∴这一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)线性相关,且是负相关.∴可排除B、C、D.
4.(多选)两个变量x,y的样本相关系数r1=0.785 9,两个变量u,v的样本相关系数r2=-0.956 8,则下列判断正确的是()
A.变量x与y正相关,变量u与v负相关
B.变量x与y负相关,变量u与v正相关
C.变量x与y的线性相关性更强
D.变量u与v的线性相关性更强
解析:AD 由r1>0知x与y正相关,由r2<0知u与v负相关,又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.
5.(多选)对于样本相关系数r,下列结论正确的为()
A.r∈[-1,-0.75]时,两变量负相关很强
B.r∈[0.75,1]时,两变量正相关很强
C.r∈(-0.75,-0.3]或[0.3,0.75)时,两变量相关性一般
D.r=0.1时,两变量相关性很强
解析:ABC 由相关系数的性质,A、B、C正确;D中r=0.1时,两变量相关性较弱,D不正确.
6.现求得甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,其中 乙 (填甲、乙、丙中的一个)组成对样本数据的线性相关程度最强.
解析:因为成对样本数据的样本相关系数的绝对值越接近1,相关程度越强,由题意得,乙组的样本相关系数的绝对值最接近1,所以乙组成对样本数据的线性相关程度最强.
7.已知
(yi-
)2是
(xi-
)2的4倍,(xi-
)·(yi-
)是
(xi-
)2的1.5倍,则相关系数r= 0.75 .
解析:由r=
r=0.75.
8.在我国,大学生就业压力日益严峻,伴随着政府政策引导与社会观念的转变,大学生创业意识、就业方向也悄然发生转变.某大学生在国家提供的税收、担保贷款等很多方面的政策扶持下选择加盟某专营店自主创业,该专营店统计了近五年来创收利润数y(单位:万元)与时间t(单位:年)的数据,列表如下:
依据表中给出的数据,判断y与t的线性相关程度,请计算样本相关系数r并加以说明.(计算结果精确到0.01,若|r|≥0.75,则线性相关程度很高)
附:样本相关系数r=
.
参考数据:
≈7.547.
解:由题表可知,=3,=4.7,
则r=
=
=
≈0.97>0.75,
故创收利润数y与时间t的线性相关程度很高.

9.对两组呈线性相关的变量进行回归分析,得到不同的两组样本数据,第一组和第二组对应的线性相关系数分别为r1,r2,则r1>r2是第一组变量比第二组变量线性相关程度强的()
A.充分不必要条件B.必要不充分条件
C.充要条件D.既不充分也不必要条件
解析:D 因为r1>r2,但不确定r1,r2的正负情况,所以不能推出第一组变量和第二组变量的相关程度;若第一组变量比第二组变量相关程度强,则|r1|>|r2|,所以r1>r2是第一组变量比第二组变量线性相关程度强的既不充分也不必要条件.故选D.
10.已知两组数据a1,a2,…,a10和b1,b2,…,b10,其中1≤i≤10且i∈Z时,ai=i;1≤i≤9且i∈Z时,bi=ai,b10=a,我们研究这两组数据的相关性,在集合{8,11,12,13}中取一个元素作为a的值,使得相关性最强,则a=()
A.8 B.11
C.12 D.13
解析:B 设点的坐标为(ai,bi),1≤i≤10且i∈Z,由题意得前9个点位于直线y=x上,a10=10,则要使相关性更强,b10应更接近10,四个选项中11更接近10,故选B.
11.已知某个样本点中的变量x,y线性相关,相关系数r<0,则在以(
)为坐标原点的坐标系下的散点图中,大多数的点都落在第 二、四 象限.
解析:由r=
<0,则
(xi-
)(yi-
)<0,所以大多数点xi-
与yi-
异号,又(
)为坐标原点,故大多数的点都落在第二、四象限.
12.某生物小组为了研究温度对某种酶的活性的影响进行了一组试验,试验数据经整理得到如图所示的折线图,由图可以看出,这种酶的活性指标值y与温度x具有较强的线性相关关系,请用样本相关系数加以说明.

附:
(xi-
)(yi-
)=85,=5.5,≈2.65.
解:由题意得
=
×(8+11+14+20+23+26)=17,(xi-
)2=(8-17)2+(11-17)2+(14-17)2+(20-17)2+(23-17)2+(26-17)2=252,∴r=
=
=
≈0.97,
由此可得这种酶的活性指标值y与温度x具有较强的线性相关关系.
13.某公司是一家集无人机特种装备的研发、制造与技术服务的综合型科技创新企业,产品主要应用于森林消防、物流运输、航空测绘、军事侦察等领域,获得市场和广大观众的一致好评,该公司生产的甲、乙两种类型无人运输机性能都比较出色,但操控水平需要十分娴熟,才能发挥更大的作用.该公司分别收集了甲、乙两种类型无人运输机在5个不同的地点测试的某项指标数xi,yi(i=1,2,3,4,5),数据如表所示:
| 地点1 | 地点2 | 地点3 | 地点4 | 地点5 |
甲型无人运输 机指标数x | 2 | 4 | 5 | 6 | 8 |
乙型无人运输 机指标数y | 3 | 4 | 4 | 4 | 5 |
(1)试求y与x间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系;(若|r|>0.75,则线性相关程度很高)
(2)从这5个地点中任抽2个地点,求抽到的这2个地点,甲型无人运输机指标数均高于乙型无人运输机指标数的概率.
附:相关公式及数据:r=
≈0.95.
解:(1)
=
=5,=
=4,
所以
(xi-
)(yi-
)=-3×(-1)+(-1)×0+0×0+1×0+3×1=6,
=9+1+0+1+9=20,=1+0+0+0+1=2,
样本相关系数r=
=
=
≈0.95,
因为r>0.75,所以y与x具有较强的线性相关关系.
(2)从这5个地点中任抽2个地点,共有
=10个样本点,其中在地点3,4,5,甲型无人运输机指标数均高于乙型无人运输机指标数,即所求事件含有3个样本点,故所求事件的概率为
.

通过网盘分享的文件:25-26学年同步培优讲义
链接: https://pan.baidu.com/s/1y0bSGZE1YoJg8gMTXiqQoA?pwd=4321 提取码: 4321
--来自百度网盘超级会员v8的分享