当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫做相关关系.即相关关系是一种非确定性关系.
当一个变量的值由小变大时,另一个变量的值也由小变大,则这两个变量正相关;
当一个变量的值由小变大时,而另一个变量的值由大变小,则这两个变量负相关.
【注意】相关关系与函数关系的异同点:
共同点:二者都是指两个变量间的关系.
不同点:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.
2.散点图
3.回归分析
如果散点图中点的分布从整体上看大致在一条直线附近,则这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归直线对应的方程叫做回归直线方程(简称回归方程).
4.回归方程的求解
5.相关系数
6.非线性回归分析
对某些特殊的非线性关系,可以通过变量转换,把非线性回归问题转化成线性回归问题,然后用线性回归的方法进行研究.
在大量的实际问题中,所研究的两个变量不一定都呈线性相关关系,当两变量y与x不具有线性相关关系时,要借助散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决.
7.刻画回归效果的方式
考向一 相关关系的判断
1.对两个变量x,y进行线性回归分析,计算得到相关系数,则下列说法中正确的是
A.x与y正相关 B.x与y具有较强的线性相关关系
C.x与y几乎不具有线性相关关系 D.x与y的线性相关关系还需进一步确定
2.某国际控股有限公司2012~2017年的年广告支出y(单位:百万元)与年利润x(单位:百万元)的统计资料如表所示:
年份 |
2012 |
2013 |
2014 |
2015 |
2016 |
2017 |
支出y |
0.64 |
0.72 |
0.79 |
0.85 |
0.98 |
1.06 |
利润x |
11.9 |
13.1 |
15.7 |
17.1 |
19.6 |
21.5 |
根据统计资料,则
A.利润的中位数是15.7,y与x为正相关关系 B.利润的中位数是16.4,y与x为正相关关系
C.利润的中位数是17.1,y与x为负相关关系 D.利润的中位数是16.4,y与x为负相关关系
考向二 线性回归方程及应用
求回归直线方程的一般步骤:
(1)作出散点图,依据问题所给的数据在平面直角坐标系中描点,观察点的分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否具有线性相关关系.
(2)当两变量具有线性相关关系时,求回归系数,写出回归直线方程.
(3)根据方程进行估计.
考向三 非线性回归方程及应用
求非线性回归方程的步骤:
1.确定变量,作出散点图.
2.根据散点图,选择恰当的拟合函数.
3.变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程.
4.分析拟合效果:通过计算相关指数或画残差图来判断拟合效果.
5.根据相应的变换,写出非线性回归方程.
5.近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期内优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用x表示活动推出的天数,y表示每天使用扫码支付的人次(单位:十人次),统计数据如下表所示:
根据以上数据,绘制了如图所示的散点图.
2.废品率x%与每吨生铁成本y(元)之间的回归直线方程为=234+3x,表明
A.废品率每增加1%,生铁成本增加3x元
B.废品率每增加1%,生铁成本每吨平均增加3元
C.废品率每增加1%,生铁成本增加234元
D.废品率不变,生铁成本为234元
3.已知5个学生的数学和英语成绩如下表:
学生 |
A |
B |
C |
D |
E |
数学 |
80 |
75 |
70 |
65 |
60 |
英语 |
70 |
66 |
68 |
64 |
62 |
则数学与英语成绩之间
A.是函数关系 B.是相关关系,但相关性很弱
C.具有较好的相关关系,且是正相关 D.具有较好的相关关系,且是负相关
5.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
20.2017年5月,来自“一带一路”沿线的20国青年评选出了中国“新四大发明”:高铁、支付宝、共享单车和网购.2017年末,“支付宝大行动”用发红包的方法刺激支付宝的使用.某商家统计前5名顾客扫描红包所得金额分别为5.5元,2.1元,3.3元,5.9元,4.7元,商家从这5名顾客中随机抽取3人赠送台历.
(1)求获得台历的三人中至少有一人的红包超过5元的概率;
(2)统计一周内每天使用支付宝付款的人数与商家每天的净利润
元,得到7组数据,如表所示,并作出了散点图.
2.(2015新课标全国Ⅱ理科)根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是
C.2006年以来我国二氧化硫年排放量呈减少趋势
D.2006年以来我国二氧化硫年排放量与年份正相关
3.(2015福建理科)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元) |
8.2 |
8.6 |
10.0 |
11.3 |
11.9 |
支出y(万元) |
6.2 |
7.5 |
8.0 |
8.5 |
9.8 |
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
7.(2016新课标全国Ⅲ理科)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.
参考答案
变式拓展
考点冲关
直通高考