(1)函数关系是一种确定关系,而相关关系是一种不确定关系.
(2)样本相关系数r越大,两变量的相关性越强.
(3)散点图可以直观地分析出两个变量是否具有相关性.
(4)若变量x,y满足函数关系,则这两个变量线性相关.
(5)两个变量的相关关系是一种确定的关系
(6)当一个变量的值增加时,另一个变量的值随之减少,则称这两个变量负相关.
(7)一般地,样本容量越大,用样本相关系数估计两个变量的相关系数的效果越好.
(8)统计活动中,分析数据时通常用统计图表计算数据的数据特征.
(9)在一定范围内,农作物的产量与施肥量之间的关系是相关关系.
(1)残差平方和越接近0, 线性回归模型的拟合效果越好.
(2)在画两个变量的散点图时, 响应变量在x轴上,解释变量在y轴上.
(3)越小, 线性回归模型的拟合效果越好.
年份 | GDP/亿元 | 年份 | GDP/亿元 |
1997 | 79715.0 | 2002 | 121717.4 |
1998 | 85195.5 | 2003 | 137422.0 |
1999 | 90564.4 | 2004 | 161840.2 |
2000 | 100280.1 | 2005 | 187318.9 |
2001 | 110863.1 | 2006 | 219438.5 |
(2)建立年份为解释变量,GDP为响应变量的一元线性回归模型,并计算残差;
(3)根据你得到的一元线性回归模型,预测2017年的GDP,看看你的预测值与实际的GDP的误差是多少?(2017年GDP的实际值为亿元)
(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由
(5)随着时间的发展,又收集到2007~2016年的GDP数据如下:
年份 | GDP/亿元 | 年份 | GDP/亿元 |
2007 | 270232.3 | 2012 | 540367.4 |
2008 | 319515.5 | 2013 | 595244.4 |
2009 | 349081.4 | 2014 | 643974.0 |
2010 | 413030.3 | 2015 | 689052.1 |
2011 | 489300.6 | 2016 | 744127.2 |
4 . 某市104路公交车上午7:05—8:55时段在起点站每9分钟发一班次.公交公司为了了解早高峰时段各班次上客情况,某日上午7:14—8:35记录了在起点站各班次车辆上客的人数:
发车时刻 | 7:14 | 7:23 | 7:32 | 7:41 | 7:50 | 7:59 | 8:08 | 8:17 | 8:26 | 8:35 |
上车乘客数/人 | 10 | 13 | 13 | 18 | 17 | 15 | 12 | 9 | 3 | 3 |
请绘制这组成对数据的散点图,并通过观察散点图大致判断客车发车时刻与上车乘客人数之间的相关性.
豆类 | 黄豆 | 豇豆 | 青毛豆 | 豌豆(鲜) | 四季豆 |
脂肪含量/kg | 0.0184 | 0.0002 | 0.0057 | 0.0003 | 0.0004 |
热量/kJ | 1726 | 108 | 527 | 336 | 130 |
(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似的表示这种关系,并计算豆类脂肪含量与热量的相关系数.
151 | 152 | 153 | 154 | 156 | 157 | 158 | 159 | 160 | 162 | 163 | 164 | |
40 | 41 | 41 | 41.5 | 42 | 42.5 | 43 | 44 | 45 | 45 | 46 | 45.5 |
(2)判断变量,是否具有相关关系?如果具有相关关系,那么是正相关还是负相关?
A.解释变量x与预报变量y的相关性变强 | B.样本相关系数r变大 |
C.残差平方和变小 | D.决定系数变小 |
(1)根据散点图判断,与(其中…为自然对数的底数)哪一个更适合作为平均产卵数y(个)关于平均温度x(℃)的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出y关于x的回归方程.(计算结果精确到0.1)
附:回归方程中,,
参考数据() | |||||
5215 | 17713 | 714 | 27 | 81.3 | 3.6 |
在每年价格不变,无虫害的情况下,某果园年产值为200万元,根据以上数据,以得到最高收益(收益=产值-防害费用)为目标,请为果农从以下几个方案中推荐最佳防害方案,并说明理由.
方案1:选择防害措施A,可以防止各种气温的红蜘蛛虫害不减产,费用是18万;
方案2:选择防害措施B,可以防治22℃至28℃的蜘蛛虫害,但无法防治28℃以上的红蜘蛛虫害,费用是10万;
方案3:不采取防虫害措施.
年份 | 2012 | 2013 | 2014 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 |
年份代码 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
风力发电量(亿千瓦时) | 955.8 | 1412 | 1599.8 | 1857.7 | 2370.7 | 2972.3 | 3659.7 | 4060.3 | 4664.7 |
(1)根据散点图分析与之间的相关关系;
(2)根据相应数据计算得,,,求关于的线性回归方程(精确到0.1).
附:回归方程中斜率和截距的最小二乘估计公式分别为:,.
年份 | 1953 | 1964 | 1982 | 1990 | 2000 | 2010 | 2020 |
第x次人口普查 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
城镇人口比例(y%) | 13.26 | 18.30 |
(1)根据图2完成上面表格,不用计算直观判断人口城镇化率与年份是否存在相关关系?
(2)由图可以发现城镇人口比例大致分布在一条直线附近,已知,,试根据这些数据建立城镇人口比例y%关于人口普查次数x的回归方程.
(,).