年份 | 2019 | 2020 | 2021 | 2022 | 2023 |
年份代号 | 1 | 2 | 3 | 4 | 5 |
新增碳排放万吨 | 6.1 | 5.2 | 4.9 | 4 | 3.8 |
(2)求关于的线性回归方程,并据此估计该地区2024年的新增碳排放数量.
参考数据:,,,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,
A.数据1,2,3,4,5,6,8,9,11的第75百分位数是7 |
B.若事件M,N的概率满足,且M,N相互独立,则 |
C.由两个分类变量,的成对样本数据计算得到,依据的独立性检验,可判断,独立 |
D.若一组样本数据的对应样本点都在直线上,则这组样本数据的相关系数为 |
月份 | 1 月 | 2 月 | 3 月 | 4 月 | 5 月 |
月份编号x | 1 | 2 | 3 | 4 | 5 |
利润y(百万) | 7 | 12 | 13 | 19 | 24 |
(1)根据统计表,求该企业的利润y与月份编号x的样本相关系数(精确到0.01),并判断它们是否具有线性相关关系(,则认为y与x的线性相关性较强,,则认为y与x的线性相关性较弱.);
(2)该企业现有甲、乙两条流水线生产同一种产品.为对产品质量进行监控,质检人员先用简单随机抽样的方法从甲、乙两条流水线上分别抽取了5件、3件产品进行初检,再从中随机选取3件做进一步的质检,记抽到“甲流水线产品”的件数为,试求的分布列与期望.
附:相关系数
5 . 云南省统计局发布《全省旅游业发展情况(2015-2022年)》报告,其中2015年至2022年游客总人数y(单位:亿人次)的数据如下表:
年份 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
年份代号x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
游客总人数y | 3.3 | 4.3 | 5.7 | 6.9 | 8.1 | 5.3 | 6.5 | 8.4 |
为了预测2023年云南省游客总人数,根据2015年至2022年游客总人数y的数据建立线性回归模型一,得到回归方程:,但由于受到2020年疫情影响,估计预测不准确,若用2015年至2019年数据建立线性回归模型二,得到回归方程:
(1)根据和预测2023年云南省游客总人数(预测数据精确到0.1);
(2)为了检验两种模型的预测效果,对两种模型作残差分析得到:
模型一:总偏差平方和,残差平方和;
模型二:总偏差平方和,残差平方和,
用来比较模型一与模型二的拟合效果(精确到0.001);
(3)根据2020年至2022年游客总人数y的数据建立线性回归模型三,求回归方程,并根据预测2023年云南省游客总人数(预测数据精确到0.1).
参考公式:,,,.
年份 | |||||
销量(万台) |
购置传统燃油车 | 购置新能源车 | 总计 | |
男性车主 | |||
女性车主 | |||
总计 |
(2)请将上述列联表补充完整,根据小概率值的独立性检验,分析购车车主购置新能源乘用车与性别是否有关系?
①参考公式:相关系数;
②参考数据:;
③卡方临界值表:
0.10 | 0.05 | 0.010 | 0.005 | 0.001 | |
2.706 | 3.841 | 6.635 | 7.879 | 10.828 |
研发投入(亿元) | 1 | 2 | 3 | 4 | 5 |
产品收益(亿元) | 3 | 7 | 9 | 10 | 11 |
A.变量与正相关且相关性较强 |
B. |
C.当时,的估计值为40.3 |
D.相应于点的残差为0.8 |
A.两个变量的线性相关性越强,则变量的线性相关系数越大 |
B.随机变量,则 |
C.抛掷两枚质地均匀的硬币,在有一枚正面朝上的条件下,另外一枚也正面朝上的概率为 |
D.设随机变量,则 |
身体综合指标评分 | 1 | 2 | 3 | 4 | 5 |
用时(/小时) | 9.5 | 8.6 | 7.8 | 7 | 6.1 |
(2)建立关于的回归方程.
参考数据和参考公式:相关系数,,,
(1)根据所给数据,用相关系数(精确到0.01)判断是否可用线性回归模型拟合与的关系;
(2)现有两个家庭参与套圈,家庭3位成员每轮每人套住小白兔的概率都为家庭3位成员每轮每人套住小白兔的概率分别为,每个家庭的3位成员均玩一次套圈为一轮,每轮每人收费30元,每个小白兔价值60元,且每人是否套住相互独立,以每个家庭的盈利的期望为决策依据,问:一轮结束后,哪个家庭损失较大?
附:相关系数.