时间代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
销售额y(单位:千元) | 0.84 | 1.37 | 2.76 | 4.43 | 5.49 | 7.66 | 8.94 |
4.5 | 165.2 | 140 |
(1)根据表格中的数据,求出y关于x的线性回归方程;
(2)规定当月销售额超讨15万元时,能被评选为“优秀带货主播”,预测该农户在第几个月能被评选为“优秀带货主播”.
日期 | 2月15日 | 2月16日 | 2月17日 | 2月18日 | 2月19日 |
日期代号 | 1 | 2 | 3 | 4 | 5 |
购物人数 | 77 | 84 | 93 | 96 | 100 |
(2)为了了解参加网购人群的年龄分布,该店随机抽取了200人进行问卷调查.得到如下所示不完整的列联表:
年龄 | 不低于40岁 | 低于40岁 | 合计 |
参与过网上购物 | 30 | 150 | |
未参与过网上购物 | 30 | ||
合计 | 200 |
附:回归直线的斜率和截距的最小二乘估计公式分别为
0.10 | 0.05 | 0.010 | 0.005 | 0.001 | |
2.706 | 3.841 | 6.635 | 7.879 | 10.828 |
了解研发资金的投入额x(单位:千万元)对年收入的附加额y(单位:千万元)的影响,对2017年至2023年研发资金的投入额和年收入的附加额进行研究,得到相关数据如下:
年份 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 | 2023 |
投入额 | 10 | 30 | 40 | 60 | 80 | 90 | 110 |
年收入的附加额 | 7.30 |
(2)若年收入的附加额与投入额的比值大于,则称对应的年份为“优”,从上面的7个年份中任意取3个,记X表示这三个年份为“优”的个数,求X的分布列及数学期望.
参考数据:,,.
附:回归方程的斜率和截距的最小二乘估计公式分别为:
,.
年份 | 2019 | 2020 | 2021 | 2022 | 2023 |
年份代号 | 1 | 2 | 3 | 4 | 5 |
新增碳排放万吨 | 6.1 | 5.2 | 4.9 | 4 | 3.8 |
(2)求关于的线性回归方程,并据此估计该地区2024年的新增碳排放数量.
参考数据:,,,.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,
1 | 3 | 4 | 5 | 7 | |
15 | 20 | 30 | 40 | 45 |
A.对于独立性检验,随机变量的值越小,判定“两变量有关系”犯错误的概率越大 |
B.在经验回归方程中,当解释变量x每增加1个单位时,相应变量增加0.6个单位 |
C.数据,,…,的方差为M,则数据,,,…,的标准差为 |
D.在回归分析中,决定系数是用来刻画回归的效果的,现算得某模型中,则说明该模型的拟合效果较好 |
A.相关变量,具有正相关关系 |
B.去除异常数据后,新的平均数 |
C.去除异常数据后的经验回归方程为 |
D.去除异常数据后,随值增加,的值增加速度变小 |
9 . 云南省统计局发布《全省旅游业发展情况(2015-2022年)》报告,其中2015年至2022年游客总人数y(单位:亿人次)的数据如下表:
年份 | 2015 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
年份代号x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
游客总人数y | 3.3 | 4.3 | 5.7 | 6.9 | 8.1 | 5.3 | 6.5 | 8.4 |
为了预测2023年云南省游客总人数,根据2015年至2022年游客总人数y的数据建立线性回归模型一,得到回归方程:,但由于受到2020年疫情影响,估计预测不准确,若用2015年至2019年数据建立线性回归模型二,得到回归方程:
(1)根据和预测2023年云南省游客总人数(预测数据精确到0.1);
(2)为了检验两种模型的预测效果,对两种模型作残差分析得到:
模型一:总偏差平方和,残差平方和;
模型二:总偏差平方和,残差平方和,
用来比较模型一与模型二的拟合效果(精确到0.001);
(3)根据2020年至2022年游客总人数y的数据建立线性回归模型三,求回归方程,并根据预测2023年云南省游客总人数(预测数据精确到0.1).
参考公式:,,,.
2 | 3 | 5 | 9 | 11 | |
12 | 10 | 7 | 3 |
A.该回归直线必过 |
B.变量,之间呈正相关关系 |
C.当时,变量的值一定等于 |
D.相应于的残差估计值为 |