由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.
参考数据:=9.32,=40.17,=0.55,≈2.646.
参考公式:相关系数
x | 1 | 2 | 3 | 4 | 5 |
y | 9 | 11 | 14 | 26 | 20 |
(1)求样本相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男、女性消费者后,得到数据如表所示:
性别 | 满意程度 | 合计 | |
满意 | 不满意 | ||
男性 | 45 | 10 | 55 |
女性 | 25 | 20 | 45 |
合计 | 70 | 30 | 100 |
(3)对(2)中调研的45名女性消费者,按照其满意程度进行比例分配的分层随机抽样,从中抽出9名女性消费者到公司进行现场考察,再从这9名女性消费者中随机抽取4人进行深度调研,记这4人中“满意”的人数为X,求X的分布列及均值.
参考公式:
①②,其中临界值表:
α | 0.1 | 0.05 | 0.01 | 0.001 |
xα | 2.706 | 3.841 | 6.635 | 10.828 |
城市 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 总和 |
老龄化率 | 0.17 | 0.2 | 0.18 | 0.05 | 0.21 | 0.09 | 0.19 | 0.3 | 0.17 | 0.24 | 1.8 |
空置率 | 0.06 | 0.13 | 0.09 | 0.05 | 0.09 | 0.08 | 0.11 | 0.15 | 0.16 | 0.28 | 1.2 |
(1)若老龄化率不低于,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的频率;
(2)估计该地区城市的老龄化率和空置率的相关系数(结果精确到0.01).
参考公式:相关系数.
月份 | 1 | 2 | 3 | 4 | 5 |
带货金额/万元 | 350 | 440 | 580 | 700 | 880 |
(2)求变量,之间的线性回归方程,并据此预测2023年7月份该公司的直播带货金额.
(3)该公司随机抽取55人进行问卷调查,得到如下不完整的列联表:
参加过直播带货 | 未参加过直播带货 | 总计 | |
女性 | 25 | 30 | |
男性 | 10 | ||
总计 |
参考数据:,,,
,.
参考公式:相关系数,线性回归方程的斜率,截距.
附:,其中.
0.15 | 0.10 | 0.05 | 0.025 | |
2.072 | 2.706 | 3.841 | 5.024 |
5 . 2015—2019年,中国社会消费品零售额占GDP的比重超过4种,2020年后,中国社会消费品零售额占GDP的比重逐年下降.下表为2018—2022年中国社会消费品零售额(单位:万亿元)及其占GDP的比重y(单位:%)的数据,其中2018—2022年对应的年份代码x依次为1~5.
年份代码x | 1 | 2 | 3 | 4 | 5 |
社会消费品零售额 | 37.8 | 40.8 | 39.2 | 44.1 | 44.0 |
社会消费品零售额占 GDP的比重y/% | 41.3 | 41.5 | 39.0 | 38.6 | 36.7 |
(1)由上表数据,是否可用一元线性回归模型拟合y与x的关系,请用相关系数加以说明.
(2)请建立y关于x的一元线性回归方程.
(3)从2018—2022年中国社会消费品零售额这5个数据中随机抽取2个数据.若抽取的2个数据中至少有1个数据大于40.0,求这2个数据恰好有1个数据不小于44.0的概率.
附:,,,,
相关系数.
对于一组数据,其一元线性回归直线的斜率和截距的最小二乘估计公式分别为,.
(1)根据参考数据计算样本相关系数(精确到);
(2)令变量,,利用(1)中结论求关于的经验回归方程,并预测年移动物联网连接数.
附注:(i)回归方程中斜率和截距最小二乘估计公式分别为,,样本相关系数;
(ii)参考数据:,,,
2 | 3 | 4 | 5 | 6 | 7 | |
52.5 | 45 | 40 | 30 | 25 | 17.5 |
附:在线性回归方程中,,其中为样本平均值.
(1)画出表中数据的散点图,并指出与之间的相关系数是正还是负;
(2)求出关于的线性回归方程,并写出当时,预测数据的值.
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
学生编号i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号i | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:;
(ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.
;;.
气温/℃ | 6.9 | 17 | 16.9 | 11.3 | 14.2 | 12.3 | 18.2 | 17.3 | 10.4 | 13.3 | 6.4 | 8.6 |
海拔/m | 3640 | 4420 | 4220 | 2840 | 3200 | 3140 | 3360 | 4650 | 2680 | 3970 | 2080 | 2260 |
纬度 | 32.2 | 33.8 | 35 | 36.3 | 37.1 | 38.4 | 38.9 | 35.3 | 36.8 | 33.8 | 35.9 | 36.6 |