(1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到0.01),并推断它们的相关程度;
(2)(i)假设变量x与变量Y的n对观测数据为(x1,y1),(x2,y2),…,(xn,yn),两个变量满足一元线性回归模型 (随机误差).请推导:当随机误差平方和Q=取得最小值时,参数b的最小二乘估计.
(ii)令变量,则变量x与变量Y满足一元线性回归模型利用(i)中结论求y关于x的经验回归方程,并预测2024年移动物联网连接数.
附:样本相关系数,,,,
相似题推荐
城市编号i | 1 | 2 | 3 | 4 | 5 |
A指标 | 4 | 6 | 2 | 8 | 5 |
B指标 | 4 | 4 | 3 | 5 | 4 |
C指标 | 3 | 6 | 2 | 5 | 4 |
(2)利用向量夹角来分析y与x之间及z与x之间的相关关系.
附:相关系数.
参考数据:,,,
,,,.
【推荐2】某校20名学生的数学成绩和知识竞赛成绩如下表:
学生编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且,,.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到).
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:.
(ii)用(i)的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到).
(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.;;.
【推荐1】某校20名学生的数学成绩和知识竞赛成绩如下表:
学生编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且,,.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到).
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:.
(ii)用(i)的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到).
(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.;;.
编号x | 1 | 2 | 3 | 4 | 5 |
年份 | 2015 | 2016 | 2017 | 2018 | 2019 |
快递量y(单位:百万件) | 1 | 3 | 6 | 9 | 15 |
374 | 4.4 | 212 | 6.5 | 121 |
(1)设和的相关系数为和的相关系数为,请从相关系数的角度,确定或(其中均为常数,e为自然对数的底数)哪一个拟合程度更好;
(2)根据(1)的结论及表中数据,建立y关于x的回归方程(系数精确到0.01),并预测2020年度的快递量(单位:百万件,精确到0.01).
附:①相关系数,回归直线中斜率和截距的最小二乘估计公式分别为.
②参考数据:.
学生编号i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号i | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:;
(ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.
;;.
(1)为了解活动效果,该年级对开展活动以来近个月体重超重的人数进行了调查,调查结果统计如图,根据这个散点图可以认为散点集中在曲线的附近,请根据下表中的数据求出该年级体重超重人数与月份之间的回归方程(系数和的最终结果精确到),并预测从开展活动以来第几个月份开始该年级体重超标的人数降至人以下?
月份 | 1 | 2 | 3 | 4 | 5 | 6 |
体重超标人数 | 99 | 77 | 54 | 48 | 32 | 27 |
4.58 | 4.34 | 3.98 | 3.87 | 3.46 | 3.29 |
控球队员 | A | B | C | |||
接球队员 | B | C | A | C | A | B |
概率 |
附:线性回归方程: 中,,;
参考数据:,,,.
表1:
x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
y | 6 | 11 | 21 | 34 | 66 | 101 | 196 |
根据以上数据,绘制了散点图.
(1)根据散点图判断,在推广期内,与(c,d均为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表1中的数据,求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.参考数据:其中,
62.14 | 1.54 | 2535 | 50.12 | 3.47 |
参考公式:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:.
(3)微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人,若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中都是青年人.是否有99.9%的把握认为“经常使用微信与年龄有关”?
附:
P(K2≥k0) | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k0 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
我们在研究两个变量之间的相关关系时,往往先选取若干个样本点(),(),……,(),将样本点画在平面直角坐标系内,就得到样本的散点图.观察散点图,如果所有样本点都落在某一条直线附近,变量之间就具有线性相关关系,如果所有的样本点都落在某一非线性函数图象附近,变量之间就有非线性相关关系.在统计学中经常选择线性或非线性(函数)回归模型来刻画相关关系,并且可以用适当的方法求出回归模型的方程,还常用相关指数R2来刻画回归的效果,相关指数R2的计算公式为:
当R2越大时,回归方程的拟合效果越好;当R2越小时,回归方程的拟合效果越差,R2是常用的选择模型的指标之一,在实际应用中应该尽量选择R2较大的回归模型.
【阅读材料2】
2021年6月17日9时22分,我国酒泉卫星发射中心用长征二号F遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪胺3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛,该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造,根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:
序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
x | 2 | 3 | 4 | 6 | 8 | 10 | 13 | 21 | 22 | 23 | 24 | 25 |
y | 15 | 22 | 27 | 40 | 48 | 54 | 60 | 68.5 | 68 | 67.5 | 66 | 65 |
模型①:;模型②:;
当x>13时,确定y与x满足的线性回归直线方程为.
根据以上阅读材料,解答以下问题:
(1)根据下列表格中的数据,比较当0<x≤13时模型①,②的相关指数R2的大小,并选择拟合效果更好的模型.
回归模型 | 模型① | 模型② |
回归方程 | ||
79.13 | 20.2 |
附:①若最小二乘法求得回归直线方程为,则;
②
③,当时,.