1 . 混凝土的抗压强度x较容易测定,而抗剪强度y不易测定,工程中希望建立一种能由x推算y的经验公式,下表列出了现有的9对数据,分别为,,…,.
x | 141 | 152 | 168 | 182 | 195 | 204 | 223 | 254 | 277 |
y | 23.1 | 24.2 | 27.2 | 27.8 | 28.7 | 31.4 | 32.5 | 34.8 | 36.2 |
以成对数据的抗压强度x为横坐标,抗剪强度y为纵坐标作出散点图,如图所示.
(1)从上表中任选2个成对数据,求该样本量为2的样本相关系数r.结合r值分析,由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的线性相关关系?
(2)根据散点图,我们选择两种不同的函数模型作为回归曲线,根据一元线性回归模型及最小二乘法,得到经验回归方程分别为:①,②.经验回归方程①和②的残差计算公式分别为,,.
(ⅰ)求;
(ⅱ)经计算得经验回归方程①和②的残差平方和分别为,,经验回归方程①的决定系数,求经验回归方程②的决定系数.
附:相关系数,决定系数,.
2 . 当前,新一轮科技革命和产业变革蓬勃兴起,以区块链为代表的新一代信息技术迅猛发展,现收集某地近6年区块链企业总数量相关数据,如下表:
年份 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
编号 | 1 | 2 | 3 | 4 | 5 | 6 |
企业总数量(单位:百个) | 50 | 78 | 124 | 121 | 137 | 352 |
(1)若用模型拟合与的关系,根据提供的数据,求出与的经验回归方程;
(2)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛.比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司获得此次信息化比赛的“优胜公司”.已知在每场比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,若首场由甲乙比赛,求甲公司获得“优胜公司”的概率.
参考数据:,其中,
参考公式:对于一组数据,其经验回归直线的斜率和截距的最小二乘估计分别为
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
学生编号i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号i | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:;
(ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.
;;.
年份 | |||||
销量(万台) |
购置传统燃油车 | 购置新能源车 | 总计 | |
男性车主 | |||
女性车主 | |||
总计 |
(2)请将上述列联表补充完整,根据小概率值的独立性检验,分析购车车主购置新能源乘用车与性别是否有关系?
①参考公式:相关系数;
②参考数据:;
③卡方临界值表:
0.10 | 0.05 | 0.010 | 0.005 | 0.001 | |
2.706 | 3.841 | 6.635 | 7.879 | 10.828 |
2 | 3 | 5 | 9 | 11 | |
12 | 10 | 7 | 3 |
A.该回归直线必过 |
B.变量,之间呈正相关关系 |
C.当时,变量的值一定等于 |
D.相应于的残差估计值为 |
A.落在回归直线上的样本点越多,回归直线方程的拟合效果越好 |
B.样本相关系数越大,变量线性相关程度越强 |
C.决定系数越小,残差平方和越大,模型的拟合效果越好 |
D.决定系数越大,残差平方和越小,模型的拟合效果越好 |
附,,
A. | B. |
C. | D. |
(1)假设生产条件正常,记表示化肥的有效利用率,求;
(2)课题组为研究每亩化肥施用量与某农作物亩产量之间的关系,收集了10组数据,并对这些数据作了初步处理,得到了如图所示的散点图及一些统计量的值.其中每亩化肥施用量为(单位:公斤),粮食亩产量为(单位:百公斤)
参考数据:
650 | 91.5 | 52.5 | 1478.6 | 30.5 | 15 | 15 | 46.5 |
(i)根据散点图判断,与,哪一个适宜作为该农作物亩产量关于每亩化肥施用量的回归方程(给出判断即可,不必说明理由);
(ii)根据(i)的判断结果及表中数据,建立关于的回归方程;并预测每亩化肥施用量为27公斤时,粮食亩产量的值.
附:①对于一组数据,2,3,,,其回归直线的斜率和截距的最小二乘估计分别为,;
②若随机变量,则,.
A.若样本数据,,…,的方差为4,则数据,,…,的方差为9 |
B.若随机变量,,则 |
C.若线性相关系数越接近1,则两个变量的线性相关性越弱 |
D.已知随机变量X服从二项分布,若,,则 |