x | 141 | 152 | 168 | 182 | 195 | 204 | 223 | 254 | 277 |
y | 23.1 | 24.2 | 27.2 | 27.8 | 28.7 | 31.4 | 32.5 | 34.8 | 36.2 |
(2)根据散点图,我们选择两种不同的函数模型作为回归曲线,根据一元线性回归模型及最小二乘法,得到经验回归方程分别为:①,②.经验回归方程①和②的残差计算公式分别为,,.
(ⅰ)求;
(ⅱ)经计算得经验回归方程①和②的残差平方和分别为,,经验回归方程①的决定系数,求经验回归方程②的决定系数.
附:相关系数,决定系数,.
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
3 . 某校20名学生的数学成绩和知识竞赛成绩如下表:
学生编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且,,.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到).
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:.
(ii)用(i)的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到).
(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.;;.
(1)根据散点图判断,与(其中…为自然对数的底数)哪一个更适合作为平均产卵数y(个)关于平均温度x(℃)的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出y关于x的回归方程.(计算结果精确到0.1)
附:回归方程中,,
参考数据() | |||||
5215 | 17713 | 714 | 27 | 81.3 | 3.6 |
在每年价格不变,无虫害的情况下,某果园年产值为200万元,根据以上数据,以得到最高收益(收益=产值-防害费用)为目标,请为果农从以下几个方案中推荐最佳防害方案,并说明理由.
方案1:选择防害措施A,可以防止各种气温的红蜘蛛虫害不减产,费用是18万;
方案2:选择防害措施B,可以防治22℃至28℃的蜘蛛虫害,但无法防治28℃以上的红蜘蛛虫害,费用是10万;
方案3:不采取防虫害措施.
日期 | 第一日 | 第三日 | 第五日 | 第四日 | 第二日 | 第六日 |
昼夜温差(℃) | 4 | 7 | 8 | 9 | 12 | 14 |
就诊人数(个) |
(1)根据散点图可以认为与之间存在线性相关关系,且相关系数,请用最小二乘法求出线性回归方程(,用分数表示);
(2)分析数据发现:第六日就诊人数,第一日就诊患者中有3个小孩,其他患者全是大人,现随机的从第一日所有就诊患者中选出2人,若2人中至少有一个小孩的概率为;
①求的值;
②若,求,,,的值(只写结果,不要求过程).
(参考公式:,,)
年份 | 2015年 | 2016年 | 2017年 | 2018年 | 2019年 | 2020年 | 2021年 |
年度GDP(亿元) | 688858.2 | 746395.1 | 832035.9 | 919281.1 | 986515.2 | 1015986.2 | 1143669.7 |
年份代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
GDP实际增长率 | 7.0 | 6.8 | 6.9 | 6.7 | 6.0 | 2.3 | 8.1 |
(1)用第1到第7年的数据得到年度实际GDP增长率关于年份代码x的回归方程近似为:,对该回归方程进行残差分析,得到下表,视残差的绝对值超过1.5的数据为异常数据.
年份代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
GDP实际增长率 | 7.0 | 6.8 | 6.9 | 6.7 | 6.0 | 2.3 | 8.1 |
GDP增长率估计值 | 6.98 | 6.50 | 6.26 | 6.02 | 5.54 | ||
残差 | 0.02 | 0.40 | 0.74 | -0.02 | 2.56 |
(2)剔除(1)中的异常数据,用最小二乘法求出回归方程:,并据此预测数据异常年份的GDP增长率.
附:,
年份代码x | 1 | 2 | 3 | 4 | 5 |
市场规模y | 3.98 | 4.56 | 5.04 | 5.86 | 6.36 |
(2)已知中国在线直播购物用户选择在品牌官方直播间购物与不在品牌官方直播间购物的人数之比为4:1,按照分层抽样从这两类用户中抽取5人,再从这5人中随机抽取2人,求这2人全是选择在品牌官方直播间购物用户的概率.
参考数据:,,,其中.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
x | 1 | 2 | 3 | 4 | 5 |
y | 9 | 11 | 14 | 26 | 20 |
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:
满意 | 不满意 | 总计 | |
男 | 45 | 10 | 55 |
女 | 25 | 20 | 45 |
总计 | 70 | 30 | 100 |
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①;
②,其中.
临界值表:
0.100 | 0.050 | 0.025 | 0.010 | 0.001 | |
2.706 | 3.841 | 5.024 | 6.635 | 10.828 |
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:
1 | 2 | 3 | 4 | 5 | |
232 | 98 | 60 | 40 | 20 |
(3)证明:.
附:经验回归方程系数:,;
参考数据:,,(其中,).
6 | 97.90 | 0.21 | 60 | 0.14 | 14.12 | 26.13 | ﹣1.40 |
(2)根据(1)的结果回答下列问题:
(i)建立关于的回归方程;
(ii)样本对原点的距离时,金属含量的预报值是多少?
(iii)已知该金属在距离原点时的平均开采成本(单位:元)与,关系为,根据(2)的结果回答,为何值时,开采成本最大?
附:对于一组数据,其线性相关系数,
其回归直线的斜率和截距的最小二乘估计分别为:,.