组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 10 道试题
1 . 混凝土的抗压强度x较容易测定,而抗剪强度y不易测定,工程中希望建立一种能由x推算y的经验公式,下表列出了现有的9对数据,分别为,…,

x

141

152

168

182

195

204

223

254

277

y

23.1

24.2

27.2

27.8

28.7

31.4

32.5

34.8

36.2

以成对数据的抗压强度x为横坐标,抗剪强度y为纵坐标作出散点图,如图所示.

(1)从上表中任选2个成对数据,求该样本量为2的样本相关系数r.结合r值分析,由简单随机抽样得到的成对样本数据的样本相关系数是否一定能确切地反映变量之间的线性相关关系?
(2)根据散点图,我们选择两种不同的函数模型作为回归曲线,根据一元线性回归模型及最小二乘法,得到经验回归方程分别为:①,②.经验回归方程①和②的残差计算公式分别为
(ⅰ)求
(ⅱ)经计算得经验回归方程①和②的残差平方和分别为,经验回归方程①的决定系数,求经验回归方程②的决定系数
附:相关系数,决定系数
2023-12-22更新 | 859次组卷 | 6卷引用:重庆市第八中学2024届高三高考适应性月考卷(四)数学试题
2 . 某专营店统计了最近天到该店购物的人数和时间第天之间的数据,列表如下:

(1)由表中给出的数据,判断是否可用线性回归模型拟合人数与时间之间的关系?(若,则认为线性相关程度高,可用线性回归模型拟合;否则,不可用线性回归模型拟合.计算时精确到
(2)该专营店为了吸引顾客,推出两种促销方案:方案一,购物金额每满元可减元;方案二,购物金额超过元可抽奖三次,每次中奖的概率均为,且每次抽奖互不影响,中奖一次打折,中奖两次打折,中奖三次打折.某顾客计划在此专营店购买一件价值元的商品,请从实际付款金额的数学期望的角度分析,选哪种方案更优惠?
参考数据:.附:相关系数.
2023-11-07更新 | 1037次组卷 | 11卷引用:重庆市九龙坡区育才中学校2024届高三上学期第三次联考复习数学试题

3 . 某校20名学生的数学成绩和知识竞赛成绩如下表:

学生编号

1

2

3

4

5

6

7

8

9

10

数学成绩

100

99

96

93

90

88

85

83

80

77

知识竞赛成绩

290

160

220

200

65

70

90

100

60

270

学生编号

11

12

13

14

15

16

17

18

19

20

数学成绩

75

74

72

70

68

66

60

50

39

35

知识竞赛成绩

45

35

40

50

25

30

20

15

10

5

计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且


(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到).
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记中的排名是第位,中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.

(i)记.证明:

(ii)用(i)的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到).


(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.

注:参考公式与参考数据.

2023-05-19更新 | 1072次组卷 | 5卷引用:重庆市江北区第十八中学2023-2024学年高三上学期11月检测(一)数学试题
4 . 红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数y(个)和平均温度x(℃)有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.

   

(1)根据散点图判断,(其中…为自然对数的底数)哪一个更适合作为平均产卵数y(个)关于平均温度x(℃)的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出y关于x的回归方程.(计算结果精确到0.1)
附:回归方程中

参考数据(

5215

17713

714

27

81.3

3.6

(3)根据以往每年平均气温以及对果园年产值的统计,得到以下数据:平均气温在22℃以下的年数占60%,对柚子产量影响不大,不需要采取防虫措施;平均气温在22℃至28℃的年数占30%,柚子产量会下降20%;平均气温在28℃以上的年数占10%,柚子产量会下降50%.为了更好的防治红蜘蛛虫害,农科所研发出各种防害措施供果农选择.
在每年价格不变,无虫害的情况下,某果园年产值为200万元,根据以上数据,以得到最高收益(收益=产值-防害费用)为目标,请为果农从以下几个方案中推荐最佳防害方案,并说明理由.
方案1:选择防害措施A,可以防止各种气温的红蜘蛛虫害不减产,费用是18万;
方案2:选择防害措施B,可以防治22℃至28℃的蜘蛛虫害,但无法防治28℃以上的红蜘蛛虫害,费用是10万;
方案3:不采取防虫害措施.
2023-09-22更新 | 3061次组卷 | 21卷引用:重庆市2024届高三上学期9月月度质量检测数学试题
智能选题,一键自动生成优质试卷~
5 . 重庆位于北半球亚热带内陆地区,其气候特征恰如几句俗谚:春早气温不稳定,夏长酷热多伏旱,秋凉绵绵阴雨天,冬暖少雪云雾多.尤其是10月份,昼夜温差很大,某数学兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了2021年10月某六天的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期第一日第三日第五日第四日第二日第六日
昼夜温差(℃)47891214
就诊人数(个)
其中:,2,3,4,5,6,参考数据:
(1)根据散点图可以认为之间存在线性相关关系,且相关系数,请用最小二乘法求出线性回归方程用分数表示);
(2)分析数据发现:第六日就诊人数,第一日就诊患者中有3个小孩,其他患者全是大人,现随机的从第一日所有就诊患者中选出2人,若2人中至少有一个小孩的概率为
①求的值;
②若,求的值(只写结果,不要求过程).
(参考公式:
2022-10-16更新 | 865次组卷 | 3卷引用:重庆市南开中学2023届高三上学期第二次质量检测数学试题
6 . 某公众号根据统计局统计公报提供的数据,对我国2015—2021年的国内生产总值GDP进行统计研究,做出如下2015—2021年GDPGDP实际增长率的统计图表.通过统计数据可以发现,GDP呈现逐年递增趋势.2020年,GDP增长率出现较明显降幅,但GDP却首次突破100万亿.现统计人员选择线性回归模型,对年份代码x和年度实际GDP增长率进行回归分析.
年份2015年2016年2017年2018年2019年2020年2021年
年度GDP(亿元)688858.2746395.1832035.9919281.1986515.21015986.21143669.7
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1

(1)用第1到第7年的数据得到年度实际GDP增长率关于年份代码x的回归方程近似为:,对该回归方程进行残差分析,得到下表,视残差的绝对值超过1.5的数据为异常数据.
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1
GDP增长率估计值6.986.506.266.025.54
残差0.020.400.74-0.022.56
将以上表格补充完整,指出GDP增长率出现异常数据的年份及异常现象,并根据所学统计学知识,结合生活实际,推测GDP增长率出现异常的可能原因;
(2)剔除(1)中的异常数据,用最小二乘法求出回归方程:,并据此预测数据异常年份的GDP增长率.
附:
2022-05-06更新 | 753次组卷 | 3卷引用:重庆市南开中学校2022届高三第九次质量检测数学试题
7 . 数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.
年份代码x12345
市场规模y3.984.565.045.866.36
(1)由上表数据可知,可用函数模型拟合yx的关系,请建立y关于x的回归方程(的值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物与不在品牌官方直播间购物的人数之比为4:1,按照分层抽样从这两类用户中抽取5人,再从这5人中随机抽取2人,求这2人全是选择在品牌官方直播间购物用户的概率.
参考数据:,其中.
参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计公式分别为.
2022-04-24更新 | 1880次组卷 | 8卷引用:重庆市2023届高三下学期3月月度质量检测数学试题
8 . 2021年某公司为了提升一项产品的竞争力和市场占有率,对该项产品进行了科技创新和市场开发,经过一段时间的运营后,统计得到xy之间的五组数据如下表:

x

1

2

3

4

5

y

9

11

14

26

20

其中,x(单位:百万元)是科技创新和市场开发的总投入,y(单位:百万元)是科技创新和市场开发后的收益.
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:

满意

不满意

总计

45

10

55

25

20

45

总计

70

30

100

是否有99%的把握认为消费者满意程度与性别有关?
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①
,其中.
临界值表:

0.100

0.050

0.025

0.010

0.001

2.706

3.841

5.024

6.635

10.828

参考数据:.
2022-04-17更新 | 966次组卷 | 1卷引用:重庆市2022届高三学业质量调研抽测(第二次)数学试题
9 . 规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:

1

2

3

4

5

232

98

60

40

20

关于的回归方程,并预测成功的总人数(精确到1);
(3)证明:
附:经验回归方程系数:
参考数据:(其中).
2022-04-08更新 | 6756次组卷 | 16卷引用:重庆市缙云教育联盟2022届高三第二次诊断性检测数学试题
10 . 为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中).

6

97.90

0.21

60

0.14

14.12

26.13

﹣1.40

(1)利用样本相关系数的知识,判断哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?
(2)根据(1)的结果回答下列问题:
i)建立关于的回归方程;
ii)样本对原点的距离时,金属含量的预报值是多少?
iii)已知该金属在距离原点时的平均开采成本(单位:元)与关系为,根据(2)的结果回答,为何值时,开采成本最大?
附:对于一组数据,其线性相关系数
其回归直线的斜率和截距的最小二乘估计分别为:
共计 平均难度:一般