组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 62 道试题
1 . 为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2021年种植的一批试验紫甘薯在温度升高时6组死亡的株数.
温度/℃212324272930
死亡数/株61120275777
经计算,
,其中分别为试验数据中的温度和死亡株数,.
(1)若用一元线性回归模型,求关于的经验回归方程
(2)若用非线性回归模型求得关于的非线性经验回归方程,且相关指数为.
(ⅰ)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好;
(ii)用拟合效果好的模型预测温度为35℃时该批紫甘薯的死亡株数(结果取整数).
附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为:相关指数为:.
2 . 某公众号根据统计局统计公报提供的数据,对我国2015—2021年的国内生产总值GDP进行统计研究,做出如下2015—2021年GDPGDP实际增长率的统计图表.通过统计数据可以发现,GDP呈现逐年递增趋势.2020年,GDP增长率出现较明显降幅,但GDP却首次突破100万亿.现统计人员选择线性回归模型,对年份代码x和年度实际GDP增长率进行回归分析.
年份2015年2016年2017年2018年2019年2020年2021年
年度GDP(亿元)688858.2746395.1832035.9919281.1986515.21015986.21143669.7
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1

(1)用第1到第7年的数据得到年度实际GDP增长率关于年份代码x的回归方程近似为:,对该回归方程进行残差分析,得到下表,视残差的绝对值超过1.5的数据为异常数据.
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1
GDP增长率估计值6.986.506.266.025.54
残差0.020.400.74-0.022.56
将以上表格补充完整,指出GDP增长率出现异常数据的年份及异常现象,并根据所学统计学知识,结合生活实际,推测GDP增长率出现异常的可能原因;
(2)剔除(1)中的异常数据,用最小二乘法求出回归方程:,并据此预测数据异常年份的GDP增长率.
附:
2022-05-06更新 | 758次组卷 | 3卷引用:重庆市南开中学校2022届高三第九次质量检测数学试题
3 . 身高体重指数(BMI)的大小直接关系到人的健康状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测量其身高、体重的数据如下表.

学生编号

1

2

3

4

5

身高x/cm

l65

170

175

170

170

体重y/kg

58

67

67

65

63

(1)求体重关于身高的线性回归方程,并预测身高为180cm的同学的体重;
(2)试分析学生的体重差异约有多少是由身高引起的?(注:结果保留两位小数)参考公式:线性回归方程中,,其中为样本平均值,.
2022-05-03更新 | 1385次组卷 | 7卷引用:重庆市第八中学校2022届高三下学期高考适应性强化训练(四)数学试题
4 . 某省为了坚决打赢脱贫攻坚战,在100个贫困村中,用简单随机抽样的方法抽取15个进行脱贫验收调查,调查得到的样本数据,其中分别表示第i个贫困村中贫困户的年平均收入(单位:万元)和产业扶贫资金投入数量(单位:万元),并计算得到
(1)试估计该省贫困村的贫困户年平均收入;
(2)根据样本数据,求该省贫困村中贫困户年平均收入与产业扶贫资金投入的相关系数(精确到0.01);
(3)根据现有统计资料,各贫困村产业扶贫资金投入差异很大.为了确保完成脱贫攻坚任务,准确地进行脱贫验收,请给出一种你认为更合理的抽样方法,并说明理由.
参考公式:
2022-09-07更新 | 1634次组卷 | 13卷引用:重庆市育才中学2022届高三二诊模拟(二)数学试题
5 . 数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.
年份代码x12345
市场规模y3.984.565.045.866.36
(1)由上表数据可知,可用函数模型拟合yx的关系,请建立y关于x的回归方程(的值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物与不在品牌官方直播间购物的人数之比为4:1,按照分层抽样从这两类用户中抽取5人,再从这5人中随机抽取2人,求这2人全是选择在品牌官方直播间购物用户的概率.
参考数据:,其中.
参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计公式分别为.
2022-04-24更新 | 1889次组卷 | 8卷引用:重庆市2023届高三下学期3月月度质量检测数学试题
6 . 2021年某公司为了提升一项产品的竞争力和市场占有率,对该项产品进行了科技创新和市场开发,经过一段时间的运营后,统计得到xy之间的五组数据如下表:

x

1

2

3

4

5

y

9

11

14

26

20

其中,x(单位:百万元)是科技创新和市场开发的总投入,y(单位:百万元)是科技创新和市场开发后的收益.
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:

满意

不满意

总计

45

10

55

25

20

45

总计

70

30

100

是否有99%的把握认为消费者满意程度与性别有关?
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①
,其中.
临界值表:

0.100

0.050

0.025

0.010

0.001

2.706

3.841

5.024

6.635

10.828

参考数据:.
2022-04-17更新 | 968次组卷 | 1卷引用:重庆市2022届高三学业质量调研抽测(第二次)数学试题
7 . 规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:

1

2

3

4

5

232

98

60

40

20

关于的回归方程,并预测成功的总人数(精确到1);
(3)证明:
附:经验回归方程系数:
参考数据:(其中).
2022-04-08更新 | 6868次组卷 | 16卷引用:重庆市缙云教育联盟2022届高三第二次诊断性检测数学试题
8 . 新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.
日期代码x12345678
累计确诊人数y481631517197122
为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量xy的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,其中.

(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?(结果保留整数)
附:回归直线的斜率和截距的最小二乘估计公式分别为:.
2022-05-23更新 | 2157次组卷 | 21卷引用:重庆市南开中学2019-2020学年高三下学期(线上测试)期中数学(理)试题
9 . 某电器企业统计了近年的年利润额(千万元)与投入的年广告费用(十万元)的相关数据,散点图如图,对数据作出如下处理:令,得到相关数据如表所示:

15

15


(1)从①;②;③三个函数中选择一个作为年广告费用和年利润额的回归类型,判断哪个类型符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出的回归方程;
(3)预计要使年利润额突破亿,下一年应至少投入多少广告费用?结果保留到万元
参考数据:
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为
2021-10-15更新 | 3160次组卷 | 15卷引用:重庆市实验中学2022届高三上学期开学考试数学试题
10 . 2021年3月1日,国务院新闻办公室举行新闻发布会,工业和信息化部长肖亚庆先生提出了芯片发展的五项措施,进一步激励国内科技巨头加大了科技研发投入的力度.中华技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入(亿元)与科技升级直接纯收益(亿元)的数据统计如下:

序号

1

2

3

4

5

6

7

8

9

10

11

12

2

3

4

6

8

10

13

21

22

23

24

25

13

22

31

42

50

56

58

68.5

68

67.5

66

66

时,建立了的两个回归模型:模型①:;模型②:;当时,确定满足的线性回归方程为
(1)根据下列表格中的数据,比较当时模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型.

回归模型

模型①

模型②

回归方程

182.4

79.2

(附:刻画回归效果的相关指数
(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,应用(1)的结论,比较科技升级投入17亿元与20亿元时公司实际收益的大小.
(附:线性回归方程的系数关系:
(3)科技升级后,“麒麟”芯片的效率大幅提高,经实际试验得大致服从正态分布.公司对科技升级团队的奖励方案如下:若芯片的效率不超过,不予奖励:若芯片的效率超过,但不超过,每部芯片奖励2元;若芯片的效率超过,每部芯片奖励4元.记为每部芯片获得的奖励,求(精确到0.01).
(附:若随机变量,则
共计 平均难度:一般