组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 60 道试题
1 . 某省为了坚决打赢脱贫攻坚战,在100个贫困村中,用简单随机抽样的方法抽取15个进行脱贫验收调查,调查得到的样本数据,其中分别表示第i个贫困村中贫困户的年平均收入(单位:万元)和产业扶贫资金投入数量(单位:万元),并计算得到
(1)试估计该省贫困村的贫困户年平均收入;
(2)根据样本数据,求该省贫困村中贫困户年平均收入与产业扶贫资金投入的相关系数(精确到0.01);
(3)根据现有统计资料,各贫困村产业扶贫资金投入差异很大.为了确保完成脱贫攻坚任务,准确地进行脱贫验收,请给出一种你认为更合理的抽样方法,并说明理由.
参考公式:
2022-09-07更新 | 1539次组卷 | 13卷引用:重庆市育才中学2022届高三二诊模拟(二)数学试题
2 . 数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.
年份代码x12345
市场规模y3.984.565.045.866.36
(1)由上表数据可知,可用函数模型拟合yx的关系,请建立y关于x的回归方程(的值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物与不在品牌官方直播间购物的人数之比为4:1,按照分层抽样从这两类用户中抽取5人,再从这5人中随机抽取2人,求这2人全是选择在品牌官方直播间购物用户的概率.
参考数据:,其中.
参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计公式分别为.
2022-04-24更新 | 1880次组卷 | 8卷引用:重庆市2023届高三下学期3月月度质量检测数学试题
3 . 2021年某公司为了提升一项产品的竞争力和市场占有率,对该项产品进行了科技创新和市场开发,经过一段时间的运营后,统计得到xy之间的五组数据如下表:

x

1

2

3

4

5

y

9

11

14

26

20

其中,x(单位:百万元)是科技创新和市场开发的总投入,y(单位:百万元)是科技创新和市场开发后的收益.
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:

满意

不满意

总计

45

10

55

25

20

45

总计

70

30

100

是否有99%的把握认为消费者满意程度与性别有关?
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①
,其中.
临界值表:

0.100

0.050

0.025

0.010

0.001

2.706

3.841

5.024

6.635

10.828

参考数据:.
2022-04-17更新 | 966次组卷 | 1卷引用:重庆市2022届高三学业质量调研抽测(第二次)数学试题
4 . 规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:

1

2

3

4

5

232

98

60

40

20

关于的回归方程,并预测成功的总人数(精确到1);
(3)证明:
附:经验回归方程系数:
参考数据:(其中).
2022-04-08更新 | 6758次组卷 | 16卷引用:重庆市缙云教育联盟2022届高三第二次诊断性检测数学试题
5 . 新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.
日期代码x12345678
累计确诊人数y481631517197122
为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量xy的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,其中.

(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?(结果保留整数)
附:回归直线的斜率和截距的最小二乘估计公式分别为:.
2022-05-23更新 | 2069次组卷 | 21卷引用:重庆市南开中学2019-2020学年高三下学期(线上测试)期中数学(理)试题
6 . 某电器企业统计了近年的年利润额(千万元)与投入的年广告费用(十万元)的相关数据,散点图如图,对数据作出如下处理:令,得到相关数据如表所示:

15

15


(1)从①;②;③三个函数中选择一个作为年广告费用和年利润额的回归类型,判断哪个类型符合,不必说明理由;
(2)根据(1)中选择的回归类型,求出的回归方程;
(3)预计要使年利润额突破亿,下一年应至少投入多少广告费用?结果保留到万元
参考数据:
参考公式:回归方程中斜率和截距的最小二乘估计公式分别为
2021-10-15更新 | 3143次组卷 | 15卷引用:重庆市实验中学2022届高三上学期开学考试数学试题
7 . 2021年3月1日,国务院新闻办公室举行新闻发布会,工业和信息化部长肖亚庆先生提出了芯片发展的五项措施,进一步激励国内科技巨头加大了科技研发投入的力度.中华技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入(亿元)与科技升级直接纯收益(亿元)的数据统计如下:

序号

1

2

3

4

5

6

7

8

9

10

11

12

2

3

4

6

8

10

13

21

22

23

24

25

13

22

31

42

50

56

58

68.5

68

67.5

66

66

时,建立了的两个回归模型:模型①:;模型②:;当时,确定满足的线性回归方程为
(1)根据下列表格中的数据,比较当时模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型.

回归模型

模型①

模型②

回归方程

182.4

79.2

(附:刻画回归效果的相关指数
(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,应用(1)的结论,比较科技升级投入17亿元与20亿元时公司实际收益的大小.
(附:线性回归方程的系数关系:
(3)科技升级后,“麒麟”芯片的效率大幅提高,经实际试验得大致服从正态分布.公司对科技升级团队的奖励方案如下:若芯片的效率不超过,不予奖励:若芯片的效率超过,但不超过,每部芯片奖励2元;若芯片的效率超过,每部芯片奖励4元.记为每部芯片获得的奖励,求(精确到0.01).
(附:若随机变量,则
8 . 近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本y(单位:元)与当天揽收的快递件数x(单位:千件)之间的关系,对该网点近5天的每日揽件量(单位:千件)与当日收发一件快递的平均成本(单位;元)(i=1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.
45.160.4152.028300.507
表中.
(1)根据散点图判断,哪一个适宜作为y关于x的回归方程类型?并根据判断结果及表中数据求出y关于x的回归方程;
(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数x(单位:千件)与单件快递的平均价格t(单位;元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:
①预测该网点某天揽收2000件快递可获得的总利润;
②单件快递的平均价格为何值时,该网点一天内收发快递所获利润的预报值最大?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为
2021-06-10更新 | 2220次组卷 | 5卷引用:重庆市2021届高三高考数学第三次联合诊断检测试题
9 . 遵守交通规则,人人有责.“礼让行人”是我国《道路交通安全法》的明文规定,也是全国文明城市测评中的重要内容.《道路交通安全法》第47条明确规定:“机动车行经人行横道时,应当减速行驶,遇行人正在通过人行横道,应当停车让行.机动车行经没有交通信号的道路时,遇行人横过道路,应当避让.否则扣3分罚200元”.下表是2021年1至4月份我市某主干路口监控设备抓拍到的驾驶员不“礼让行人”行为统计数据:

月份

1

2

3

4

违章驾驶员人数

125

105

100

90

(1)请利用所给数据求违章人数与月份之间的回归直线方程,并预测该路口2021年5月不“礼让行人”驾驶员的大约人数(四舍五入);
(2)交警从这4个月内通过该路口的驾驶员中随机抽查50人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到下表:

不礼让行人

礼让行人

驾龄不超过2年

10

20

驾龄2年以上

8

12

能否据此判断有的把握认为“礼让行人”行为与驾龄有关?
参考公式:

0.10

0.05

0.025

0.010

0.005

2.706

3.841

5.024

6.635

7.879

,其中
10 . 为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中).

6

97.90

0.21

60

0.14

14.12

26.13

﹣1.40

(1)利用样本相关系数的知识,判断哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?
(2)根据(1)的结果回答下列问题:
i)建立关于的回归方程;
ii)样本对原点的距离时,金属含量的预报值是多少?
iii)已知该金属在距离原点时的平均开采成本(单位:元)与关系为,根据(2)的结果回答,为何值时,开采成本最大?
附:对于一组数据,其线性相关系数
其回归直线的斜率和截距的最小二乘估计分别为:
共计 平均难度:一般