组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 11 道试题
1 . 多年来,清华大学电子工程系黄翔东教授团队致力于光谱成像芯片的研究,2022年6月研制出国际首款实时超光谱成像芯片,相比已有光谱检测技术,实现了从单点光谱仪到超光谱成像芯片的跨越,为制定下一年的研发投入计划,该研发团队为需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量x,和年销售额,的数据(,2,,12),该团队建立了两个函数模型:①,其中均为常数,e为自然对数的底数,经对历史数据的初步处理,得到散点图如图,令,计算得如下数据:
206677020014
460312500021500
(1)设的相关系数为的相关系数为,请从相关系数的角度,选择一个拟合程度更好的模型;
(2)(i)根据(1)的选择及表中数据,建立关于的回归方程(系数精确到0.01);
(ii)若下一年销售额需达到80亿元,预测下一年的研发资金投入量是多少亿元?
附:①相关系数,回归直线中斜率和截距的最小二乘估计公式分别为:
②参考数据:.
2022-11-19更新 | 2286次组卷 | 7卷引用:重庆市第八中学校2023届高三上学期适应性月考(三)数学试题
2 . 重庆位于北半球亚热带内陆地区,其气候特征恰如几句俗谚:春早气温不稳定,夏长酷热多伏旱,秋凉绵绵阴雨天,冬暖少雪云雾多.尤其是10月份,昼夜温差很大,某数学兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了2021年10月某六天的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期第一日第三日第五日第四日第二日第六日
昼夜温差(℃)47891214
就诊人数(个)
其中:,2,3,4,5,6,参考数据:
(1)根据散点图可以认为之间存在线性相关关系,且相关系数,请用最小二乘法求出线性回归方程用分数表示);
(2)分析数据发现:第六日就诊人数,第一日就诊患者中有3个小孩,其他患者全是大人,现随机的从第一日所有就诊患者中选出2人,若2人中至少有一个小孩的概率为
①求的值;
②若,求的值(只写结果,不要求过程).
(参考公式:
2022-10-16更新 | 865次组卷 | 3卷引用:重庆市南开中学2023届高三上学期第二次质量检测数学试题
3 . 近年来,美国方面滥用国家力量,不择手段打压中国高科技企业,随着贸易战的不断升级,中国某科技公司为了不让外国“卡脖子”,决定在企业预算中减少宣传广告预算,增加对技术研究和人才培养的投入,下表是的连续7年研发投入x和公司年利润y的观测数据,根据绘制的散点图决定用回归模型:来进行拟合.
表I
研发投入(亿元)20222527293135
年利润(亿元)711212465114325
表II(注:表中
18956716278106
3040
(1)请借助表II中的数据,求出回归模型的方程;(精确到0.01)
(2)试求研发投入为20亿元时年利润的残差.
参考数据:,附:回归方程中,残差
2022-08-12更新 | 1160次组卷 | 8卷引用:重庆市南开中学校2023届高三上学期7月考试数学试题
4 . 为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2021年种植的一批试验紫甘薯在温度升高时6组死亡的株数.
温度/℃212324272930
死亡数/株61120275777
经计算,
,其中分别为试验数据中的温度和死亡株数,.
(1)若用一元线性回归模型,求关于的经验回归方程
(2)若用非线性回归模型求得关于的非线性经验回归方程,且相关指数为.
(ⅰ)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好;
(ii)用拟合效果好的模型预测温度为35℃时该批紫甘薯的死亡株数(结果取整数).
附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为:相关指数为:.
智能选题,一键自动生成优质试卷~
5 . 某公众号根据统计局统计公报提供的数据,对我国2015—2021年的国内生产总值GDP进行统计研究,做出如下2015—2021年GDPGDP实际增长率的统计图表.通过统计数据可以发现,GDP呈现逐年递增趋势.2020年,GDP增长率出现较明显降幅,但GDP却首次突破100万亿.现统计人员选择线性回归模型,对年份代码x和年度实际GDP增长率进行回归分析.
年份2015年2016年2017年2018年2019年2020年2021年
年度GDP(亿元)688858.2746395.1832035.9919281.1986515.21015986.21143669.7
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1

(1)用第1到第7年的数据得到年度实际GDP增长率关于年份代码x的回归方程近似为:,对该回归方程进行残差分析,得到下表,视残差的绝对值超过1.5的数据为异常数据.
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1
GDP增长率估计值6.986.506.266.025.54
残差0.020.400.74-0.022.56
将以上表格补充完整,指出GDP增长率出现异常数据的年份及异常现象,并根据所学统计学知识,结合生活实际,推测GDP增长率出现异常的可能原因;
(2)剔除(1)中的异常数据,用最小二乘法求出回归方程:,并据此预测数据异常年份的GDP增长率.
附:
2022-05-06更新 | 753次组卷 | 3卷引用:重庆市南开中学校2022届高三第九次质量检测数学试题
6 . 身高体重指数(BMI)的大小直接关系到人的健康状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测量其身高、体重的数据如下表.

学生编号

1

2

3

4

5

身高x/cm

l65

170

175

170

170

体重y/kg

58

67

67

65

63

(1)求体重关于身高的线性回归方程,并预测身高为180cm的同学的体重;
(2)试分析学生的体重差异约有多少是由身高引起的?(注:结果保留两位小数)参考公式:线性回归方程中,,其中为样本平均值,.
2022-05-03更新 | 1341次组卷 | 7卷引用:重庆市第八中学校2022届高三下学期高考适应性强化训练(四)数学试题
7 . 某省为了坚决打赢脱贫攻坚战,在100个贫困村中,用简单随机抽样的方法抽取15个进行脱贫验收调查,调查得到的样本数据,其中分别表示第i个贫困村中贫困户的年平均收入(单位:万元)和产业扶贫资金投入数量(单位:万元),并计算得到
(1)试估计该省贫困村的贫困户年平均收入;
(2)根据样本数据,求该省贫困村中贫困户年平均收入与产业扶贫资金投入的相关系数(精确到0.01);
(3)根据现有统计资料,各贫困村产业扶贫资金投入差异很大.为了确保完成脱贫攻坚任务,准确地进行脱贫验收,请给出一种你认为更合理的抽样方法,并说明理由.
参考公式:
2022-09-07更新 | 1539次组卷 | 13卷引用:重庆市育才中学2022届高三二诊模拟(二)数学试题
8 . 2021年某公司为了提升一项产品的竞争力和市场占有率,对该项产品进行了科技创新和市场开发,经过一段时间的运营后,统计得到xy之间的五组数据如下表:

x

1

2

3

4

5

y

9

11

14

26

20

其中,x(单位:百万元)是科技创新和市场开发的总投入,y(单位:百万元)是科技创新和市场开发后的收益.
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:

满意

不满意

总计

45

10

55

25

20

45

总计

70

30

100

是否有99%的把握认为消费者满意程度与性别有关?
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①
,其中.
临界值表:

0.100

0.050

0.025

0.010

0.001

2.706

3.841

5.024

6.635

10.828

参考数据:.
2022-04-17更新 | 966次组卷 | 1卷引用:重庆市2022届高三学业质量调研抽测(第二次)数学试题
9 . 规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:

1

2

3

4

5

232

98

60

40

20

关于的回归方程,并预测成功的总人数(精确到1);
(3)证明:
附:经验回归方程系数:
参考数据:(其中).
2022-04-08更新 | 6757次组卷 | 16卷引用:重庆市缙云教育联盟2022届高三第二次诊断性检测数学试题
解答题-应用题 | 较难(0.4) |
名校
10 . 某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每批产品的非原料总成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:

1

2

3

4

5

6

7

6

11

21

34

66

101

196

根据以上数据,绘制如图所示的散点图.

观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断,均为大于零的常数)哪一个适宜作为非原料总成本关于生产该产品的数量的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表1中的数据,建立关于的回归方程;
(3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多能生产多少千件产品.
参考数据:

62.14

1.54

2535

50.12

3.47

其中
参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计公式分别为
2020-07-23更新 | 2402次组卷 | 12卷引用:重庆市育才中学校2023届高三上学期开学考试数学试题
共计 平均难度:一般