组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 71 道试题
1 . 近年来,我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数(,缩写)来衡量人体胖瘦程度以及是否健康,其计算公式是中国成人的数值标准为:为偏瘦;为正常;为偏胖;为肥胖.为了解某公司员工的身体质量指数,研究人员从公司员工体检数据中,抽取了8名员工(编号)的身高和体重数据,并计算得到他们的值(精确到0.1)如下表:
编号12345678
(近似值)22.323.228.320.323.523.725.516.6
(1)现从这8名员工中选取2人进行复检,记抽取到值为“正常”员工的人数为X,求X的分布列及数学期望.
(2)某调查机构分析发现公司员工的身高和体重之间有较强的线性相关关系,调查员甲对这8人的体检数据进行分析,计算得出该组数据的线性回归方程为,且根据回归方程预报一名身高为的员工体重为,计算得到的其他数据如下:
(i)求的值及抽取8人体重数据的平均值
(ii)调查员乙代替甲继续数据处理时,发现编号为8的员工体重数据有误,应增加,其身高数据无误,请你根据调查员乙更正的数据重新计算线性回归方程,并据此预报一名身高为的员工的体重.
附:对于一组数据,…,,其回归直线的斜率和截距的最小二乘法估计分别为:.
2021-03-25更新 | 128次组卷 | 1卷引用:湖南省新高考2021届高三下学期3月联考(一) 数学试题
2 . 某创业者计划在南山旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以入住天数的频率作为各自的“入住率”,收费标准x与入住率y的散点图如图.
x100150200300450
y9065453020

(1)若从以上五家“农家乐”中随机抽取两家深入调查,记为“入住率”超过的农家乐的个数,求的分布列;
(2)令,由散点图判断哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;(的结果精确到
(3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销售额Q最大?(100天销售额入住率收费标准x
参考数据:
2021-09-17更新 | 915次组卷 | 9卷引用:湖南省长沙市第一中学2020届高三第一次月考数学(理)试题
3 . 月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在日至日累计确诊人数如下表:

日期(月)

人数(人)

由上述表格得到如散点图(日为封城第一天).

(1)根据散点图判断均为大于的常数)哪一个适宜作为累计确诊人数与封城后的天数的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;
(2)随着更多的医护人员投入疫情的研究,日武汉影像科医生提出存在大量核酸检测呈阴性(阳性则确诊),但观其肺片具有明显病变,这一提议引起了广泛的关注,日武汉疾控中心接收了份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为,核酸试剂能把阳性样本检测出阳性结果的概率是(核酸检测存在阳性样本检测不出来的情况,但不会把阴性检测呈阳性),求这份样本中检测呈阳性的份数的期望.
参考数据:

其中,参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计公式分别为.
4 . 2019年,中国的国内生产总值(GDP)已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没.实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料本及非原料成本组成,每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:

x

1

2

3

4

5

6

7

8

y

112

61

44.5

35

30.5

28

25

24


根据以上数据,绘制了如下的散点图.

现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合.为此变换如下:令,则,即yu满足线性关系;令,则,即vx也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为vx的相关系数,其他参考数据如表(其中):

183.4

0.34

0.115

1.53

360

22385.5

61.4

0.135

4.6

3.7


(1)求指数函数模型和反比例函数模型中y关于x的回归方程;
(2)试计算yu的相关系数,并用相关系数判断选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?
参考公式:
对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,相关系数.
2020-08-06更新 | 306次组卷 | 2卷引用:湖南省长沙市雅礼中学2020届高三下学期高考模拟试卷(二)数学(文)试题
5 . 2019年,中国的国内生产总值()已经达到约100万亿元人民币,位居世界第二,这其中实体经济的贡献功不可没实体经济组织一般按照市场化原则运行,某生产企业一种产品的成本由原料成本及非原料成本组成,每件产品的非原料成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:
12345678
1126144.53530.5282524

根据以上数据,绘制了如下的散点图.

现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合.为此变换如下:令,则,即满足线性关系;令,则,即也满足线性关系.这样就可以使用最小二乘法求得非线性的回归方程.已求得用指数函数模型拟合的回归方程为的相关系数,其他参考数据如表(其中).
183.40.340.1151.5336022385.561.40.1354.63.7

(1)求指数函数模型和反比例函数模型中关于的回归方程;
(2)试计算的相关系数,并用相关系数判断:选择反比例函数和指数函数两个模型中的哪一个拟合效果更好(计算精确到0.01)?
(3)根据(2)小题的选择结果,该企业采取订单生产模式(即根据订单数量进行生产,产品全部售出).根据市场调研数据,该产品单价定为100元时得到签订订单的情况如表:
订单数(千件)1234567891011
概率

已知每件产品的原料成本为10元,试估算企业的利润是多少?(精确到1千元)
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,相关系数.
2020-08-06更新 | 274次组卷 | 1卷引用:湖南师范大学附属中学2020届高三下学期5月模拟考试数学(文)试题
6 . 某新兴环保公司为了确定新开发的产品下一季度的营销计划,需了解月宣传费x(单位:千元)对月销售量y(单位:t)和月利润z(单位:千元)的影响,收集了2019年12月至2020年5月共6个月的月宣传费和月销售量)的数据如下表:
月份1212345
宣传费x1357911
月销售量y14.2120.3131.831.1837.8344.67

现分别用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:(注残差在数理统计中是指实际观察值与估计值(拟合值)之间的差.)
6301284.24286

(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除,剔除异常数据后求出(1)中所选模型的回归方程;
(3)已知该产品的月利润zxy的关系为,根据(2)的结果回答下列问题:
i)若月宣传费时,该模型下月销售量y的预报值为多少?
ii)当月宣传费x为何值时,月利润z的预报值最大?
附:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为
2020-08-06更新 | 384次组卷 | 3卷引用:湖南省衡阳市2020届高三下学期三模数学(理)试题
7 . 某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人.萌宠机器人语音功能让它就像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝的使用习惯,很快找到宝宝想听的内容.同时提供快乐儿歌、国学经典、启蒙英语等早期教育内容,且云端内容可以持续更新.萌宠机器人一投放市场就受到了很多家长欢迎.为了更好地服务广大家长,该公司研究部门从流水线上随机抽取100件萌宠机器人(以下简称产品),统计其性能指数并绘制频率分布直方图(如图1):

产品的性能指数在的适合托班幼儿使用(简称A类产品),在的适合小班和中班幼儿使用(简称B类产品),在的适合大班幼儿使用(简称C类产品),ABC,三类产品的销售利润分别为每件1.5,3.5,5.5(单位:元).以这100件产品的性能指数位于各区间的频率代替产品的性能指数位于该区间的概率.
(1)求每件产品的平均销售利润;
(2)该公司为了解年营销费用(单位:万元)对年销售量(单位:万件)的影响,对近5年的年营销费用,和年销售量数据做了初步处理,得到的散点图(如图2)及一些统计量的值.
16.3024.870.411.64

表中.
根据散点图判断,可以作为年销售量(万件)关于年营销费用(万元)的回归方程.
i)建立关于的回归方程;
ii)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?
(收益=销售利润-营销费用,取).
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
2020-07-24更新 | 4018次组卷 | 13卷引用:湖南省株洲市2021届高三下学期教学质量统一检测(二)数学试题
8 . 近年来.我国肥胖人群的规模急速增长,肥胖人群有很大的心血管安全隐患.目前,国际上常用身体质量指数来衡量人体胖瘦程度以及是否健康,其计算公式是.中国成人的数值标准为:为偏瘦;为正常;为偏胖;为肥胖.为了解某公司员工的身体质量指数,研究人员从公司员工体检数据中,抽取了8名员工(编号的身高和体重数据,并计算得到他们的值(精确到如表:

编号

1

2

3

4

5

6

7

8

身高

164

176

165

163

170

172

168

182

体重

60

72

77

54

72

55

(近似值)

22.3

23.2

28.3

20.3

23.5

23.7

25.5

16.6


(1)现从这8名员工中选取3人进行复检,记抽取到值为“正常”员工的人数为.求的分布列及数学期望.
(2)某调查机构分析发现公司员工的身高和体重之间有较强的线性相关关系,在编号为6的体检数据丢失之前调查员甲已进行相关的数据分析,并计算得出该组数据的线性回归方程为,且根据回归方程预估一名身高为的员工体重为.计算得到的其他数据如下
(i)求的值及表格中8名员工体重的平均值
(ii)在数据处理时,调查员乙发现编号为8的员工体重数据有误,应为,身高数据无误.请你根据调查员乙更正的数据重新计算线性回归方程,并据此预估一名身高为的员工的体重.
(附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为:
9 . 当前,全球贸易格局发生重大变化,随着中美贸易战的不断升级,让越来越多的中国科技企业开始意识到自主创新的重要性,大大加强科技研发投入的力度,形成掌控高新尖端核心技术及其市场的能力.某企业为确定下一年对某产品进行科技升级的研发费用,需了解该产品年研发费用(单位:千万元)对年销售量(单位:千万件)和年利润(单位:千万元)的影响.根据市场调研与模拟,对收集的数据进行初步处理,得到散点图及一些统计量的值如下:

30.5

15

15

46.5


表中.
(1)根据散点图判断,哪一个更适合作为年销售量关于年研发费用的回归方程类型(给出判断即可,不必说明理由),并根据判断结果及表中数据,建立关于的回归方程;
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
(2)已知年利润的关系为(其中为自然对数的底数),要使企业下一年的年利润最大,预计下一年应投入多少研发费用?
(3)科技升级后,该产品的效率大幅提高,经试验统计得大致服从正态分布.企业对科技升级团队的奖励方案如下:若不超过,不予奖励;若超过,但不超过,每件产品奖励2元;若超过,每件产品奖励4元.记为每件产品获得的奖励,求(精确到0.01).
附:若随机变量,则.
解答题-问答题 | 适中(0.65) |
真题 名校
10 . 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xiyi)(i=1,2,…,20),其中xiyi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xiyi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.

附:相关系数r=≈1.414.

2020-07-08更新 | 46873次组卷 | 131卷引用:湖南省邵阳市邵东市第一中学2021-2022学年高三上学期第一次月考数学试题
共计 平均难度:一般