组卷网 > 章节选题 > 3.1 回归分析的基本思想及其初步应用
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 27 道试题
1 . 某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:
x12345678
y56.53122.7517.815.9514.51312.5
根据以上数据绘制了散点图观察散点图,两个变量间关系考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合.已求得用指数函数模型拟合的回归方程为x的相关系数.

(1)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.001),并用其估计产量为10千件时每件产品的非原料成本;
(3)根据企业长期研究表明,非原料成本y服从正态分布,用样本平均数作为的估计值,用样本标准差s作为的估计值,若非原料成本y之外,说明该成本异常,并称落在之外的成本为异样成本,此时需寻找出现异样成本的原因.利用估计值判断上述非原料成本数据是否需要寻找出现异样成本的原因?
参考数据(其中):
0.340.1151.531845777.55593.0630.70513.9
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,相关系数.
2022-01-17更新 | 2809次组卷 | 12卷引用:福建省厦门双十中学2023届高三热身考试数学试题
2 . 近年来,美国方面泛化国家安全概念,滥用国家力量,不择手段打压中国高科技企业.随着贸易战的不断升级,我国内越来越多的科技巨头加大了科技研发投入的力量.为了不受制于人,我国某新能源产业公司拟对智能制造行业的“工业机器人”进行科技改造和升级,根据市场调研与模拟,得到科技升级投入x(亿元)与科技升级直接受益y(亿元)的数据统计如表:
序号123456789101112
x2346810132122232425
y1322314250565868.56867.56666
时,建立了yx的两个回归模型;
模型①:;模型②:
时,确定yx满足的线性回归方程为
(1)根据下列表格中的数据,比较当时模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对“工业机器人”科技升级的投入为17亿元时的直接收益.
回归模型模型①模型②
回归方程
182.479.2
(附:刻画回归效果的相关指数
(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,根据我国的智能制造专项政策,国家科技、工信等部门给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.
3 . 某沙漠地区经过治理,生态系统得到改善.为调查该地区植物覆盖面积(单位:公顷)和某种野生动物的数量的关系,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据i=1,2,…,20),其中xiyi分别表示第i个样区的植物覆盖面积和这种野生动物的数量,并计算得
(1)求样本i=1,2,…,20)的相关系数(精确到0.01),并用相关系数说明各样区的这种野生动物的数量与植物覆盖面积的相关性.
(2)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数
2020-10-09更新 | 519次组卷 | 4卷引用:福建省福州市2021届高三数学10月调研A卷试题
4 . “爱国,是人世间最深层、最持久的情感,是一个人立德之源、立功之本.”在中华民族几千年绵延发展的历史长河中,爱国主义始终是激昂的主旋律.爱国汽车公司拟对“东方红”款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x(亿元)与科技改造直接收益y(亿元)的数据统计如下:
2346810132122232425
1322314250565868.56867.56666
时,建立了yx的两个回归模型:模型①:;模型②:;当时,确定yx满足的线性回归方程为:.
(1)根据下列表格中的数据,比较当时模型①、②的相关指数,并选择拟合精度更高、更可靠的模型,预测对“东方红”款汽车发动机科技改造的投入为17亿元时的直接收益.

回归模型

模型①

模型②

回归方程


(附:刻画回归效果的相关指数.)
(2)为鼓励科技创新,当科技改造的投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小;
(附:用最小二乘法求线性回归方程的系数公式
(3)科技改造后,“东方红”款汽车发动机的热效率X大幅提高,X服从正态分布,公司对科技改造团队的奖励方案如下:若发动机的热效率不超过,不予奖励;若发动机的热效率超过但不超过,每台发动机奖励2万元;若发动机的热效率超过,每台发动机奖励5万元.求每台发动机获得奖励的数学期望.
(附:随机变量服从正态分布,则.)
5 . 某芯片公司为了制定下一年的某种产品研发投入计划,需要了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)和年收益(单位:亿元)的影响,为此收集了近12年的年研发资金投入量和年销售额的数据并对这些数据作了初步处理,得到了下面的散点图及一些统计量的值.为了进一步了解年研发资金投入量对年销售额的影响,公司三位员工查阅大量资料,对历史数据进行对比分析,分别提出了三个回归方程模型:①;②;③.
4066770250200
3.600.499.8065.0030.00

表中.
(1)根据散点图及表中数据,请分别选用两个比较恰当的回归方程模型,建立关于的回归方程;
(2)①根据(1)的回归方程模型,从数据相关性的角度考虑,判断哪一个更适宜作为年销售额关于年研发资金投入量的回归方程?并说明理由;
②已知这种产品的年收益服正态分布,那么这种产品的收益超过54.31亿元(含54.31亿元)的概率为多少?
附:①最小二乘估计以及相关系数公式:
②若,则有
③参考数据:.
6 . 为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并做出了散点图,
   
发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型①与模型;②作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃20222426283032
产卵数y/个610212464113322
4004845766767849001024
1.792.303.043.184.164.735.77

26692803.57
1157.540.430.320.00012

其中.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.
(1)根据表中数据,模型①、②的相关指数计算分别为,请根据相关指数判断哪个模型的拟合效果更好.
(2)根据(1)中的判断,在拟合效果更好的模型下求y关于x的回归方程;并估计温度为30℃时的产卵数.(与估计值均精确到小数点后两位)
(参考数据:
2020-07-23更新 | 1271次组卷 | 4卷引用:福建省厦门市第一中学2020届高三最后一模数学(文)试题
7 . 网购已成为当今消费者喜欢的购物方式.某机构对ABCD四家同类运动服装网店的关注人数 x(千人)与其商品销售件数 y(百件)进行统计对比,得到如下表格:

由散点图知,可以用回归直线 来近似刻画它们之间的关系.
参考公式:
(1)求 yx的回归直线方程;
(2)在(1)的回归模型中,请用说明销售件数的差异有多大程度是由关注人数引起的?(精确到
2020-07-02更新 | 324次组卷 | 3卷引用:福建省厦门市湖滨中学2020届高三下学期测试数学(文)试题
8 . 为了解高新产业园引进的甲公司前期的经营状况,市场研究人员对该公司2019年下半年连续六个月的利润进行了统计,统计数据列表如下:
月份7月8月9月10月11月12月
月份代码123456
月利润(万元)110130160150200210
(1)请用相关系数说明月利润y(单位:万元)与月份代码x之间的关系的强弱(结果保留两位小数),求y关于x的线性回归方程,并预测该公司2020年1月份的利润;
(2)甲公司新研制了一款产品,需要采购一批新型材料,已知生产新型材料的乙企业对AB两种型号各100件新型材料进行模拟测试,统计两种新型材料使用寿命频数如下表所示:
使用寿命


材料类型
1个月2个月3个月4个月总计
A15403510100
B10304020100
现有采购成本分别为10万元/件和12万元/件的AB两种型号的新型材料可供选择,按规定每种新型材料最多可使用4个月,不同类型的新型材料损坏的时间各不相同,经甲公司测算,平均每件新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设每件新型材料的使用寿命都是整数月,且以频率估计每件新型材料使用寿命的概率,如果你是甲公司的负责人,以每件新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?
参考公式:相关系数
回归直线方程为,其中.
参考数据:.
2020-06-25更新 | 886次组卷 | 4卷引用:福建省南平市2020届高三毕业班第三次综合质量检测数学(理)试题
9 . 千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛传知;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则.使得“千里眼”“顺风耳”变为现实……此时此刻,5G的到来即将给人们的生活带来颠覆性的变革,“5G领先”一方面是源于我国顶层设计的宏观布局,另一方面则来自政府高度重视、企业积极抢滩、企业层面的科技创新能力和先发优势.某科技创新公司基于领先技术的支持,丰富的移动互联网应用等明显优势,随着技术的不断完善,该公司的5G经济收入在短期内逐月攀升,业内预测,该创新公司在第1个月至第7个月的5G经济收入y(单位:百万元)关于月份x的数据如下表:
时间(月份)1234567
收入(百万元)611213466101196

根据以上数据绘制散点图:

(1)为了更充分运用大数据、人工智能、5G等技术,公司需要派出员工实地考察检测产品性能和使用状况,公司领导要从报名的五名科技人员ABCDE中随机抽取3个人前往,则AB同时被抽到的概率为多少?
(2)根据散点图判断,abcd均为大于零的常数)哪一个适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)并根据你判断结果及表中的数据,求出y关于x的回归方程;
(3)请你预测该公司8月份的5G经济收入.
参考数据:
46210.78271150.122.823.47

其中设
参考公式:
对于一组具有线性相关系的数据,2,3,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为:.
2020-06-25更新 | 817次组卷 | 1卷引用:福建省南平市2020届高三毕业班第三次综合质量检测数学(文)试题
10 . 近几年,电商行业的蓬勃发展带动了快递业的迅速增长,快递公司揽收价格一般是采用“首重+续重”的计价方式.首重是指最低的计费重量,续重是指超过首重部分的计费重量,不满一公斤按一公斤计费.某快递网点将快件的揽收价格定为首重(不超过一公斤)8元,续重2元/公斤(例如,若一个快件的重量是0.6公斤,按8元计费;若一个快件的重量是1.4公斤,按元计费).根据历史数据,得到该网点揽收快件重量的频率分布直方图如下图所示

(1)根据样本估计总体的思想,将频率视作概率,求该网点揽收快件的平均价格;
(2)为了获得更大的利润,该网点对“一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数(单位:百件)之间的关系”进行调查研究,得到相关数据如下表:
每天揽收快递件数(百件)23458
每件快递的平均成本(元)5.64.84.44.34.1
根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个回归方程:
方程甲:,方程乙:.
①为了评价两种模型的拟合效果,根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数),分别计算模型甲与模型乙的残差平方和,并依此判断哪个模型的拟合效果更好(备注:称为相应于点的残差,残差平方和
每天揽收快递件数/百件23458
每天快递的平均成本/元5.64.84.44.34.1
模型甲预报值5.25.04.8
残差0.20.4
模型乙预报值5.54.84.5
预报值00.1
②预计该网点今年6月25日(端午节)一天可以揽收1000件快递,试根据①中确定的拟合效果较好的回归模型估计该网点当天的总利润(总利润=(平均价格-平均成本)×总件数).
共计 平均难度:一般