组卷网 > 章节选题 > 3.1 回归分析的基本思想及其初步应用
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 52 道试题
1 . 为了解高新产业园引进的甲公司前期的经营状况,市场研究人员对该公司2019年下半年连续六个月的利润进行了统计,统计数据列表如下:
月份7月8月9月10月11月12月
月份代码123456
月利润(万元)110130160150200210
(1)请用相关系数说明月利润y(单位:万元)与月份代码x之间的关系的强弱(结果保留两位小数),求y关于x的线性回归方程,并预测该公司2020年1月份的利润;
(2)甲公司新研制了一款产品,需要采购一批新型材料,已知生产新型材料的乙企业对AB两种型号各100件新型材料进行模拟测试,统计两种新型材料使用寿命频数如下表所示:
使用寿命


材料类型
1个月2个月3个月4个月总计
A15403510100
B10304020100
现有采购成本分别为10万元/件和12万元/件的AB两种型号的新型材料可供选择,按规定每种新型材料最多可使用4个月,不同类型的新型材料损坏的时间各不相同,经甲公司测算,平均每件新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设每件新型材料的使用寿命都是整数月,且以频率估计每件新型材料使用寿命的概率,如果你是甲公司的负责人,以每件新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?
参考公式:相关系数
回归直线方程为,其中.
参考数据:.
2020-06-25更新 | 886次组卷 | 4卷引用:福建省南平市2020届高三毕业班第三次综合质量检测数学(理)试题
2 . 千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛传知;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则.使得“千里眼”“顺风耳”变为现实……此时此刻,5G的到来即将给人们的生活带来颠覆性的变革,“5G领先”一方面是源于我国顶层设计的宏观布局,另一方面则来自政府高度重视、企业积极抢滩、企业层面的科技创新能力和先发优势.某科技创新公司基于领先技术的支持,丰富的移动互联网应用等明显优势,随着技术的不断完善,该公司的5G经济收入在短期内逐月攀升,业内预测,该创新公司在第1个月至第7个月的5G经济收入y(单位:百万元)关于月份x的数据如下表:
时间(月份)1234567
收入(百万元)611213466101196

根据以上数据绘制散点图:

(1)为了更充分运用大数据、人工智能、5G等技术,公司需要派出员工实地考察检测产品性能和使用状况,公司领导要从报名的五名科技人员ABCDE中随机抽取3个人前往,则AB同时被抽到的概率为多少?
(2)根据散点图判断,abcd均为大于零的常数)哪一个适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)并根据你判断结果及表中的数据,求出y关于x的回归方程;
(3)请你预测该公司8月份的5G经济收入.
参考数据:
46210.78271150.122.823.47

其中设
参考公式:
对于一组具有线性相关系的数据,2,3,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为:.
2020-06-25更新 | 817次组卷 | 1卷引用:福建省南平市2020届高三毕业班第三次综合质量检测数学(文)试题
3 . 近几年,电商行业的蓬勃发展带动了快递业的迅速增长,快递公司揽收价格一般是采用“首重+续重”的计价方式.首重是指最低的计费重量,续重是指超过首重部分的计费重量,不满一公斤按一公斤计费.某快递网点将快件的揽收价格定为首重(不超过一公斤)8元,续重2元/公斤(例如,若一个快件的重量是0.6公斤,按8元计费;若一个快件的重量是1.4公斤,按元计费).根据历史数据,得到该网点揽收快件重量的频率分布直方图如下图所示

(1)根据样本估计总体的思想,将频率视作概率,求该网点揽收快件的平均价格;
(2)为了获得更大的利润,该网点对“一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数(单位:百件)之间的关系”进行调查研究,得到相关数据如下表:
每天揽收快递件数(百件)23458
每件快递的平均成本(元)5.64.84.44.34.1
根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个回归方程:
方程甲:,方程乙:.
①为了评价两种模型的拟合效果,根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数),分别计算模型甲与模型乙的残差平方和,并依此判断哪个模型的拟合效果更好(备注:称为相应于点的残差,残差平方和
每天揽收快递件数/百件23458
每天快递的平均成本/元5.64.84.44.34.1
模型甲预报值5.25.04.8
残差0.20.4
模型乙预报值5.54.84.5
预报值00.1
②预计该网点今年6月25日(端午节)一天可以揽收1000件快递,试根据①中确定的拟合效果较好的回归模型估计该网点当天的总利润(总利润=(平均价格-平均成本)×总件数).
4 . 近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的数据,进行回归分析,得到两个回归模型:模型①:,模型②: ,对以上两个回归方程进行残差分析,得到下表:
种植面积(亩)234579
每亩种植管理成本(百元)252421221614
模型①估计值25.2723.6221.9717.0213.72
残差-0.270.38-0.97-1.020.28
模型②26.8420.1718.8317.3116.46
-1.840.833.17-1.31-2.46

(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;
(2)视残差的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求回归方程.
附:
2020-06-20更新 | 779次组卷 | 9卷引用:福建省厦门市2020届高三毕业班6月质量检查数学(理科)数学试题
5 . 某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:
x12345678
y1126144.53530.5282524
根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合,已求得:用指数函数模型拟合的回归方程为的相关系数,(其中);

(1)用反比例函数模型求关于的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本.
参考数据:
参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为:,相关系数.
2020-05-18更新 | 450次组卷 | 3卷引用:福建省福州市2019-2020学年高三5月调研卷文科数学试题
6 . 如表是某位文科生连续次月考的历史、政治的成绩,结果如下:

月份

9

10

11

12

1

历史(分)

79

81

83

85

87

政治(分)

77

79

79

82

83

(1)求该生次月考历史成绩的平均分和政治成绩的平均数;
(2)一般来说,学生的历史成绩与政治成绩有较强的线性相关关系,根据上表提供的数据,求两个变量 的线性回归方程.
参考公式:表示样本均值.
7 . 基于移动互联技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验,某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司最近六个月的市场占有率进行了统计,结果如表:
月份
月份代码x123456
y111316152021
请用相关系数说明能否用线性回归模型拟合y与月份代码x之间的关系,如果能,请计算出y关于x的线性回归方程,并预测该公司2018年12月的市场占有率如果不能,请说明理由.
根据调研数据,公司决定再采购一批单车扩大市场,现有采购成本分别为1000元辆和800元辆的AB两款车型,报废年限各不相同考虑公司的经济效益,该公司决定对两款单车进行科学模拟测试,得到两款单车使用寿命频数表如表:
报废年限
车型
1年2年3年4年总计
A10304020100
B15403510100
经测算,平均每辆单车每年可以为公司带来收入500元不考虑除采购成本以外的其他成本,假设每辆单车的使用寿命都是整数年,用频率估计每辆车使用寿命的概率,分别以这100辆单车所产生的平均利润作为决策依据,如果你是该公司的负责人,会选择采购哪款车型?
参考数据:
参考公式:相关系数
回归直线方程中的斜率和截距的最小二乘估计公式分别为:
8 . 2019年9月24日国家统计局在庆祝中华人民共和国成立70周年活动新闻中心举办新闻发布会指出,1952年~2018年,我国GDP查679.1亿元跃升至90.03万亿元,实际增长174倍;人均GDP从119元提高到6.46万元,实际增长70倍.全国各族人民,砥砺奋进,顽强拼搏,实现了经济社会的跨越式发展.如图是全国2010年至2018年GDP总量(万亿元)的折线图.注:年份代码1~9分别对应年份2010~2018.

(1)由折线图看出,可用线性回归模型拟合与年份代码的关系,请用相关系数加以说明;
(2)建立关于的回归方程(系数精确到0.01),并预测2021年全国GDP的总量.
附注:参考数据:.
参考公式:相关系数
回归方程中斜率和截距的最小二乘法估计公式分别为.
2020-03-16更新 | 346次组卷 | 3卷引用:2020届福建省福清市高三下学期线上教学质量检测理科数学试题
9 . 低碳经济时代,文化和旅游两大产业逐渐成为我国优先发展的“绿色朝阳产业”.为了解某市的旅游业发展情况,某研究机构对该市2019年游客的消费情况进行随机调查,得到频数分布表及频率分布直方图.
旅游消费(千元)
频数(人)1060

(1)由图表中数据,求的值及游客人均消费估计值(同一组中的数据以这组数据所在区间中点的值为代表)
(2)该机构利用最小二乘法得到2013~2017年该市的年旅游人次(千万人次)与年份代码的线性回归模型:.
注:年份代码1~5分别对应年份2013~2017
①试求2013~2017年的年旅游人次的平均值;
②据统计,2018年该市的年旅游人次为9千万人次.建立2013~2018年该市年旅游人次(千万人次)与年份代码的线性回归方程,并估计2019年该市的年旅游收入.
注:年旅游收入=年旅游人次×人均消费
参考数据:.参考公式:.
2020-03-15更新 | 389次组卷 | 1卷引用:2020届福建省厦门市高三上学期期末质量检测数学文科试题
10 . 噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解强度(单位:分贝)与声音能量(单位:)之间的关系,将测量得到的声音强度和声音能量数据作了初步处理,得到下面的散点图及一些统计量的值.
45.7-11.50.515.1
表中
(1)根据表中数据,求声音强度关于声音能量的回归方程
(2)当声音强度大于60分贝时属于噪音,会产生噪声污染,城市中某点共受到两个声源的影响,这两个声源的声音能量分别是,且.已知点的声音能量等于声音能量之和.请根据(1)中的回归方程,判断点是否受到噪声污染的干扰,并说明理由.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:
2020-03-15更新 | 283次组卷 | 1卷引用:福建省福州第一中学2020届高三下学期开学质检数学(理)试题
共计 平均难度:一般