组卷网 > 章节选题 > 3.1 回归分析的基本思想及其初步应用
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 147 道试题
1 . 为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并做出了散点图,
   
发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型①与模型;②作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃20222426283032
产卵数y/个610212464113322
4004845766767849001024
1.792.303.043.184.164.735.77

26692803.57
1157.540.430.320.00012

其中.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.
(1)根据表中数据,模型①、②的相关指数计算分别为,请根据相关指数判断哪个模型的拟合效果更好.
(2)根据(1)中的判断,在拟合效果更好的模型下求y关于x的回归方程;并估计温度为30℃时的产卵数.(与估计值均精确到小数点后两位)
(参考数据:
2020-07-23更新 | 1271次组卷 | 4卷引用:福建省厦门市第一中学2020届高三最后一模数学(文)试题
2 . 有5名学生的数学和化学成绩如下表所示:
学生学科
数学成绩(8776736663
化学成绩(7866716461
(1)如果具有相关关系,求线性回归方程
(2)预测如果某学生数学成绩为79分,他的化学成绩为多少?(结果取整数)
附:
2020-07-14更新 | 159次组卷 | 1卷引用:福建省莆田第七中学2019-2020学年高一6月阶段性考试数学试题
3 . 网购已成为当今消费者喜欢的购物方式.某机构对ABCD四家同类运动服装网店的关注人数 x(千人)与其商品销售件数 y(百件)进行统计对比,得到如下表格:

由散点图知,可以用回归直线 来近似刻画它们之间的关系.
参考公式:
(1)求 yx的回归直线方程;
(2)在(1)的回归模型中,请用说明销售件数的差异有多大程度是由关注人数引起的?(精确到
2020-07-02更新 | 324次组卷 | 3卷引用:福建省厦门市湖滨中学2020届高三下学期测试数学(文)试题
4 . 为了解高新产业园引进的甲公司前期的经营状况,市场研究人员对该公司2019年下半年连续六个月的利润进行了统计,统计数据列表如下:
月份7月8月9月10月11月12月
月份代码123456
月利润(万元)110130160150200210
(1)请用相关系数说明月利润y(单位:万元)与月份代码x之间的关系的强弱(结果保留两位小数),求y关于x的线性回归方程,并预测该公司2020年1月份的利润;
(2)甲公司新研制了一款产品,需要采购一批新型材料,已知生产新型材料的乙企业对AB两种型号各100件新型材料进行模拟测试,统计两种新型材料使用寿命频数如下表所示:
使用寿命


材料类型
1个月2个月3个月4个月总计
A15403510100
B10304020100
现有采购成本分别为10万元/件和12万元/件的AB两种型号的新型材料可供选择,按规定每种新型材料最多可使用4个月,不同类型的新型材料损坏的时间各不相同,经甲公司测算,平均每件新型材料每月可以带来5万元收入,不考虑除采购成本之外的其他成本,假设每件新型材料的使用寿命都是整数月,且以频率估计每件新型材料使用寿命的概率,如果你是甲公司的负责人,以每件新型材料产生利润的期望值为决策依据,你会选择采购哪款新型材料?
参考公式:相关系数
回归直线方程为,其中.
参考数据:.
2020-06-25更新 | 886次组卷 | 4卷引用:福建省南平市2020届高三毕业班第三次综合质量检测数学(理)试题
5 . 千百年来,人们一直在通过不同的方式传递信息.在古代,烽火狼烟、飞鸽传书、快马驿站等通信方式被人们广泛传知;第二次工业革命后,科技的进步带动了电讯事业的发展,电报电话的发明让通信领域发生了翻天覆地的变化;之后,计算机和互联网的出现则.使得“千里眼”“顺风耳”变为现实……此时此刻,5G的到来即将给人们的生活带来颠覆性的变革,“5G领先”一方面是源于我国顶层设计的宏观布局,另一方面则来自政府高度重视、企业积极抢滩、企业层面的科技创新能力和先发优势.某科技创新公司基于领先技术的支持,丰富的移动互联网应用等明显优势,随着技术的不断完善,该公司的5G经济收入在短期内逐月攀升,业内预测,该创新公司在第1个月至第7个月的5G经济收入y(单位:百万元)关于月份x的数据如下表:
时间(月份)1234567
收入(百万元)611213466101196

根据以上数据绘制散点图:

(1)为了更充分运用大数据、人工智能、5G等技术,公司需要派出员工实地考察检测产品性能和使用状况,公司领导要从报名的五名科技人员ABCDE中随机抽取3个人前往,则AB同时被抽到的概率为多少?
(2)根据散点图判断,abcd均为大于零的常数)哪一个适宜作为5G经济收入y关于月份x的回归方程类型?(给出判断即可,不必说明理由)并根据你判断结果及表中的数据,求出y关于x的回归方程;
(3)请你预测该公司8月份的5G经济收入.
参考数据:
46210.78271150.122.823.47

其中设
参考公式:
对于一组具有线性相关系的数据,2,3,…,n),其回归直线的斜率和截距的最小二乘估计公式分别为:.
2020-06-25更新 | 817次组卷 | 1卷引用:福建省南平市2020届高三毕业班第三次综合质量检测数学(文)试题
6 . 近几年,电商行业的蓬勃发展带动了快递业的迅速增长,快递公司揽收价格一般是采用“首重+续重”的计价方式.首重是指最低的计费重量,续重是指超过首重部分的计费重量,不满一公斤按一公斤计费.某快递网点将快件的揽收价格定为首重(不超过一公斤)8元,续重2元/公斤(例如,若一个快件的重量是0.6公斤,按8元计费;若一个快件的重量是1.4公斤,按元计费).根据历史数据,得到该网点揽收快件重量的频率分布直方图如下图所示

(1)根据样本估计总体的思想,将频率视作概率,求该网点揽收快件的平均价格;
(2)为了获得更大的利润,该网点对“一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数(单位:百件)之间的关系”进行调查研究,得到相关数据如下表:
每天揽收快递件数(百件)23458
每件快递的平均成本(元)5.64.84.44.34.1
根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个回归方程:
方程甲:,方程乙:.
①为了评价两种模型的拟合效果,根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数),分别计算模型甲与模型乙的残差平方和,并依此判断哪个模型的拟合效果更好(备注:称为相应于点的残差,残差平方和
每天揽收快递件数/百件23458
每天快递的平均成本/元5.64.84.44.34.1
模型甲预报值5.25.04.8
残差0.20.4
模型乙预报值5.54.84.5
预报值00.1
②预计该网点今年6月25日(端午节)一天可以揽收1000件快递,试根据①中确定的拟合效果较好的回归模型估计该网点当天的总利润(总利润=(平均价格-平均成本)×总件数).
7 . 近年来,政府相关部门引导乡村发展旅游的同时,鼓励农户建设温室大棚种植高品质农作物.为了解某农作物的大棚种植面积对种植管理成本的影响,甲,乙两同学一起收集6家农户的数据,进行回归分析,得到两个回归模型:模型①:,模型②: ,对以上两个回归方程进行残差分析,得到下表:
种植面积(亩)234579
每亩种植管理成本(百元)252421221614
模型①估计值25.2723.6221.9717.0213.72
残差-0.270.38-0.97-1.020.28
模型②26.8420.1718.8317.3116.46
-1.840.833.17-1.31-2.46

(1)将以上表格补充完整,并根据残差平方和判断哪个模型拟合效果更好;
(2)视残差的绝对值超过1.5的数据视为异常数据,针对(1)中拟合效果较好的模型,剔除异常数据后,重新求回归方程.
附:
2020-06-20更新 | 779次组卷 | 9卷引用:福建省厦门市2020届高三毕业班6月质量检查数学(理科)数学试题
8 . 某车间为了规定工时额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下图:若加工时间(小时)与零件个数之间有较好的线性相关关系.
2356
2.5355.5

(1)求加工时间与零件个数的线性回归方程
(2)试预报加工10个零件需要的时间.
附:回归方程系数公式:
9 . 某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本(元)与生产该产品的数量(千件)有关,经统计得到如下数据:
x12345678
y1126144.53530.5282524
根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合,已求得:用指数函数模型拟合的回归方程为的相关系数,(其中);

(1)用反比例函数模型求关于的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本.
参考数据:
参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为:,相关系数.
2020-05-18更新 | 450次组卷 | 3卷引用:福建省福州市2019-2020学年高三5月调研卷文科数学试题
10 . 某省级示范高中高三年级对各科考试的评价指标中,有“难度系数“和“区分度“两个指标中,难度系数,区分度.
(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147,142,137;普通班三人的成绩分别为97,102,113.通过样本估计本次考试的区分度(精确0.01).
(2)如表表格是该校高三年级6次数学考试的统计数据:
难度系数x0.640.710.740.760.770.82
区分度y0.180.230.240.240.220.15

①计算相关系数r,|r|<0.75时,认为相关性弱;|r|≥0.75时,认为相关性强.通过计算说明,能否利用线性回归模型描述yx的关系(精确到0.01).
ti=|xi﹣0.74|(i=1,2,…,6),求出y关于t的线性回归方程,并预测x=0.75时y的值(精确到0.01).
附注:参考数据:

参考公式:相关系数r,回归直线的斜率和截距的最小二乘估计分别为
首页5 6 7 8 9 10 11 12 末页
跳转: 确定
共计 平均难度:一般