组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 45 道试题
1 . 某公司为了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响.对公司近12年的年研发资金投入量xi和年销售额yi的数据,进行了对比分析,建立了两个模型:①,②,其中αβλt均为常数,e为自然对数的底数,并得到一些统计量的值.,经计算得如下数据:

20

66

77

2

460

4.20

31250

215

3.08

14

(1)请从相关系数的角度,分析哪一个模型拟合程度更好?
(2)(ⅰ)根据分析及表中数据,建立y关于x的回归方程;
(ⅱ)若下一年销售额y需达到90亿元,预测下一年的研发资金投入量x是多少亿元?
附:①相关系数,回归直中公式分别为;
②参考数据:.
2023-06-30更新 | 594次组卷 | 14卷引用:山东省德州市2019-2020学年高三上学期期末数学试题
2 . 新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.
日期代码x12345678
累计确诊人数y481631517197122
为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量xy的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,其中.

(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?(结果保留整数)
附:回归直线的斜率和截距的最小二乘估计公式分别为:.
2022-05-23更新 | 2158次组卷 | 21卷引用:重庆市南开中学2019-2020学年高三下学期(线上测试)期中数学(理)试题
3 . 某企业为确定在2019年度投入某种产品的开发费用,需了解年开发费用(单位:百万元)对年销售量(单位:百万件)的影响,统计了近8年投入的年开发费用与年销售量)的数据,得到如下散点图.根据散点图可得年开发费用和年销售量符合(其中为大于0的常数)的回归方程.

(1)对数据作如下处理:两边取对数得,得到相关统计量的值如下表,求关于的回归方程;

24.40

12

12

37.20

(2)已知企业年利润(单位:百万元)与的关系为(其中)根据(1)的结果,要使得该企业2019年的年利润最大,预计2019年应投入多少开发费用?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为
2022-03-31更新 | 350次组卷 | 1卷引用:重庆市主城区六校2018-2019学年高二下学期期末联考数学(文)试题
4 . 某创业者计划在南山旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如下表,x为收费标准(单位:元/日),t为入住天数(单位:天),以入住天数的频率作为各自的“入住率”,收费标准x与入住率y的散点图如图.
x100150200300450
y9065453020

(1)若从以上五家“农家乐”中随机抽取两家深入调查,记为“入住率”超过的农家乐的个数,求的分布列;
(2)令,由散点图判断哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求回归方程;(的结果精确到
(3)根据第(2)问所求的回归方程,试估计收费标准为多少时,100天销售额Q最大?(100天销售额入住率收费标准x
参考数据:
2021-09-17更新 | 915次组卷 | 9卷引用:湖南省长沙市第一中学2020届高三第一次月考数学(理)试题
智能选题,一键自动生成优质试卷~
5 . 红铃虫(Pectinophora gossypiella)是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数(个)和温度)的组观测数据,制成图所示的散点图.现用两种模型①,②分别进行拟合,由此得到相应的回归方程并进行残差分析,进一步得到图所示的残差图.

根据收集到的数据,计算得到如下值:
252.8964616842268848.4870308
表中
(1)根据残差图,比较模型①、②的拟合效果,应选择哪个模型?并说明理由;
(2)根据(1)中所选择的模型,求出关于的回归方程(计算过程中四舍五入保留两位小数),并求温度为时,产卵数的预报值.
参考数据:.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
6 . 重庆十一中某组同学为参加第20届中国青少年机器人竞赛重庆赛区选拔赛,需要从工厂订制零件,已知该厂有两条不同生产线,同学们为保证质量,现从各自生产的产品中分别随机抽取20件,进行品质鉴定,鉴定成绩的茎叶图如下所示:

该零件的质量评价标准规定:鉴定成绩达到的零件,质量等级为优秀;鉴定成绩达到的零件,质量等级为良好;鉴定成绩达到的零件,质量等级为合格.将这组数据的频率视为整批产品的概率.
(1)请完成下面质量等级与生产线产品列联表,并判断能不能在犯错误的概率不超过0.05的情况下,认为产品等级是否达到良好以上与生产产品的生产线有关.
生产线的产品生产线的产品合计
良好以上
合格
合计
(2)从等级为优秀的样本中随机抽取两件,记为来自生产线的产品数量,写出的分布列,并求的数学期望;
(3)为了确定机器人身上的零件个数与使用寿命的关系,同时又兼顾灵敏性,同学们通过实践研究把的数据作了初步处理,得到下面的散点图及一些统计量的值.
311.00.46262.530.1551.458
上表中.
根据散点图直接判断(不必说明理由)哪一个适宜作为y关于x的回归方程类型?并根据表中数据建立y关于x的回归方程.
附:
0.100.050.010.005
2.7063.8416.6357.879

对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计分别为:
.
2020-12-30更新 | 212次组卷 | 1卷引用:重庆市第十一中学校2021届高三上学期9月月考数学试题
7 . 随着电子阅读的普及,传统纸质媒体遭受到了强烈的冲击.某杂志社近年来的纸质广告收入如下表所示:

年份

时间代号

广告收入(千万元)

根据这年的数据,对作线性相关性检验,求得样本相关系数的绝对值为;根据后年的数据,对作线性相关性检验,求得样本相关系数的绝对值为.
(1)如果要用线性回归方程预测该杂志社年的纸质广告收入,现在有两个方案,方案一:选取这年数据进行预测,方案二:选取后年数据进行预测.从实际生活背景以及线性相关性检验的角度分析,你觉得哪个方案更合适?
(2)某购物网站同时销售某本畅销书籍的纸质版本和电子书,据统计,在该网站购买该书籍的大量读者中,只购买电子书的读者比例为,纸质版本和电子书同时购买的读者比例为,现用此统计结果作为概率.
①若从该网站购买该书籍的大量读者中任取一位,求只购买纸质版本的概率;
②若从上述读者中随机调查位,求购买电子书人数多于只购买纸质版本人数的概率.
2020-12-27更新 | 379次组卷 | 4卷引用:重庆市育才中学2021届高三上学期12月月考数学试题
8 . 为了研究黏虫孵化的平均温度(单位:)与孵化天数之间的关系,重庆八中高2022级某课外兴趣小组通过试验得到如下6组数据:

组号

1

2

3

4

5

6

平均温度

15.3

16.8

17.4

18

19.5

21

孵化天数

16.7

14.8

13.9

13.5

8.4

6.2

他们分别用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图:

经计算得
(Ⅰ)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)
(Ⅱ)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法建立关于的线性回归方程.(系数精确到0.1)
参考公式:回归方程中斜率和截距的最小二乘法估计公式分别为:
2021-07-14更新 | 415次组卷 | 7卷引用:【全国百强校】福建省厦门市第一中学2017-2018学年高二下学期期末模拟考试数学(理)试题
9 . 某湿地公园经过近十年的规划和治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的300个地块,并设计两种抽样方案,方案一:在该地区应用简单随机抽样的方法抽取30个作为样本区;依据抽样数据计算得到相应的相关系数;方案二:在该地区应用分层抽样的方法抽取30个作为样本区,调查得到样本数据,2,…,30),其中分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求方案二抽取的样本,2,…,30)的相关系数(精确到0.01);并判定哪种抽样方法更能准确的估计.
附:相关系数;相关系数,则相关性很强,的值越大,相关性越强.
2020-10-24更新 | 926次组卷 | 17卷引用:湖南省长沙市长郡中学2020-2021学年高二上学期新高考选科适应性调查考试数学试题
10 . 近年来,我国大力发展新能源汽车工业,新能源汽车(含电动汽车)销量已跃居全球首位某电动汽车厂新开发了一款电动汽车,并对该电动汽车的电池使用情况进行了测试,其中剩余电量y与行驶时间x(单位:小时)的9组测试数据如下:
x123456789
y2.7721.921.361.121.090.740.60.53
如果剩余电量不足1,则电池需要充电.
(1)从这9组数据中随机选出7组,用X表示需要充电的数据组数,求随机变量X的分布列;
(2)根据电池放电的特点,剩余电量y与时间x满足经验关系式:.设,利用表格中的9组数据求x的相关系数r,并判断是否有99%的把握认为x之间具有线性相关关系.当时,可认为有99%的把握认为两个变量具有线性相关关系,否则不能认为;
(3)求yx的经验关系式.(结果保留两位小数)
参考数据:.
这9组测试数据的一些相关量见下表:
合计4512.211.55604.382.43
合计-15.55-11.88
相关公式:对于样本.其回归直线的斜率和截距的最小二乘估计公式分别为,相关系数.
共计 平均难度:一般