组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 19 道试题
10-11高二下·黑龙江牡丹江·期中

1 . 对两个变量进行回归分析,得到一组样本数据:,则下列说法中不正确的是       

A.由样本数据得到的线性回归方程必过样本点的中心
B.残差平方和越小的模型,拟合的效果越好
C.用相关指数来刻画回归效果,的值越小,说明模型的拟合效果越好
D.若变量之间的相关系数,则变量之间具有线性相关关系
2023-01-31更新 | 2166次组卷 | 53卷引用:2010-2011年黑龙江省牡丹江一中高二下学期期中考试理科数学
2 . 新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.
日期代码x12345678
累计确诊人数y481631517197122
为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量xy的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,其中.

(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?(结果保留整数)
附:回归直线的斜率和截距的最小二乘估计公式分别为:.
2022-05-23更新 | 2112次组卷 | 21卷引用:重庆市南开中学2019-2020学年高三下学期(线上测试)期中数学(理)试题
3 . 随着中美贸易战的不断升级,越来越多的国内科技巨头加大了科技研发投入的力度.中华技术有限公司拟对“麒麟”手机芯片进行科技升级,根据市场调研与模拟,得到科技升级投入x(亿元与科技升级直接收益y(亿元)的数据统计如下:

序号

1

2

3

4

5

6

7

8

9

10

11

12

x

2

3

4

6

8

10

13

21

22

23

24

25

y

13

22

31

42

50

56

58

68.5

68

67.5

66

66

时,建立了yx的两个回归模型:模型①:;模型②:;当时,确定yx满足的线性回归方程为
(1)根据下列表格中的数据,比较当时模型①、②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对“麒麟”手机芯片科技升级的投入为17亿元时的直接收益.

回归模型

模型①

模型②

回归方程

182.4

79.2

(附:刻画回归效果的相关指数
(2)为鼓励科技创新,当科技升级的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,比较科技升级投入17亿元与20亿元时公司实际收益的大小.
(附:用最小二乘法求线性回归方程的系数:
(3)科技升级后,“麒麟”芯片的效率X大幅提高,经实际试验得X大致服从正态分布.公司对科技升级团队的奖励方案如下:若芯片的效率不超过50%,不予奖励:若芯片的效率超过50%,但不超过53%,每部芯片奖励2元;若芯片的效率超过53%,每部芯片奖励4元记为每部芯片获得的奖励,求(精确到0.01).
(附:若随机变量,则
4 . 区块链技术被认为是继蒸汽机、电力、互联网之后,下一代颠覆性的核心技术区块链作为构造信任的机器,将可能彻底改变整个人类社会价值传递的方式,2015年至2019年五年期间,中国的区块链企业数量逐年增长,居世界前列现收集我国近5年区块链企业总数量相关数据,如表
年份20152016201720182019
编号12345
企业总数量y(单位:千个)2.1563.7278.30524.27936.224
注:参考数据(其中zlny).
附:样本(xiyi)(i=1,2,…,n)的最小二乘法估计公式为
(1)根据表中数据判断,ya+bxycedx(其中e=2.71828…,为自然对数的底数),哪一个回归方程类型适宜预测未来几年我国区块链企业总数量?(给出结果即可,不必说明理由)
(2)根据(1)的结果,求y关于x的回归方程(结果精确到小数点后第三位);
(3)为了促进公司间的合作与发展,区块链联合总部决定进行一次信息化技术比赛,邀请甲、乙、丙三家区块链公司参赛比赛规则如下:①每场比赛有两个公司参加,并决出胜负;②每场比赛获胜的公司与未参加此场比赛的公司进行下一场的比赛;③在比赛中,若有一个公司首先获胜两场,则本次比赛结束,该公司就获得此次信息化比赛的“优胜公司”,已知在每场比赛中,甲胜乙的概率为,甲胜丙的概率为,乙胜丙的概率为,请通过计算说明,哪两个公司进行首场比赛时,甲公司获得“优胜公司”的概率最大?
智能选题,一键自动生成优质试卷~
5 . 下列说法正确的是(  )
A.将一组数据中的每个数据都乘以同一个非零常数后,方差也变为原来的
B.设有一个回归方程,变量增加1个单位时,平均减少5个单位
C.线性相关系数的绝对值越接近于1,两个变量的线性相关性越强;反之,越接近于0线性相关性越弱
D.在某项测量中,测量结果服从正态分布),则
6 . 新能源汽车已经走进我们的生活,逐渐为大家所青睐.现在有某品牌的新能源汽车在甲市进行预售,预售场面异常火爆,故该经销商采用竞价策略基本规则是:①竞价者都是网络报价,每个人并不知晓其他人的报价,也不知道参与竞价的总人数;②竞价采用“一月一期制”,当月竞价时间截止后,系统根据当期汽车配额,按照竞价人的出价从高到低分配名额.某人拟参加2020年6月份的汽车竞价,他为了预测最低成交价,根据网站的公告,统计了最近5个月参与竞价的人数(如下表)
月份2020.012020.022020.032020.042020.05
月份编号12345
竞拍人数(万人)0.50.611.41.7

(1)由收集数据的散点图发现,可用线性回归模型拟合竞价人数y(万人)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程:,并预测2020年6月份(月份编号为6)参与竞价的人数;
(2)某市场调研机构对200位拟参加2020年6月份汽车竞价人员的报价进行了一个抽样调查,得到如表所示的频数表:
报价区间(万元)
频数206060302010

i)求这200位竞价人员报价的平均值和样本方差s2(同一区间的报价用该价格区间的中点值代替)
ii)假设所有参与竞价人员的报价X可视为服从正态分布μσ2可分别由(i)中所示的样本平均数s2估计.若2020年月6份计划提供的新能源车辆数为3174,根据市场调研,最低成交价高于样本平均数,请你预测(需说明理由)最低成交价.
参考公式及数据:
①回归方程,其中

③若随机变量X服从正态分布
.
2020-06-12更新 | 965次组卷 | 3卷引用:山东省德州市2020届高三第二次(6月)模拟考试数学试题
7 . 某公司为提高市场销售业绩,设计了一套产品促销方案,并在某地区部分营销网点进行试点.运作一年后,对“采取促销”和“没有采取促销”的营销网点各选了50个,对比上一年度的销售情况,分别统计了它们的年销售总额,并按年销售总额增长的百分点分成5组:,分别统计后制成如图所示的频率分布直方图,并规定年销售总额增长10个百分点及以上的营销网点为“精英店”.
“采用促销”的销售网点:

“不采用促销”的销售网点:

(1)请根据题中信息填充下面的列联表,并判断是否有的把握认为“精英店与采用促销活动有关”;

采用促销

无促销

合计

精英店

非精英店

合计

50

50

100

(2)某“精英店”为了创造更大的利润,通过分析上一年度的售价(单位:元)和日销量(单位:件)()的一组数据后决定选择作为回归模型进行拟合.具体数据如下表,表中的

45.8

395.5

2413.5

4.6

21.6

①根据上表数据计算的值;
②已知该公司产品的成本为10元/件,促销费用平均5元/件,根据所求出的回归模型,分析售价定为多少时日利润可以达到最大.
附①:

0.100

0.050

0.010

0.001

2.706

3.841

6.635

10.828

附②:对应一组数据
其回归直线的斜率和截距的最小二乘法估计分别为.
2020-01-17更新 | 907次组卷 | 3卷引用:湖南省邵阳市2019-2020学年高三第一次联考数学(文)试题
8 . 由于往届高三年级数学学科的学习方式大都是“刷题一讲题一再刷题”的模式,效果不理想,某市一中的数学课堂教改采用了“记题型一刷题一检测效果”的模式,并记录了某学生的记题型时间(单位:)与检测效果的数据如下表所示.
记题型时间1234567
检测效果2.93.33.64.44.85.25.9
(1)据统计表明,之间具有线性相关关系,请用相关系数加以说明(若,则认为有很强的线性相关关系,否则认为没有很强的线性相关关系);
(2)建立关于的回归方程,并预测该学生记题型的检测效果;
(3)在该学生检测效果不低于3.6的数据中任取2个,求检测效果均高于4.4的概率.
参考公式:回归直线中斜率和截距的最小二乘估计分别为
,相关系数
参考数据:.
9 . 新疆在种植棉花有着得天独厚的自然条件,土质呈碱性,夏季温差大,阳光充足,光合作用充分,生长时间长,这种环境下种植的棉花绒长、品质好、产量高,所以新疆棉花举世闻名.每年五月份,新疆地区进入灾害天气高发期,灾害天数对当年棉花产量有着重要影响,根据过去五年的数据统计,得到相关数据如下表:
灾害天气天数(天)23458
棉花产量(吨/公顷)3.22.421.91.7

根据以上数据,技术人员分别借助甲、乙两种不同的回归模型,得到两个回归方程,
方程甲:,方程乙:.
(1)为了评价两种模型的拟合效果,完成以下任务:①完成下表;(计算结果精确到0.1)
②分别计算模型甲与模型乙的残差平方和,并比较的大小,判断哪个模型拟合效果更好?
灾害天气天数(天)23458
棉花产量(吨公顷)3.22.421.91.7
模型甲估计值2.42.11.6
残差00.1
模型乙估计值2.321.9
残差0.100
(2)根据天气预报,今年五月份新疆市灾害天气是6天的概率是0.5,灾害天气是7天的概率为0.4,灾害天气是10天的概率为0.1,若何女士在新疆市承包了15公顷地种植棉花,请你根据第(1)问中拟合效果较好的模型估计一下何女士今年棉花的产量.(计算过程中所有结果精确到0.01)
2020-02-16更新 | 786次组卷 | 2卷引用:2019届重庆市第八中学校高考全真模拟理科数学试题
解答题-问答题 | 适中(0.65) |
名校
10 . 一只红铃虫的产卵数y和温度x有关,现收集了6组观测数据于下表中,通过散点图可以看出样本点分布在一条指数型函数y=的图象的周围.

(1)试求出y关于x的上述指数型的回归曲线方程(结果保留两位小数);
(2)试用(1)中的回归曲线方程求相应于点(24,17)的残差.(结果保留两位小数)
温度x(°C)202224262830
产卵数y()6917254488
z=lny1.792.202.833.223.784.48
几点说明:
①结果中的都应按题目要求保留两位小数.但在求时请将的值多保留一位即用保留三位小数的结果代入.
②计算过程中可能会用到下面的公式:回归直线方程的斜率==,截距.
③下面的参考数据可以直接引用:=25,=31.5,≈3.05,=5248,≈476.08,,ln18.17≈2.90.
共计 平均难度:一般