组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 80 道试题
1 . 某市春节期间7家超市的广告费支出(单位:万元)和销售额(单位:万元)数据记录如下表:
超市ABCDEFG
广告费支出(万元)1246111319
销售额(万元)19324044525354
(1)若用线性回归模型拟合yx的关系,求y关于x的线性回归方程;
(2)若用二次函数回归模型拟合yx的关系,可得回归方程为,经计算,二次函数回归模型和线性回归模型的相关指数分别约为0.93和0.75,请用说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出为3万元时的销售额.
参考数据及公式:
2 . 2020年新型冠状病毒肺炎疫情席卷全球,我国在全力保障口罩、防护服等医疗物资供给基础上,重点开展医疗救治急需的呼吸机、心电监护仪等医疗设备的组织生产和及时供应,统筹协调医用物资生产企业高速生产,支援世界各国抗击肺炎疫情.我市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1目~9月9日连续9天的呼吸机日生产量为(单位:百台),数据作了初步处理;得到如图所示的散点图.
2.731952851095

注:图中日期代码1~9分别对应9月1日~9月9日;表中
(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;
(2)由散点图分析,样本点都集中在曲线的附近,求y关于t的方程,并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.
参考公式:回归直线方程是
参考数据:
2021-05-16更新 | 1709次组卷 | 6卷引用:广东省梅州市2021届高三下学期二模数学试题
3 . 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫()内的数字均含1﹣9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
(1)赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度(秒)与训练天数(天)有关,经统计得到如表的数据:
(天)1234567
(秒)990990450320300240210
现用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过100天训练后,每天解题的平均速度约为多少秒?
参考数据(其中)
18450.370.55
参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计公式分别为:.
(2)小明和小红在数独APP上玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,两人约定先胜4局者赢得比赛.若小明每局获胜的概率为,已知在前3局中小明胜2局,小红胜1局.若不存在平局,请你估计小明最终赢得比赛的概率.
2021-05-08更新 | 1047次组卷 | 5卷引用:广东省汕头金中、湛江一中、东莞东华、广州六中四校2023届高三下学期联考数学试题
4 . 魔方,又叫鲁比克方块,最早是由匈牙利布达佩斯建筑学院厄尔诺·鲁比克教授于1974年发明的.魔方与华容道、独立钻石棋一起被国外智力专家并称为智力游戏界的三大不可思议,而魔方受欢迎的程度更是智力游戏界的奇迹.通常意义下的魔方,即指三阶魔方,为的正方体结构,由个色块组成.常规竞速玩法是将魔方打乱,然后在最短的时间内复原.截至2020年,三阶魔方还原官方世界纪录是由中国的杜宇生在2018年11月24日于芜湖赛打破的纪录,单次秒.
(1)某魔方爱好者进行一段时间的魔方还原训练,每天魔方还原的平均速度(秒)与训练天数(天)有关,经统计得到如下数据:
(天)
(秒)
现用作为回归方程类型,请利用表中数据,求出该回归方程,并预测该魔方爱好者经过长期训练后最终每天魔方还原的平均速度约为多少秒(精确到)?参考数据(其中)
(2)现有一个复原好的三阶魔方,白面朝上,只可以扭动最外侧的六个表面.某人按规定将魔方随机扭动两次,每次均顺时针转动,记顶面白色色块的个数为,求的分布列及数学期望.
5 . 2020年10月份黄山市某开发区一企业顺利开工复产,该企业生产不同规格的一种产品,根据检测标准,其合格产品的质量y(单位:)与尺寸x(单位: )之间近似满足关系式(bc为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品.现随机抽取6件合格产品,测得数据如下:
尺寸384858687888
质量16.818.820.722.42425.5
质量与尺寸的比0.4420.3920.3570.3290.3080.290
(1)现从抽取的6件合格产品中再任选3件,记为取到优等品的件数试求随机变量的分布列和期望;
(2)根据测得数据作了初步处理,得相关统计量的值如下表:
75.324.618.3101.4
①根据所给统计量,求y关于x的回归方程;
②已知优等品的收益z(单位:千元)与xy的关系为,则当优等品的尺寸x为何值时,收益z的预报值最大?(精确到0.1)
附:对于样本,其回归直线的斜率和截距的最小二乘估计公式分别为:.
2021-01-28更新 | 1281次组卷 | 3卷引用:广东省普宁市普师高级中学2023届高三二模数学试题
6 . 为了了解空气质量指数(AQI)与参加户外健身运动的人数之间的关系,某校环保小组在暑假期间(60天)进行了一项统计活动:每天记录到体育公园参加户外健身运动的人数,并与当天值(从气象部门获取)构成60组成对数据,其中为当天参加户外健身运动的人数,为当天的值,并制作了如下散点图:
连续60天参加健身运动人数与AQI散点图

(1)环保小组准备做yx的线性回归分析,算得yx的相关系数为,试分析yx的线性相关关系?
(2)环保小组还发现散点有分区聚集的特点,尝试作聚类分析.用直线将散点图分成I、Ⅱ、Ⅲ、Ⅳ四个区域(如图),统计得到各区域的点数分别为5、10、10、35,并初步认定“参加户外健身运动的人数不少于100与值不大于100有关联”,试分析该初步认定的犯错率是否小于
附:
0.0500.0100.001
K3.8416.63510.828
7 . 我国全面二孩政策已于2016年1月1日起正式实施.国家统计局发布的数据显示,从2012年到2017年,中国的人口自然增长率变化始终不大,在5‰上下波动(如图)为了了解年龄介于24岁至50岁之间的适孕夫妻对生育二孩的态度如何,统计部门按年龄分为9组,每组选取150对夫妻进行调查统计有生育二孩意愿的夫妻数,得到如表:
年龄区间
有意愿数808187868483837066
(1)从这五个年龄段中各选出一对夫妻(能代表该年龄段超过半数夫妻的意愿)进一步调研,再从这5对夫妻中任选2对夫妻.求其中恰有一对不愿意生育二孩的夫妻的概率.
(2)设每个年龄区间的中间值为x,有意愿数为y,求样本数据的线性回归直线方程,并求该模型的相关系数r(结果保留两位小数).
(参考:
.)
2021-01-16更新 | 213次组卷 | 1卷引用:广东省佛山市第一中学2021届高三上学期九月月考数学试题
8 . 为了研究黏虫孵化的平均温度(单位:)与孵化天数之间的关系,重庆八中高2022级某课外兴趣小组通过试验得到如下6组数据:

组号

1

2

3

4

5

6

平均温度

15.3

16.8

17.4

18

19.5

21

孵化天数

16.7

14.8

13.9

13.5

8.4

6.2

他们分别用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图:

经计算得
(Ⅰ)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)
(Ⅱ)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法建立关于的线性回归方程.(系数精确到0.1)
参考公式:回归方程中斜率和截距的最小二乘法估计公式分别为:
2021-07-14更新 | 415次组卷 | 7卷引用:广东省深圳市福田区红岭中学2021-2022学年高三上学期期末数学试题
9 . 月底,为严防新型冠状病毒疫情扩散,有效切断病毒传播途径,坚决遏制疫情蔓延势头,确保人民群众生命安全和身体健康,多地相继做出了封城决定.某地在日至日累计确诊人数如下表:

日期(月)

人数(人)

由上述表格得到如散点图(日为封城第一天).

(1)根据散点图判断均为大于的常数)哪一个适宜作为累计确诊人数与封城后的天数的回归方程类型(给出判断即可,不必说明理由);并根据上表中的数据求出回归方程;
(2)随着更多的医护人员投入疫情的研究,日武汉影像科医生提出存在大量核酸检测呈阴性(阳性则确诊),但观其肺片具有明显病变,这一提议引起了广泛的关注,日武汉疾控中心接收了份血液样本,假设每份样本的检验结果是阳性还是阴性都是相互独立的,且每份样本是阳性样本的概率为,核酸试剂能把阳性样本检测出阳性结果的概率是(核酸检测存在阳性样本检测不出来的情况,但不会把阴性检测呈阳性),求这份样本中检测呈阳性的份数的期望.
参考数据:

其中,参考公式:对于一组数据,…,,其回归直线的斜率和截距的最小二乘估计公式分别为.
解答题-问答题 | 适中(0.65) |
真题 名校
10 . 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xiyi)(i=1,2,…,20),其中xiyi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xiyi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.

附:相关系数r=≈1.414.

2020-07-08更新 | 46873次组卷 | 131卷引用:广东省佛山市顺德区容山中学2020-2021学年高三上学期10月月考数学试题
共计 平均难度:一般