组卷网 > 章节选题 > 3.1 回归分析的基本思想及其初步应用
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 76 道试题
1 . 发展扶贫产业,找准路子是关系,重庆市石柱土家族自治县中益乡华溪村不仅找准了路,还将当地打造成了种植中药材黄精的产业示范基地.通过种植黄精,华溪村村民的收逐年递增.以下是2013年至2019年华溪村村民每户平均可支配收入的统计数据:
年份2013201420152016201720182019
年份代码x1234567
每户平均可支配收y(千元)4152226293132
根据以上数据,绘制如图所示的散点图:

(1)根据散点图判断, 哪一个更适宜作为每户平均可支配收入y(千元)关于年份代码x的回归方程模型(给出判断即可,不必说明理由),并建立y关于x的回归方程(结果保留1位小数);
(2)根据(1)建立的回归方程,试预测要到哪一年华溪村的每户平均可支配收入才能超过35(千元)?
(3)从2013年至2019年中任选两年,求事件A:“恰有一年的每户平均可支配收入超过22(千元)”的概率.
参考数据:其中
参考公式:线性回归方程中,
2020-12-26更新 | 338次组卷 | 1卷引用:福建省厦门双十中学2021届高三12月月考数学试题
2 . 某沙漠地区经过治理,生态系统得到改善.为调查该地区植物覆盖面积(单位:公顷)和某种野生动物的数量的关系,将该地区分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据i=1,2,…,20),其中xiyi分别表示第i个样区的植物覆盖面积和这种野生动物的数量,并计算得
(1)求样本i=1,2,…,20)的相关系数(精确到0.01),并用相关系数说明各样区的这种野生动物的数量与植物覆盖面积的相关性.
(2)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数
2020-10-09更新 | 519次组卷 | 4卷引用:福建省福州市2021届高三数学10月调研A卷试题
3 . 2019年双十一落下帷幕,天猫交易额定格在268(单位:十亿元)人民币(下同),再创新高,比去年218(十亿元)多了50(十亿元).这些数字的背后,除了是消费者买买买的表现,更是购物车里中国新消费的奇迹,为了研究历年销售额的变化趋势,一机构统计了2010年到2019年天猫双十一的销售额数据y(单位:十亿元),绘制如表:
年份2010201120122013201420152016201720182019
编号x12345678910
销售额y0.98.722.4416594132.5172.5218268
根据以上数据绘制散点图,如图所示

(1)根据散点图判断,哪一个适宜作为销售额关于x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及如表中的数据,建立关于x的回归方程,并预测2020年天猫双十一销售额;(注:数据保留小数点后一位)
(3)把销售不超过100(十亿元)的年份叫“平销年”,把销售额低于10(十亿元)的年份叫“试销年”,从2010年到2019年这十年的“平销年”中任取2个,表示取到“试销年”的个数,求的分布列和数学期望。
参考数据:
参考公式:
对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别
2020-08-05更新 | 341次组卷 | 1卷引用:福建省莆田市莆田第二十五中学2019-2020学年高二下学期期末考试数学试题
4 . 某芯片公司为了制定下一年的某种产品研发投入计划,需要了解年研发资金投入量(单位:亿元)对年销售额(单位:亿元)和年收益(单位:亿元)的影响,为此收集了近12年的年研发资金投入量和年销售额的数据并对这些数据作了初步处理,得到了下面的散点图及一些统计量的值.为了进一步了解年研发资金投入量对年销售额的影响,公司三位员工查阅大量资料,对历史数据进行对比分析,分别提出了三个回归方程模型:①;②;③.
4066770250200
3.600.499.8065.0030.00

表中.
(1)根据散点图及表中数据,请分别选用两个比较恰当的回归方程模型,建立关于的回归方程;
(2)①根据(1)的回归方程模型,从数据相关性的角度考虑,判断哪一个更适宜作为年销售额关于年研发资金投入量的回归方程?并说明理由;
②已知这种产品的年收益服正态分布,那么这种产品的收益超过54.31亿元(含54.31亿元)的概率为多少?
附:①最小二乘估计以及相关系数公式:
②若,则有
③参考数据:.
5 . 为了研究一种昆虫的产卵数y和温度x是否有关,现收集了7组观测数据列于下表中,并做出了散点图,
   
发现样本点并没有分布在某个带状区域内,两个变量并不呈现线性相关关系,现分别用模型①与模型;②作为产卵数y和温度x的回归方程来建立两个变量之间的关系.
温度x/℃20222426283032
产卵数y/个610212464113322
4004845766767849001024
1.792.303.043.184.164.735.77

26692803.57
1157.540.430.320.00012

其中.
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:.
(1)根据表中数据,模型①、②的相关指数计算分别为,请根据相关指数判断哪个模型的拟合效果更好.
(2)根据(1)中的判断,在拟合效果更好的模型下求y关于x的回归方程;并估计温度为30℃时的产卵数.(与估计值均精确到小数点后两位)
(参考数据:
2020-07-23更新 | 1271次组卷 | 4卷引用:福建省厦门市第一中学2020届高三最后一模数学(文)试题
6 . 有5名学生的数学和化学成绩如下表所示:
学生学科
数学成绩(8776736663
化学成绩(7866716461
(1)如果具有相关关系,求线性回归方程
(2)预测如果某学生数学成绩为79分,他的化学成绩为多少?(结果取整数)
附:
2020-07-14更新 | 159次组卷 | 1卷引用:福建省莆田第七中学2019-2020学年高一6月阶段性考试数学试题
7 . 网购已成为当今消费者喜欢的购物方式.某机构对ABCD四家同类运动服装网店的关注人数 x(千人)与其商品销售件数 y(百件)进行统计对比,得到如下表格:

由散点图知,可以用回归直线 来近似刻画它们之间的关系.
参考公式:
(1)求 yx的回归直线方程;
(2)在(1)的回归模型中,请用说明销售件数的差异有多大程度是由关注人数引起的?(精确到
2020-07-02更新 | 324次组卷 | 3卷引用:福建省厦门市湖滨中学2020届高三下学期测试数学(文)试题
8 . 某车间为了规定工时额,需确定加工零件所花费的时间,为此做了4次试验,得到的数据如下图:若加工时间(小时)与零件个数之间有较好的线性相关关系.
2356
2.5355.5

(1)求加工时间与零件个数的线性回归方程
(2)试预报加工10个零件需要的时间.
附:回归方程系数公式:
9 . 某火锅店为了解气温对营业额的影响,随机记录了该店1月份中5天的日营业额y(单位:千元)与该地当日最低气温x(单位:℃)的数据,如下表:
x258911
y1210887
(1)求y关于x的回归方程
(2)判定yx之间是正相关还是负相关;若该地1月份某天的最低气温为6℃,用所求回归方程预测该店当日的营业额;
附:①.
②参考数据如下:
i
1212424
25102550
3886464
4988172
511712177
3545295287
2020-06-16更新 | 105次组卷 | 1卷引用:福建省福清市龙西中学2018-2019学年高二下学期期末考试数学(理)试题
10 . 某省级示范高中高三年级对各科考试的评价指标中,有“难度系数“和“区分度“两个指标中,难度系数,区分度.
(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147,142,137;普通班三人的成绩分别为97,102,113.通过样本估计本次考试的区分度(精确0.01).
(2)如表表格是该校高三年级6次数学考试的统计数据:
难度系数x0.640.710.740.760.770.82
区分度y0.180.230.240.240.220.15

①计算相关系数r,|r|<0.75时,认为相关性弱;|r|≥0.75时,认为相关性强.通过计算说明,能否利用线性回归模型描述yx的关系(精确到0.01).
ti=|xi﹣0.74|(i=1,2,…,6),求出y关于t的线性回归方程,并预测x=0.75时y的值(精确到0.01).
附注:参考数据:

参考公式:相关系数r,回归直线的斜率和截距的最小二乘估计分别为
共计 平均难度:一般