组卷网 > 章节选题 > 3.1 回归分析的基本思想及其初步应用
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 51 道试题
1 . 在某次试验中,两个试验数据xy的统计结果如下面的表格1所示.
表格1

x

1

2

3

4

5

y

2

3

4

4

5


(1)在给出的坐标系中画出数据xy的散点图.
(2)补全表格2,根据表格2中的数据和公式求下列问题.
①求出关于的回归直线方程中的.
②估计当时,的值是多少?
表格2

序号

x

y

x2

xy

1

1

2

1

2

2

2

3

4

6

3

3

4

9

12

4

4

4

16

16

5

5

5

25

25

2018-10-01更新 | 334次组卷 | 1卷引用:黑龙江省海林市朝鲜族中学人教版高中数学选修1-2同步练习:第一章 统计案例单元测评
2 . 学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后自主学习,人们普遍认为课后自主学习时间越多学习效果越好.某权威研究机构抽查了部分高中学生,对学生每天花在数学上的课后自主学习时间(分钟)和他们的数学成绩(分)做出了调查,得到一些数据信息并证实了正相关.“学霸”小李为了鼓励好朋友小王和小张努力学习,拿到了该机构的一份数据表格如下(其中部分数据被污染看不清),小李据此做出了散点图如下,并计算得到的方差为350,的相关系数).
   
   
(1)请根据所给数据求出的线性经验回归方程,并由此预测每天课后自主学习数学时间达到100分钟时的数学成绩;
(2)受到小李的鼓励,小王和小张决定在课后花更多的时间在数学学习上,小张把课后自主学习时间从20分钟增加到60分钟,而小王把课后自主学习时间从60分钟增加到100分钟.经过几个月的坚持,小张的数学成绩从50分提升到90分,但小王的数学成绩却只是从原来的100分提升到了115分.小王觉得很迷惑,课后学习时间每天同样增加了40分钟,为什么自己的成绩仅仅提升了十几分呢,为什么实际成绩跟预测的成绩差别那么大呢?
①请根据你对课后自主学习时间与数学成绩的关系的看法及对一元回归模型的理解,解答小王的疑惑;
②小李为了解答小王的疑惑,想办法拿到了上表中被污染的数据如下.据此,请在上图中补齐散点图,并给出一个合适的经验回归方程类型(不必求出具体方程,不必说明理由).

编号

14

15

16

17

18

x

85

90

100

110

120

y

113

114

117

119

119

附:回归方程中斜率和截距的最小二乘估计公式分别为.
2023-07-09更新 | 178次组卷 | 1卷引用:福建省泉州市部分中学2022-2023学年高二下期末联考数学试题
3 . 某公司为了研究年宣传费(单位:千元)对销售量(单位:吨)和年利润(单位:千元)的影响,搜集了近 8 年的年宣传费和年销售量数据:
12345678
3840444648505256
4555616365666768

(1)请补齐表格中 8 组数据的散点图,并判断中哪一个更适宜作为年销售量关于年宣传费的函数表达式?(给出判断即可,不必说明理由)

(2)若(1)中的,且产品的年利润的关系为,为使年利润值最大,投入的年宣传费应为何值?
2023高二下·上海·专题练习
解答题-作图题 | 适中(0.65) |
4 . 某中学,由于不断深化教育改革,办学质量逐年提高.2006年至2009年高考考入一流大学人数如下:
年份2006200720082009
高考上线人数116172220260
以年份为横坐标,当年高考上线人数为纵坐标建立直角坐标系,由所给数据描点作图(如图所示),从图中可清楚地看到这些点基本上分布在一条直线附近,因此,用一次函数来模拟高考上线人数与年份的函数关系,并以此来预测年高考一本上线人数.如下表:

年份

2006

2007

2008

2009

年份代码

1

2

3

4

实际上线人数

116

172

220

260

模拟上线人数

为使模拟更逼近原始数据,用下列方法来确定模拟函数.
表示各年实际上线人数,表示模拟上线人数,当最小时,模拟函数最为理想.试根据所给数据,预测年高考上线人数.
   
2023-08-17更新 | 61次组卷 | 2卷引用:核心考点12成对数据的统计分析-【满分全攻略】2022-2023学年高二数学下学期核心考点+重难点讲练与测试(沪教版2020选修一+选修二)
智能选题,一键自动生成优质试卷~
5 . 乒乓球运动在我国非常普及,被定为“国球”.有非常多的青少年从小就接受系统的训练,所以基本功非常扎实,把乒乓球打到对方球台的指定位置是乒乓球运动的基本功之一,打100个球,若有大于90个打到对方球台的指定位置,则称为“优秀”,否则称为“一般”,在练球时,打球动作有“规范动作”和“不规范动作”两种,且在接受训练的学员中,将训练满10次而不满20次记为1组,训练满20次而不满30次记为2组,如此,,训练满次而不满次记为组.某乒乓球训练部门为了以后优化训练,在“规范动作”和“不规范动作”的两群体中,在组数15组中各随机抽取10人,即两群体中各抽取50人,进行测试得出的关于“优秀”、“一般”的表1和表2如下.表1:
有“规范动作”的学员测试结果(“优秀”个数)
组数12345
“优秀”数12467
表2:有“不规范动作”的学员测试结果(“优秀”个数)
组数12345
“优秀”数01234
(1)填写以下表格,依据小概率值的独立性检验分析,推断“优秀”和“一般”与练球时的“规范动作”是否有关.
“优秀”“一般”合计
“规范动作”50
“不规范动作”50
合计
(2)在有“规范动作”的学员测试结果中,表示组数,表示“优秀”个数,由表1求平均值关于的经验回归方程.
参考数据及公式:.
0.150.100.050.0250.0100.0050.001
2.0722.7063.8415.0246.6357.87910.828
.
2023-07-09更新 | 65次组卷 | 1卷引用:河北省邢台市2022-2023学年高二下学期期末数学试题
6 . 随着生活水平的逐步提高,人们对文娱活动的需求与日俱增,其中观看电视就是一种老少皆宜的娱乐活动.但是我们在观看电视娱乐身心的同时,也要注意把握好观看时间,近期研究显示,一项久坐的生活指标——看电视时间,是导致视力下降的重要因素,即看电视时间越长,视力下降的风险越大.研究者在某小区统计了每天看电视时间(单位:小时)与视力下降人数的相关数据如下:
编号12345
11.522.53
1216222426

(1)请根据上面的数据求关于的线性回归方程
(2)我们用(1)问求出的线性回归方程估计回归方程,由于随机误差,所以 的估计值,成为点()的残差.
①填写下面的残差表,并绘制残差图;
编号12345
11.522.53
1216222426


②若残差图所在带状区域宽度不超过4,我们则认为该模型拟合精度比较高,回归方程的预报精度较高,试根据①绘制的残差图分析该模型拟合精度是否比较高?
附:回归直线的斜率和截距的最小二乘估计分别为
2020-06-25更新 | 460次组卷 | 1卷引用:河南省洛阳市2020届高三第三次统一考试文科数学(文)试题
7 . 近几年,电商行业的蓬勃发展带动了快递业的迅速增长,快递公司揽收价格一般是采用“首重+续重”的计价方式.首重是指最低的计费重量,续重是指超过首重部分的计费重量,不满一公斤按一公斤计费.某快递网点将快件的揽收价格定为首重(不超过一公斤)8元,续重2元/公斤(例如,若一个快件的重量是0.6公斤,按8元计费;若一个快件的重量是1.4公斤,按元计费).根据历史数据,得到该网点揽收快件重量的频率分布直方图如下图所示

(1)根据样本估计总体的思想,将频率视作概率,求该网点揽收快件的平均价格;
(2)为了获得更大的利润,该网点对“一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数(单位:百件)之间的关系”进行调查研究,得到相关数据如下表:
每天揽收快递件数(百件)23458
每件快递的平均成本(元)5.64.84.44.34.1
根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个回归方程:
方程甲:,方程乙:.
①为了评价两种模型的拟合效果,根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数),分别计算模型甲与模型乙的残差平方和,并依此判断哪个模型的拟合效果更好(备注:称为相应于点的残差,残差平方和
每天揽收快递件数/百件23458
每天快递的平均成本/元5.64.84.44.34.1
模型甲预报值5.25.04.8
残差0.20.4
模型乙预报值5.54.84.5
预报值00.1
②预计该网点今年6月25日(端午节)一天可以揽收1000件快递,试根据①中确定的拟合效果较好的回归模型估计该网点当天的总利润(总利润=(平均价格-平均成本)×总件数).
8 . 某出版社单册图书的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:
x123571011202530
y9.025.274.063.032.592.282.211.891.801.75
(1)根据以上数据画出散点图(可借助统计软件),并根据散点图判断:中哪一个适宜作为回归方程模型?
(2)根据(1)的判断结果,试建立成本费y关于印刷册数x的回归方程;
(3)利用回归方程估计印刷26000册图书的单册成本(结果保留两位小数).
2023-10-07更新 | 218次组卷 | 2卷引用:湘教版(2019)选择性必修第二册课本习题 习题4.2
9 . 一只红铃虫的产卵数y和温度x有关,现收集了7组观测数据如下表所示:
温度21232527293235
产卵个数711212466115325

(1)画出散点图,根据散点图判断哪一个适宜作为产卵数y关于温度x的回归方程类型(给出判断即可、不必说明理由);
(2)根据(1)的判断结果及表中数据.建立关于的回归方程.
(附:可能用到的公式,可能用到的数据如下表所示:
27.43081.2903.612147.7002763.764705.59240.180
(对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.)
2023-04-21更新 | 938次组卷 | 3卷引用:山西省临汾市2023届高三二模数学试题
10 . 临潼区一商场为了迎接暑期旅游旺季,确定暑期营销策略,进行了投入促销费用x和商场实际销售额y的试验,得到如下四组数据,

投入促销费用x(万元)

2

3

5

6

商场实际营销额y(万元)

100

200

300

400

(1)画出上述数据的散点图,并据此判断两个变量是否具有较好的线性相关性;
(2)求出xy之间的线性回归方程
(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用?
参考公式:
2023-03-14更新 | 142次组卷 | 1卷引用:陕西省西安市临潼区2020-2021学年高一下学期期末数学试题
共计 平均难度:一般