组卷网 > 章节选题 > 3.1 回归分析的基本思想及其初步应用
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 92 道试题
1 . 在某次试验中,两个试验数据xy的统计结果如下面的表格1所示.
表格1

x

1

2

3

4

5

y

2

3

4

4

5


(1)在给出的坐标系中画出数据xy的散点图.
(2)补全表格2,根据表格2中的数据和公式求下列问题.
①求出关于的回归直线方程中的.
②估计当时,的值是多少?
表格2

序号

x

y

x2

xy

1

1

2

1

2

2

2

3

4

6

3

3

4

9

12

4

4

4

16

16

5

5

5

25

25

2018-10-01更新 | 334次组卷 | 1卷引用:黑龙江省海林市朝鲜族中学人教版高中数学选修1-2同步练习:第一章 统计案例单元测评
2 . 学生的学习除了在课堂上认真听讲,还有一个重要环节就是课后自主学习,人们普遍认为课后自主学习时间越多学习效果越好.某权威研究机构抽查了部分高中学生,对学生每天花在数学上的课后自主学习时间(分钟)和他们的数学成绩(分)做出了调查,得到一些数据信息并证实了正相关.“学霸”小李为了鼓励好朋友小王和小张努力学习,拿到了该机构的一份数据表格如下(其中部分数据被污染看不清),小李据此做出了散点图如下,并计算得到的方差为350,的相关系数).
   
   
(1)请根据所给数据求出的线性经验回归方程,并由此预测每天课后自主学习数学时间达到100分钟时的数学成绩;
(2)受到小李的鼓励,小王和小张决定在课后花更多的时间在数学学习上,小张把课后自主学习时间从20分钟增加到60分钟,而小王把课后自主学习时间从60分钟增加到100分钟.经过几个月的坚持,小张的数学成绩从50分提升到90分,但小王的数学成绩却只是从原来的100分提升到了115分.小王觉得很迷惑,课后学习时间每天同样增加了40分钟,为什么自己的成绩仅仅提升了十几分呢,为什么实际成绩跟预测的成绩差别那么大呢?
①请根据你对课后自主学习时间与数学成绩的关系的看法及对一元回归模型的理解,解答小王的疑惑;
②小李为了解答小王的疑惑,想办法拿到了上表中被污染的数据如下.据此,请在上图中补齐散点图,并给出一个合适的经验回归方程类型(不必求出具体方程,不必说明理由).

编号

14

15

16

17

18

x

85

90

100

110

120

y

113

114

117

119

119

附:回归方程中斜率和截距的最小二乘估计公式分别为.
2023-07-09更新 | 137次组卷 | 1卷引用:福建省泉州市部分中学2022-2023学年高二下期末联考数学试题
3 . 某公司为了研究年宣传费(单位:千元)对销售量(单位:吨)和年利润(单位:千元)的影响,搜集了近 8 年的年宣传费和年销售量数据:
12345678
3840444648505256
4555616365666768

(1)请补齐表格中 8 组数据的散点图,并判断中哪一个更适宜作为年销售量关于年宣传费的函数表达式?(给出判断即可,不必说明理由)

(2)若(1)中的,且产品的年利润的关系为,为使年利润值最大,投入的年宣传费应为何值?
2023高二下·上海·专题练习
解答题-作图题 | 适中(0.65) |
4 . 某中学,由于不断深化教育改革,办学质量逐年提高.2006年至2009年高考考入一流大学人数如下:
年份2006200720082009
高考上线人数116172220260
以年份为横坐标,当年高考上线人数为纵坐标建立直角坐标系,由所给数据描点作图(如图所示),从图中可清楚地看到这些点基本上分布在一条直线附近,因此,用一次函数来模拟高考上线人数与年份的函数关系,并以此来预测年高考一本上线人数.如下表:

年份

2006

2007

2008

2009

年份代码

1

2

3

4

实际上线人数

116

172

220

260

模拟上线人数

为使模拟更逼近原始数据,用下列方法来确定模拟函数.
表示各年实际上线人数,表示模拟上线人数,当最小时,模拟函数最为理想.试根据所给数据,预测年高考上线人数.
   
2023-08-17更新 | 55次组卷 | 2卷引用:核心考点12成对数据的统计分析-【满分全攻略】2022-2023学年高二数学下学期核心考点+重难点讲练与测试(沪教版2020选修一+选修二)
智能选题,一键自动生成优质试卷~
5 . 2020年是脱贫攻坚决战决胜之年.确保到2020年农村贫困人口实现脱贫,是我们党立下的军令状,脱贫攻坚越到最后时刻,越要响鼓重锤.某贫困地区截至2018年底,按照农村家庭人均年纯收入8000元的小康标准,该地区仅剩部分家庭尚未实现小康.现从这些尚未实现小康的家庭中随机抽取50户,得到这50户家庭2018年的家庭人均年纯收入的频率分布直方图.

(1)补全频率分布直方图,并求出这50户家庭人均年纯收入的中位数和平均数(同一组数据用该区间的中点值作代表)(精确到元);
(2)2019年7月,为估计该地能否在2020年全面实现小康,统计了该地当时最贫困的一个家庭2019年1至6月的人均月纯收入如下表:
月份/2019(时间代码123456
人均月纯收入(元)275365415450470485
由散点图及相关性分析发现:家庭人均月纯收入与时间代码之间具有较强的线性相关关系,试求出回归直线方程.
附:.
2020-12-17更新 | 1070次组卷 | 1卷引用:安徽省六安市第一中学2020-2021学年高二上学期第二次段考数学(文)试题
6 . 下面给出四种说法:
①用相关指数来刻画回归效果,越小,说明模型的拟合效果越好;
②命题P:“”的否定是¬P:“”;
③设随机变量X服从正态分布,若,则
④回归直线一定过样本点的中心.
其中正确的说法有___________(请将你认为正确的说法的序号全部填写在横线上)
2023-09-14更新 | 129次组卷 | 1卷引用:河南省南阳市唐河县第一高级中学2022-2023学年高二下学期2月月考数学试题
7 . 近几年,电商的蓬勃发展带动了快递行业的迅速增长.为了获得更大的利润,某快递公司在城市的网点对“一天中收发一件块递的平均成本(单位:元)与当天揽收的快递件数(单位:千件)之间的关系”进行调查研究,得到相关数据如下表:

每天揽收快递件数(千件)

2

3

4

5

8

每件快递的平均成本(元)

5.6

4.8

4.4

4.3

4.1

根据以上数据,技术人员分别根据甲、乙两种不同的回归模型,得到两个经验回归方程:方程甲:,方程乙:
(1)为了评价两种模型的拟合效果,完成以下问题:
①根据上表数据和相应回归方程,将以下表格填写完整(结果保留一位小数):
每天揽收快递件数xi/千件23458
每件快递的平均成本yi/元5.64.84.44.34.1
模型甲预报值5.254.8

随机误差-0.40.20.4

模型乙预报值5.54.84.5

随机误差-0.100.1

( 备注:称为相应于点的随机误差)
②分别计算模型甲与模型乙的随机误差平方和并依此判断哪个模型的拟合效果更好.
(2)已知该快递网点每天能揽收的快递件数(单位:千件)与揽收一件快递的平均价格(单位:元)之间的关系是,根据(1)中拟合效果较好的模型建立的回归方程解决以下问题:
①若一天揽收快递6千件,则当天总利润的预报值是多少?
②为使每天获得的总利润最高,该快递网点应该将揽收一件快递的平均价格定为多少?(备注:利润=价格-成本)
2023-07-27更新 | 186次组卷 | 2卷引用:福建省三明市2022-2023学年高二下学期7月期末数学试题
8 . 乒乓球运动在我国非常普及,被定为“国球”.有非常多的青少年从小就接受系统的训练,所以基本功非常扎实,把乒乓球打到对方球台的指定位置是乒乓球运动的基本功之一,打100个球,若有大于90个打到对方球台的指定位置,则称为“优秀”,否则称为“一般”,在练球时,打球动作有“规范动作”和“不规范动作”两种,且在接受训练的学员中,将训练满10次而不满20次记为1组,训练满20次而不满30次记为2组,如此,,训练满次而不满次记为组.某乒乓球训练部门为了以后优化训练,在“规范动作”和“不规范动作”的两群体中,在组数15组中各随机抽取10人,即两群体中各抽取50人,进行测试得出的关于“优秀”、“一般”的表1和表2如下.表1:
有“规范动作”的学员测试结果(“优秀”个数)
组数12345
“优秀”数12467
表2:有“不规范动作”的学员测试结果(“优秀”个数)
组数12345
“优秀”数01234
(1)填写以下表格,依据小概率值的独立性检验分析,推断“优秀”和“一般”与练球时的“规范动作”是否有关.
“优秀”“一般”合计
“规范动作”50
“不规范动作”50
合计
(2)在有“规范动作”的学员测试结果中,表示组数,表示“优秀”个数,由表1求平均值关于的经验回归方程.
参考数据及公式:.
0.150.100.050.0250.0100.0050.001
2.0722.7063.8415.0246.6357.87910.828
.
2023-07-09更新 | 58次组卷 | 1卷引用:河北省邢台市2022-2023学年高二下学期期末数学试题
9 . 2020年是我国全面建成小康社会和“十三五”规划收官之年,作为制造业城市,某市一直坚持把创新摆在制造业发展全局的前置位置和核心位置,在推动制造业高质量发展的大环境下,某市某工厂统筹各类资源,进行了积极的改造探索,下表是该工厂每月生产的一种核心产品的产量)(件)与相应的生产总成本(万元)的四组对照数据:
57911
200298431609
工厂研究人员建立了的两种回归模型,利用计算机算得近似结果如下:
模型①:
模型②:
其中模型①的残差图如图所示:

(1)在下表中填写模型②的残差(残差真实值预报值),判断哪一个模型更适宜作为关于的回归方程?并说明理由.
57911
200298431609
残差
(2)研究人员统计了20个月的产品销售单价,得到频数分布表如下:
销售单价分组(万元)
频数1064
若以这20个月销售单价的平均值定为今后的月销售单价(同一组中的数据用该组区间的中点值作代表),结合你对(1)的判断当月产量为12件时,预测当月的利润.
2020-08-06更新 | 184次组卷 | 1卷引用:湖北省黄冈中学2020届高三下学期6月第二次模拟考试文科数学试题
10 . 随着生活水平的逐步提高,人们对文娱活动的需求与日俱增,其中观看电视就是一种老少皆宜的娱乐活动.但是我们在观看电视娱乐身心的同时,也要注意把握好观看时间,近期研究显示,一项久坐的生活指标——看电视时间,是导致视力下降的重要因素,即看电视时间越长,视力下降的风险越大.研究者在某小区统计了每天看电视时间(单位:小时)与视力下降人数的相关数据如下:
编号12345
11.522.53
1216222426

(1)请根据上面的数据求关于的线性回归方程
(2)我们用(1)问求出的线性回归方程估计回归方程,由于随机误差,所以 的估计值,成为点()的残差.
①填写下面的残差表,并绘制残差图;
编号12345
11.522.53
1216222426


②若残差图所在带状区域宽度不超过4,我们则认为该模型拟合精度比较高,回归方程的预报精度较高,试根据①绘制的残差图分析该模型拟合精度是否比较高?
附:回归直线的斜率和截距的最小二乘估计分别为
2020-06-25更新 | 457次组卷 | 1卷引用:河南省洛阳市2020届高三第三次统一考试文科数学(文)试题
共计 平均难度:一般