组卷网 > 知识点选题 > 最小二乘法
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 822 道试题
1 . 某市联考后从全体考生中随机抽取42名,获取他们本次考试的数学成绩和物理成绩,绘制成如图散点图:

根据散点图可以看出之间有线性相关关系,但图中有两个异常点.经调查得知,考生由于重感冒导致物理考试发挥失常,考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:,其中
分别表示这40名同学的数学成绩物理成绩,的相关系数.
(1)若不剔除两名考生的数据,用42组数据作回归分析,设此时的相关系数为.试判断的大小关系,并说明理由;
(2)求关于的线性回归方程,并估计如果考生参加了这次物理考试(已知考生的数学成绩为126分),物理成绩是多少?
(3)从概率统计规律看,本次考试该市的物理成绩服从正态分布,以剔除后的物理成绩作为样本,用样本平均数作为的估计值,用样本方差作为的估计值.试求该市共40000名考生中,物理成绩位于区间的人数的数学期望.
附:①回归方程中:
②若,则
2024-06-14更新 | 153次组卷 | 2卷引用:统计与成对数据的统计分析-综合测试卷B卷
2 . 书接上回.麻将学习小组中的炎俊同学在探究完问题后返回家中观看了《天才麻将少女》,发现超能力麻将和现实麻将存在着诸多不同.为了研究超能力麻将,他使用了一些”雀力值”和”能力值”来确定每位角色的超能力麻将水平,发现每位角色在一局麻将中的得分与个人值和该桌平均值之差存在着较大的关系.(注:平均值指的是该桌内四个人各自的“雀力值”和“能力值”之和的平均值,个人值类似.)为深入研究这两者的关系,他列出了以下表格:

个人值与平均值之差

0

3

6

9

得分

0

(1)①计算的相关系数,并判断之间是否基本上满足线性关系,注意:保留至第一位非9的数.
②求出的经验回归方程.
③以下为《天才麻将少女》中几位角色的”雀力值”和”能力值”:

角色

宫永照

园城寺怜

花田煌

松实玄

雀力值

24

9

10

4

能力值

24

16

3

6

试估计此四位角色坐在一桌打麻将每一位的得分(近似至百位)
(2)在分析了更多的数据后,炎俊发现麻将中存在着很多运气的成分.为衡量运气对于麻将对局的影响,炎俊建立了以下模型,其中他指出:实际上的得分并不是一个固定值,而是具有一定分布的,存在着一个标准差.运气实际上体现在这一分布当中取值的细微差别.接下去他便需要得出得分的标准差.他发现这一标准差来源自两个方面:一方面是在(1)②问当中方程斜率存在的标准差;另一方面则是在不影响平均值的情况下,实际表现“个人值”X符合正态分布规律.(为评估得出的个人值.)已知松实玄实际表现个人值满足,求(1)③中其得分的标准差.(四舍五入到百位)
(3)现在新提出了一种赛制:参赛者从平均值为10开始进行第一轮挑战,之后每一轮对手的”雀力值”和”能力值”均会提升至原来的.我们设进行了i轮之后,在前i轮内该参赛者的总得分为;若园城寺怜参加了此比赛,求
参考数据和公式:①.
②相关系数
经验回归方程
,其中为回归数据组数.
③对于随机变量.
时,
⑤对间接计算得出的值有标准差满足.
2024-05-08更新 | 719次组卷 | 2卷引用:8.5 二项分布、超几何分布与正态分布(高考真题素材之十年高考)
3 . 随着移动互联网和直播带货技术的发展,直播带货已经成为一种热门的销售方式,特别是商家通过展示产品,使顾客对商品有更全面的了解.下面统计了某新手开启直播带货后从6月份到10月份每个月的销售量(万件)的数据,得到如图所示的散点图.其中6月份至10月份相应的代码为,如:表示6月份.

(1)根据散点图判断,模型①与模型②哪一个更适宜作为月销售量关于月份代码的回归方程?(给出判断即可,不必说明理由)
(2)(i)根据(1)的判断结果,建立关于的回归方程;(计算结果精确到0.01)
(ⅱ)根据结果预测12月份的销售量大约是多少万件?
参考公式与数据:,其中.
2024-04-12更新 | 2911次组卷 | 7卷引用:9.2 成对数据的分析(高考真题素材之十年高考)
4 . 随着科技发展的日新月异,人工智能融入了各个行业,促进了社会的快速发展.其中利用人工智能生成的虚拟角色因为拥有更低的人工成本,正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货销售金额得到逐步提升,以下为该公司自2023年8月使用虚拟角色直播带货后的销售金额情况统计.

年月

2023年8月

2023年9月

2023年10月

2023年11月

2023年12月

2024年1月

月份编号

1

2

3

4

5

6

销售金额/万元

15.4

25.4

35.4

85.4

155.4

195.4

的相关关系拟用线性回归模型表示,回答如下问题:
(1)试求变量的样本相关系数(结果精确到0.01);
(2)试求关于的经验回归方程,并据此预测2024年2月份该公司的销售金额.(,均保留一位小数)
附:经验回归方程,其中
样本相关系数
参考数据:.
2024-04-10更新 | 841次组卷 | 13卷引用:热点8-2 概率与统计综合(10题型+满分技巧+限时检测)
智能选题,一键自动生成优质试卷~
5 . 近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:
年份20192020202120222023
充电桩数量x/万台13579
新能源汽车年销量y/万辆2537485872
(1)已知可用线性回归模型拟合yx的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为
参考数据:
2024-04-08更新 | 1260次组卷 | 5卷引用:2024年普通高等学校招生全国统一考试数学文科猜题卷(七)
6 . 20世纪80年代初,随着我国的改革开放,经济体制和经营体制逐渐灵活,市场上的商品日益丰富,城市和农村出现小卖部.小卖部主营生活日用商品,有着经营成本小、规模小、商品种类少、分布广等特点.近几年,市场商品极大的丰富,人们的生活水平达到了新的高度,实体小卖部逐渐被应运而生的大小超市所取代.为适应市场,某小卖部经营者欲将经营规模扩大,将小卖部发展成生鲜综合超市,现将2013~2022年的年利润(单位:万元)统计如下:
年限12345678910
年利润(万元)28912101315161718
其中,1表示2013年,2表示2014年,3表示2015年,……,以此类推,10表示2022年.
(1)若年利润(单位:万元)与小卖部营业年限成正相关关系,在不改变经营状态的情况下,预测该小卖部2023年的年利润.(结果保留两位小数)
(2)该小卖部经营者从2013~2022年中年利润不低于12万元的年限里随机抽取3个,记这3个年限中年利润超过14万元的有个,求的分布列和期望.
附:线性回归方程中,,其中为样本均值.
2024-04-08更新 | 614次组卷 | 5卷引用:8.4 离散型随机变量的分布列,期望与方差(高考真题素材之十年高考)
7 . 某市组织宣传小分队进行法律法规宣传,某宣传小分队记录了前9天每天普及的人数,得到下表:
时间(天)123456789
每天普及的人数y8098129150203190258292310
(1)从这9天的数据中任选4天的数据,以表示4天中每天普及人数不少于240人的天数,求的分布列和数学期望;
(2)由于统计人员的疏忽,第5天的数据统计有误,如果去掉第5天的数据,试用剩下的数据求出每天普及的人数y关于天数的线性回归方程.
(参考数据:

附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:).
2024-04-08更新 | 1188次组卷 | 5卷引用:8.5 二项分布、超几何分布与正态分布(高考真题素材之十年高考)
8 . 某农业大学组织部分学生进行作物栽培试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速度,达到预期标准,小明对自己培育的一株作物使用了营养液,现统计了使用营养液十天之内该作物的高度变化

天数x

1

2

3

4

5

6

7

8

9

10

作物高度y/cm

9

10

10

11

12

13

13

14

14

14

(1)观察散点图可知,天数与作物高度之间具有较强的线性相关性,用最小二乘法求出作物高度关于天数的线性回归方程(其中用分数表示);
(2)小明测得使用营养液后第22天该作物的高度为,请根据(1)中的结果预测第22天该作物的高度的残差.
参考公式:.参考数据:.
9 . 2023 年是全面贯彻落实党的二十大精神的开局之年,也是实施“十四五”规划承上启下的关键之年,经济增长呈现稳中有进的可喜现象.某省为做好刺梨产业的高质量发展,项目组统计了全省近5年刺梨产业综合产值如下:
年份代码x,综合产值y(单位:亿元)

年份

2019

2020

2021

2022

2023

年份代码x

1

2

3

4

5

综合产值y

1.5

2

3.5

8

15


(1)请通过样本相关系数,推断yx之间的相关程度;(若,则线性相关性程度很强;若,则线性相关性程度一般,若,则线性相关性程度很弱.)
(2)求出y关于x的经验回归方程,并预测 2024 年该省刺梨产业的综合产值.
参考公式:样本相关系数经验回归方程 中斜率和截距的最小二乘法估计公式分别为.
参考数据:
2024-03-21更新 | 984次组卷 | 6卷引用:【一题多变】 相关关系 回归分析
10 . 据新华社北京2月26日报道,中国航天全年预计实施100次左右发射任务,有望创造新的纪录,我国首个商业航天发射场将迎来首次发射任务,多个卫星星座将加速组网建设;中国航天科技集团有限公司计划安排近70次宇航发射任务,发射290余个航天器,实施一系列重大工程任务.由于航天行业拥有广阔的发展前景,有越来越多的公司开始从事航天研究,某航天公司研发了一种火箭推进器,为测试其性能,对推进器飞行距离与损坏零件数进行了统计,数据如下:

飞行距离x(kkm)

56

63

71

79

90

102

110

117

损坏零件数y(个)

61

73

90

105

119

136

149

163

参考数据:
(1)建立y关于x的回归模型,根据所给数据及回归模型,求y关于x的回归方程(精确到0.1,精确到1);
(2)该公司进行了第二项测试,从所有同型号推进器中随机抽取100台进行等距离飞行测试,对其中60台进行飞行前保养,测试结束后,有20台报废,其中保养过的推进器占比30%,请根据统计数据完成2×2列联表,并根据小概率值的独立性检验,能否认为推进器是否报废与保养有关?


保养

未保养

合计

报废



20

未报废




合计

60


100

附:回归方程中斜率和截距的最小二乘估计公式分别为

0.25

0.1

0.05

0.025

0.01

0.001

1.323

2.706

3.841

5.024

6.635

10.828

2024-03-20更新 | 1617次组卷 | 8卷引用:【一题多变】 分类变量 独立检验
共计 平均难度:一般