组卷网 > 知识点选题 > 回归分析
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 21 道试题
1 . 某校20名学生的数学成绩和知识竞赛成绩如下表:
学生编号i12345678910
数学成绩100999693908885838077
知识竞赛成绩29016022020065709010060270
学生编号i11121314151617181920
数学成绩75747270686660503935
知识竞赛成绩4535405025302015105
计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记中的排名是第位,中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记.证明:
(ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.
.
2023-11-01更新 | 1393次组卷 | 11卷引用:重庆市北碚区西南大学附中2024届高三上学期11月模拟测试数学试题
2 . 移动物联网广泛应用于生产制造、公共服务、个人消费等领域.截至2022年底,我国移动物联网连接数达亿户,成为全球主要经济体中首个实现“物超人”的国家.下图是2018-2022年移动物联网连接数与年份代码的散点图,其中年份2018-2022对应的分别为1~5.

(1)根据散点图推断两个变量是否线性相关.计算样本相关系数(精确到),并推断它们的相关程度;
(2)求关于的经验回归方程,并预测2024年移动物联网连接数.
附:样本相关系数
3 . 党的二十大报告提出:“必须坚持科技是第一生产力、人才是第一资源、创新是第一动力,深入实施科教兴国战略、人才强国战略、创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势.”某数字化公司为加快推进企业数字化进程,决定对其核心系统DAP,采取逐年增加研发人员的办法以提升企业整体研发和创新能力.现对2018~2022年的研发人数作了相关统计(年份代码1~5分别对应2018~2022年)如下折线图:

(1)根据折线统计图中数据,计算该公司研发人数与年份代码的相关系数,并由此判断其相关性的强弱;
(2)试求出关于的线性回归方程,并预测2023年该公司的研发人数(结果取整数).
参考数据:认为两个变量间的相关性较强
参考公式相关系数
回归方程中的斜率和截距的最小二乘法估计公式分别为.
2023-02-09更新 | 1505次组卷 | 7卷引用:重庆市南开中学2023届高三第六次质量检测数学试题
4 . 为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2021年种植的一批试验紫甘薯在温度升高时6组死亡的株数.
温度/℃212324272930
死亡数/株61120275777
经计算,
,其中分别为试验数据中的温度和死亡株数,.
(1)若用一元线性回归模型,求关于的经验回归方程
(2)若用非线性回归模型求得关于的非线性经验回归方程,且相关指数为.
(ⅰ)试与(1)中的回归模型相比,用说明哪种模型的拟合效果更好;
(ii)用拟合效果好的模型预测温度为35℃时该批紫甘薯的死亡株数(结果取整数).
附:对于一组数据其回归直线的斜率和截距的最小二乘估计分别为:相关指数为:.
智能选题,一键自动生成优质试卷~
5 . 某公众号根据统计局统计公报提供的数据,对我国2015—2021年的国内生产总值GDP进行统计研究,做出如下2015—2021年GDPGDP实际增长率的统计图表.通过统计数据可以发现,GDP呈现逐年递增趋势.2020年,GDP增长率出现较明显降幅,但GDP却首次突破100万亿.现统计人员选择线性回归模型,对年份代码x和年度实际GDP增长率进行回归分析.
年份2015年2016年2017年2018年2019年2020年2021年
年度GDP(亿元)688858.2746395.1832035.9919281.1986515.21015986.21143669.7
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1

(1)用第1到第7年的数据得到年度实际GDP增长率关于年份代码x的回归方程近似为:,对该回归方程进行残差分析,得到下表,视残差的绝对值超过1.5的数据为异常数据.
年份代码x1234567
GDP实际增长率7.06.86.96.76.02.38.1
GDP增长率估计值6.986.506.266.025.54
残差0.020.400.74-0.022.56
将以上表格补充完整,指出GDP增长率出现异常数据的年份及异常现象,并根据所学统计学知识,结合生活实际,推测GDP增长率出现异常的可能原因;
(2)剔除(1)中的异常数据,用最小二乘法求出回归方程:,并据此预测数据异常年份的GDP增长率.
附:
2022-05-06更新 | 753次组卷 | 3卷引用:重庆市南开中学校2022届高三第九次质量检测数学试题
6 . 身高体重指数(BMI)的大小直接关系到人的健康状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测量其身高、体重的数据如下表.

学生编号

1

2

3

4

5

身高x/cm

l65

170

175

170

170

体重y/kg

58

67

67

65

63

(1)求体重关于身高的线性回归方程,并预测身高为180cm的同学的体重;
(2)试分析学生的体重差异约有多少是由身高引起的?(注:结果保留两位小数)参考公式:线性回归方程中,,其中为样本平均值,.
2022-05-03更新 | 1341次组卷 | 7卷引用:重庆市第八中学校2022届高三下学期高考适应性强化训练(四)数学试题
7 . 某省为了坚决打赢脱贫攻坚战,在100个贫困村中,用简单随机抽样的方法抽取15个进行脱贫验收调查,调查得到的样本数据,其中分别表示第i个贫困村中贫困户的年平均收入(单位:万元)和产业扶贫资金投入数量(单位:万元),并计算得到
(1)试估计该省贫困村的贫困户年平均收入;
(2)根据样本数据,求该省贫困村中贫困户年平均收入与产业扶贫资金投入的相关系数(精确到0.01);
(3)根据现有统计资料,各贫困村产业扶贫资金投入差异很大.为了确保完成脱贫攻坚任务,准确地进行脱贫验收,请给出一种你认为更合理的抽样方法,并说明理由.
参考公式:
2022-09-07更新 | 1539次组卷 | 13卷引用:重庆市育才中学2022届高三二诊模拟(二)数学试题
8 . 2021年某公司为了提升一项产品的竞争力和市场占有率,对该项产品进行了科技创新和市场开发,经过一段时间的运营后,统计得到xy之间的五组数据如下表:

x

1

2

3

4

5

y

9

11

14

26

20

其中,x(单位:百万元)是科技创新和市场开发的总投入,y(单位:百万元)是科技创新和市场开发后的收益.
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:

满意

不满意

总计

45

10

55

25

20

45

总计

70

30

100

是否有99%的把握认为消费者满意程度与性别有关?
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①
,其中.
临界值表:

0.100

0.050

0.025

0.010

0.001

2.706

3.841

5.024

6.635

10.828

参考数据:.
2022-04-17更新 | 966次组卷 | 1卷引用:重庆市2022届高三学业质量调研抽测(第二次)数学试题
9 . 规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:

1

2

3

4

5

232

98

60

40

20

关于的回归方程,并预测成功的总人数(精确到1);
(3)证明:
附:经验回归方程系数:
参考数据:(其中).
2022-04-08更新 | 6757次组卷 | 16卷引用:重庆市缙云教育联盟2022届高三第二次诊断性检测数学试题
10 . 近几年,快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本y(单位:元)与当天揽收的快递件数x(单位:千件)之间的关系,对该网点近5天的每日揽件量(单位:千件)与当日收发一件快递的平均成本(单位;元)(i=1,2,3,4,5)数据进行了初步处理,得到下面的散点图及一些统计量的值.
45.160.4152.028300.507
表中.
(1)根据散点图判断,哪一个适宜作为y关于x的回归方程类型?并根据判断结果及表中数据求出y关于x的回归方程;
(2)各快递业为提高快递揽收量并实现总利润的增长,除了提升服务质量提高时效保障外,价格优惠也是重要策略之一.已知该网点每天揽收快递的件数x(单位:千件)与单件快递的平均价格t(单位;元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的回归方程解决以下问题:
①预测该网点某天揽收2000件快递可获得的总利润;
②单件快递的平均价格为何值时,该网点一天内收发快递所获利润的预报值最大?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为
2021-06-10更新 | 2220次组卷 | 5卷引用:重庆市2021届高三高考数学第三次联合诊断检测试题
共计 平均难度:一般