名校
1 . 某公众号根据统计局统计公报提供的数据,对我国2015—2021年的国内生产总值GDP进行统计研究,做出如下2015—2021年GDP和GDP实际增长率的统计图表.通过统计数据可以发现,GDP呈现逐年递增趋势.2020年,GDP增长率出现较明显降幅,但GDP却首次突破100万亿.现统计人员选择线性回归模型,对年份代码x和年度实际GDP增长率进行回归分析.
(1)用第1到第7年的数据得到年度实际GDP增长率关于年份代码x的回归方程近似为:,对该回归方程进行残差分析,得到下表,视残差的绝对值超过1.5的数据为异常数据.
将以上表格补充完整,指出GDP增长率出现异常数据的年份及异常现象,并根据所学统计学知识,结合生活实际,推测GDP增长率出现异常的可能原因;
(2)剔除(1)中的异常数据,用最小二乘法求出回归方程:,并据此预测数据异常年份的GDP增长率.
附:,
年份 | 2015年 | 2016年 | 2017年 | 2018年 | 2019年 | 2020年 | 2021年 |
年度GDP(亿元) | 688858.2 | 746395.1 | 832035.9 | 919281.1 | 986515.2 | 1015986.2 | 1143669.7 |
年份代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
GDP实际增长率 | 7.0 | 6.8 | 6.9 | 6.7 | 6.0 | 2.3 | 8.1 |
(1)用第1到第7年的数据得到年度实际GDP增长率关于年份代码x的回归方程近似为:,对该回归方程进行残差分析,得到下表,视残差的绝对值超过1.5的数据为异常数据.
年份代码x | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
GDP实际增长率 | 7.0 | 6.8 | 6.9 | 6.7 | 6.0 | 2.3 | 8.1 |
GDP增长率估计值 | 6.98 | 6.50 | 6.26 | 6.02 | 5.54 | ||
残差 | 0.02 | 0.40 | 0.74 | -0.02 | 2.56 |
(2)剔除(1)中的异常数据,用最小二乘法求出回归方程:,并据此预测数据异常年份的GDP增长率.
附:,
您最近半年使用:0次
2022-05-06更新
|
746次组卷
|
3卷引用:重庆市南开中学校2022届高三第九次质量检测数学试题
重庆市南开中学校2022届高三第九次质量检测数学试题四川省绵阳中学实验学校2022届高考模拟(一)文科数学试题(已下线)考点28 统计-2-(核心考点讲与练)-2023年高考数学一轮复习核心考点讲与练(新高考专用)
名校
解题方法
2 . 身高体重指数(BMI)的大小直接关系到人的健康状况,某高中高三(1)班班主任为了解该班学生的身体健康状况,从该班学生中随机选取5名学生,测量其身高、体重的数据如下表.
(1)求体重关于身高的线性回归方程,并预测身高为180cm的同学的体重;
(2)试分析学生的体重差异约有多少是由身高引起的?(注:结果保留两位小数)参考公式:线性回归方程中,,,其中,为样本平均值,.
学生编号 | 1 | 2 | 3 | 4 | 5 |
身高x/cm | l65 | 170 | 175 | 170 | 170 |
体重y/kg | 58 | 67 | 67 | 65 | 63 |
(2)试分析学生的体重差异约有多少是由身高引起的?(注:结果保留两位小数)参考公式:线性回归方程中,,,其中,为样本平均值,.
您最近半年使用:0次
2022-05-03更新
|
1282次组卷
|
7卷引用:重庆市第八中学校2022届高三下学期高考适应性强化训练(四)数学试题
重庆市第八中学校2022届高三下学期高考适应性强化训练(四)数学试题(已下线)专题51:回归分析-2023届高考数学一轮复习精讲精练(新高考专用)广东省四会市四会中学、广信中学2021-2022学年高二下学期第二次联考数学试题(已下线)章节综合测试-成对数据的统计分析(已下线)模块二 专题3 分层抽样的样本平均数、百分位数、残差(已下线)模块三 专题6大题分类练(统计) 拔高能力练(已下线)专题05 成对数据的统计分析压轴题(1)
名校
3 . 某省为了坚决打赢脱贫攻坚战,在100个贫困村中,用简单随机抽样的方法抽取15个进行脱贫验收调查,调查得到的样本数据,其中和分别表示第i个贫困村中贫困户的年平均收入(单位:万元)和产业扶贫资金投入数量(单位:万元),并计算得到,,,,.
(1)试估计该省贫困村的贫困户年平均收入;
(2)根据样本数据,求该省贫困村中贫困户年平均收入与产业扶贫资金投入的相关系数(精确到0.01);
(3)根据现有统计资料,各贫困村产业扶贫资金投入差异很大.为了确保完成脱贫攻坚任务,准确地进行脱贫验收,请给出一种你认为更合理的抽样方法,并说明理由.
参考公式:
(1)试估计该省贫困村的贫困户年平均收入;
(2)根据样本数据,求该省贫困村中贫困户年平均收入与产业扶贫资金投入的相关系数(精确到0.01);
(3)根据现有统计资料,各贫困村产业扶贫资金投入差异很大.为了确保完成脱贫攻坚任务,准确地进行脱贫验收,请给出一种你认为更合理的抽样方法,并说明理由.
参考公式:
您最近半年使用:0次
2022-09-07更新
|
1438次组卷
|
13卷引用:重庆市育才中学2022届高三二诊模拟(二)数学试题
重庆市育才中学2022届高三二诊模拟(二)数学试题新疆2021届高三年级第一次联考数学(理)试题新疆2020-2021学年高三上学期第一次联考文科数学试题新疆2021届高三年级第一次联考文科数学试题人教A版(2019) 选修第三册 过关斩将 第八章 8.1.1变量的相关关系+8.1.2样本相关系数陕西省咸阳市2021-2022学年高二下学期期末文科数学试题陕西省咸阳市2021-2022学年高二下学期期末理科数学试题沪教版(2020) 选修第二册 单元训练 第8章 成对数据的统计分析 单元测试黑龙江哈尔滨工业大学附属中学校 2021-2022学年高二下学期期末理科数学试题(已下线)8.1 成对数据的统计相关性(2)(已下线)第12讲 变量间的相关关系6种题型总结(2)(已下线)8.1.2 样本相关系数(分层作业)-【上好课】2022-2023学年高二数学同步备课系列(人教A版2019选修第三册)(已下线)第8章 成对数据的统计分析【单元提升卷】-【满分全攻略】2022-2023学年高二数学下学期核心考点+重难点讲练与测试(沪教版2020选修一+选修二)
名校
4 . 数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-2021年中国在线直播用户规模(单位:亿人),其中2017年-2021年对应的代码依次为1-5.
(1)由上表数据可知,可用函数模型拟合y与x的关系,请建立y关于x的回归方程(,的值精确到0.01);
(2)已知中国在线直播购物用户选择在品牌官方直播间购物与不在品牌官方直播间购物的人数之比为4:1,按照分层抽样从这两类用户中抽取5人,再从这5人中随机抽取2人,求这2人全是选择在品牌官方直播间购物用户的概率.
参考数据:,,,其中.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
年份代码x | 1 | 2 | 3 | 4 | 5 |
市场规模y | 3.98 | 4.56 | 5.04 | 5.86 | 6.36 |
(2)已知中国在线直播购物用户选择在品牌官方直播间购物与不在品牌官方直播间购物的人数之比为4:1,按照分层抽样从这两类用户中抽取5人,再从这5人中随机抽取2人,求这2人全是选择在品牌官方直播间购物用户的概率.
参考数据:,,,其中.
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
您最近半年使用:0次
2022-04-24更新
|
1855次组卷
|
8卷引用:重庆市二0三中学校2021-2022学年高二下学期第二次月考数学试题
重庆市二0三中学校2021-2022学年高二下学期第二次月考数学试题重庆市2023届高三下学期3月月度质量检测数学试题山西省2022届高三第二次模拟数学(文)试题(已下线)文科数学-2022年高考考前押题密卷(全国甲卷)四川省射洪市2022届高三下学期高考模拟测试文科数学试题广西贵港市高级中学2022届高三毕业班5月模拟考试数学(理)试题山西省朔州怀仁市2022届高三第三次模拟数学(文)试题(已下线)第八章 成对数据的统计分析 全章题型大总结 (精讲)-【精讲精练】2022-2023学年高二数学下学期同步精讲精练(人教A版2019选择性必修第三册)
名校
解题方法
5 . “不关注分数,就是对学生的今天不负责:只关注分数,就是对学生的未来不负责.”为锻炼学生的综合实践能力,长沙市某中学组织学生对雨花区一家奶茶店的营业情况进行调查统计,得到的数据如下:
(1)设.试建立y关于x的非线性回归方程和(保留2位有效数字);
(2)从相关系数的角度确定哪一个模型的拟合效果更好,并据此预测次年2月()的净利润(保留1位小数).
附:①相关系数,回归直线中斜率和截距的最小二乘估计公式分别为;②参考数据:,
月份x | 2 | 4 | 6 | 8 | 10 | 12 |
净利润(万元〕y | 0.9 | 2.0 | 4.2 | 3.9 | 5.2 | 5.1 |
(2)从相关系数的角度确定哪一个模型的拟合效果更好,并据此预测次年2月()的净利润(保留1位小数).
附:①相关系数,回归直线中斜率和截距的最小二乘估计公式分别为;②参考数据:,
您最近半年使用:0次
2022-04-22更新
|
2347次组卷
|
4卷引用:重庆市万州第二高级中学2021-2022学年高二下学期六月第一次质量检测数学试题
重庆市万州第二高级中学2021-2022学年高二下学期六月第一次质量检测数学试题湖南省长沙市雅礼中学等十六校2022届高三下学期第二次联考数学试题(已下线)押新高考第20题 统计概率-备战2022年高考数学临考题号押题(新高考专用)(已下线)考点28 统计-2-(核心考点讲与练)-2023年高考数学一轮复习核心考点讲与练(新高考专用)
名校
6 . 下列说法正确的有( )
A.一组数据按大小顺序排列,位于最中间的一个数据就是中位数 |
B.分层抽样为保证每个个体等可能入样,需在各层中进行简单随机抽样 |
C.若A∩B为不可能事件,A∪B为必然事件,则事件A与事件B互为对立事件 |
D.线性回归分析中,的值越小,说明残差平方和越小,则模型拟合效果越好 |
您最近半年使用:0次
2022-04-22更新
|
1134次组卷
|
3卷引用:重庆市第八中学校2022-2023学年高三上学期期中学情检验数学试题
重庆市第八中学校2022-2023学年高三上学期期中学情检验数学试题湖南省长沙市雅礼中学等十六校2022届高三下学期第二次联考数学试题(已下线)专题42:随机抽样-2023届高考数学一轮复习精讲精练(新高考专用)
7 . 2021年某公司为了提升一项产品的竞争力和市场占有率,对该项产品进行了科技创新和市场开发,经过一段时间的运营后,统计得到x,y之间的五组数据如下表:
其中,x(单位:百万元)是科技创新和市场开发的总投入,y(单位:百万元)是科技创新和市场开发后的收益.
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:
是否有99%的把握认为消费者满意程度与性别有关?
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①;
②,其中.
临界值表:
参考数据:.
x | 1 | 2 | 3 | 4 | 5 |
y | 9 | 11 | 14 | 26 | 20 |
(1)求相关系数r的大小(精确到0.01),并判断科技创新和市场开发后的收益y与科技创新和市场开发的总投入x的线性相关程度;
(2)该公司对该产品的满意程度进行了调研,在调研100名男女消费者中,得到的数据如下表:
满意 | 不满意 | 总计 | |
男 | 45 | 10 | 55 |
女 | 25 | 20 | 45 |
总计 | 70 | 30 | 100 |
(3)对(2)中调研的45名女消费者,按照其满意程度进行分层抽样,从中抽出9名女消费者到公司进行现场考察,再从这9名女消费者中随机抽取4人进行深度调研,设这4人中选择“满意”的人数为X,求X的分布列及数学期望.
参考公式:①;
②,其中.
临界值表:
0.100 | 0.050 | 0.025 | 0.010 | 0.001 | |
2.706 | 3.841 | 5.024 | 6.635 | 10.828 |
您最近半年使用:0次
名校
解题方法
8 . 规定抽球试验规则如下:盒子中初始装有白球和红球各一个,每次有放回的任取一个,连续取两次,将以上过程记为一轮.如果每一轮取到的两个球都是白球,则记该轮为成功,否则记为失败.在抽取过程中,如果某一轮成功,则停止;否则,在盒子中再放入一个红球,然后接着进行下一轮抽球,如此不断继续下去,直至成功.
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:
求关于的回归方程,并预测成功的总人数(精确到1);
(3)证明:.
附:经验回归方程系数:,;
参考数据:,,(其中,).
(1)某人进行该抽球试验时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,有1000名数学爱好者独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:
1 | 2 | 3 | 4 | 5 | |
232 | 98 | 60 | 40 | 20 |
(3)证明:.
附:经验回归方程系数:,;
参考数据:,,(其中,).
您最近半年使用:0次
2022-04-08更新
|
6603次组卷
|
16卷引用:重庆市缙云教育联盟2022届高三第二次诊断性检测数学试题
重庆市缙云教育联盟2022届高三第二次诊断性检测数学试题山东省青岛市2022届三下学期一模数学试题湖北省襄阳市第五中学2022届高三下学期适应性考试(三)数学试题(已下线)秘籍11 统计与概率-备战2022年高考数学抢分秘籍(全国通用)(已下线)第01讲 线性回归分析-【帮课堂】2021-2022学年高二数学同步精品讲义(苏教版2019选择性必修第二册)(已下线)2022年高考考前20天终极冲刺攻略(三)【数学】(新高考地区专用)(6月4日)(已下线)2022年高考考前20天终极冲刺攻略(四)【理科数学】(6月2日)江苏省无锡市天一中学2021-2022学年高二强化班下学期期中数学试题江苏省南京市金陵中学2022届高三学业水平选择性模拟考前最后一卷数学试题(已下线)8.6 分布列与其他知识综合运用(精讲)(已下线)专题17 概率与统计的创新题型(已下线)专题26 概率综合问题(分布列)(解答题)(理科)-1广东省东莞外国语学校2024届高三上学期第一次月考数学试题广东省七校联合体2024届高三上学期开学第一次联考(8月)数学试题专题16回归分析(已下线)专题05 成对数据的统计分析压轴题(1)
9 . 下列说法正确的是( )
A.若事件A与B互相独立,且,则 |
B.设随机变量X服从正态分布.则 |
C.在回归分析中,对一组给定的样本数据而言,若残差平方和越大,则模型的拟合效果越差;反之,则模型的拟合效果越好 |
D.若随机变量服从二项分布,则 |
您最近半年使用:0次
名校
10 . 下列命题中,真命题的是( )
A.样本数据与样本数据,为非零常数,两组样本数据的样本平均数相同 |
B.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高 |
C.的二项展开式中,第项的二项式系数是 |
D.在线性回归模型中,相关指数越接近于,说明回归的效果越好 |
您最近半年使用:0次