组卷网 > 知识点选题 > 统计案例
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 77 道试题
1 . 受疫情的影响,各实体商铺的销售额受到了不同程度的冲击,某小商品批发市场的管理部门提出了“线上线下两不误,打赢销售攻坚战”的口号,鼓励小商品批发市场内的所有商户开展线上销售活动.管理部门为了调查商户每天销售额与每天线上销售时间之间的相关关系,对小商品批发市场内的商户随机选取45家进行跟踪调查,其中每日线上销售时间不少于6小时的商户有19家,余下的商户中,每天的销售额不足3万元的占,统计后得到如下 列联表:

销售额不少于3万元

销售额不足3万元

合计

线上销售时间不少于6小时

4

19

线上销售时间不足6小时

合计

45

(1)请完成上面的列联表,并判断是否所有99%的把握认为“小商品批发市场内的商户每天销售额与商户每天线上销售时间有关.”
(2)(i)按分层抽样的方法,在上述样本中从销售额不少于3万元和销售额不足3万元的两组商户上抽取9家商户,设抽到销售额不足3万元且每天线上销售时间不足6小时的人数是,求的分布列(概率用组合数算式表示);
ii)若将频率视为概率,从小商品批发市场内所有商户中每天销售额不少于3万元的商户中随机抽取20家,求这些商户中每天线上销售时间不少于6小时的商户家数的数学期望和方差.
附:

0.10

0.05

0.025

0.010

0.005

0.001

2.706

3.841

5.024

6.635

7.879

10.828

参考公式:,其中 .
2020-12-21更新 | 2253次组卷 | 8卷引用:安徽省六安市第一中学2021-2022学年高二下学期期中数学试题
2 . 为了研究黏虫孵化的平均温度(单位:)与孵化天数之间的关系,重庆八中高2022级某课外兴趣小组通过试验得到如下6组数据:

组号

1

2

3

4

5

6

平均温度

15.3

16.8

17.4

18

19.5

21

孵化天数

16.7

14.8

13.9

13.5

8.4

6.2

他们分别用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图:

经计算得
(Ⅰ)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?(给出判断即可,不必说明理由)
(Ⅱ)残差绝对值大于1的数据被认为是异常数据,需要剔除,剔除后应用最小二乘法建立关于的线性回归方程.(系数精确到0.1)
参考公式:回归方程中斜率和截距的最小二乘法估计公式分别为:
2021-07-14更新 | 415次组卷 | 7卷引用:安徽省蚌埠市2022届高三下学期第四次教学质量检查文科数学试题
3 . 随着新冠肺炎疫情的爆发和蔓延,国家加强了传染病学的研究.在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患者的相关信息,得到如下表格:
潜伏期
(单位:天)
人数802003202501003020
(1)求这1000名患者的潜伏期的样本平均数(同一组中的数据用该组区间的中点值作代表);
(2)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期为标准进行分层抽样,从上述1000名患者中抽取100人,得到如下列联表:
潜伏期潜伏期总计
60岁以上(含60岁)50
60岁以下35
100
请将列联表补充完整,并根据列联表判断是否有95%的把握认为传染病潜伏期与患者年龄有关;
(3)在条件(2)得到的100人样本中,从潜伏期超过10天的人中,随机选取3人进行抽血化验,问恰好有一人潜伏期超过12天的概率?
附:

,其中.
4 . 云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较两品种茶叶的产量,某季采摘时,随机选取种植两品种茶叶的茶园各30亩,得到亩产量(单位:亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):

亩产不低于的茶园称为“高产茶园”,其它称为“非高产茶园”.
(1)请根据已知条件完成以下列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?
A品种茶叶(亩数)B品种茶叶(亩数)合计
高产茶园
非高产茶园
合计

(2)用样本估计总体,将频率视为概率,现从该种植基地品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为,求的分布列和数学期望
附:

0.050

0.010

0.001

3.841

6.635

10.828


5 . 2019年的“金九银十”变成“铜九铁十”,国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.如图是该地某小区2018年11月至2019年1月间,当月在售二手房均价(单位:万元平方米)的散点图.(图中月份代码1~13分别对应2018年11月~2019年11月)

根据散点图选择两个模型进行拟合,经过数据处理得到两个回归方程分别为,并得到以下一些统计量的值:

0.000591

0.000164

0.006050


(1)请利用相关指数判断哪个模型的拟合效果更好;
(2)某位购房者拟于2020年4月购买这个小区平方米的二手房(欲购房为其家庭首套房).
若购房时该小区所有住房的房产证均已满2但未满5年,请你利用(1)中拟合效果更好的模型解决以下问题:
i)估算该购房者应支付的购房金额;(购房金额房款税费,房屋均价精确到0.001万元平方米)
ii)若该购房者拟用不超过100万元的资金购买该小区一套二手房,试估算其可购买的最大面积.(精确到1平方米)
附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按房屋的计税价格(计税价格房款)进行征收的.
房产证满2年但未满5年的征收方式如下:首套面积90平方米以内(含90平方米)为;首套面积90平方米以上且140平方米以内(含140平方米);首套面积140平方米以上或非首套为
参考数据:
参考公式:相关指数
2020-07-22更新 | 547次组卷 | 9卷引用:安徽省合肥市双凤高级中学2022届高三三模文科数学试题
6 . 党的十九大明确把精准脱贫作为决胜全面建成小康社会必须打好的三大攻坚战之一,为坚决打赢脱贫攻坚战,某帮扶单位考察了甲、乙两种不同的农产品加工生产方式,现对两种生产方式加工的产品质量进行测试并打分对比,得到如下数据:
生产方式甲分值区间
频数20301004010
生产方式乙分值区间
频数2535605030

其中产品质量按测试指标可划分为:指标在区间上的为特优品,指标在区间上的为一等品,指标在区间上的为二等品.
(1)用事件表示“按照生产方式甲生产的产品为特优品”,估计的概率;
(2)填写下面列联表,并根据列联表判断能否有的把握认为“特优品”与生产方式有关?
特优品非特优品
生产方式甲
生产方式乙

(3)根据打分结果对甲、乙两种生产方式进行优劣比较.
附表:
0.100.0500.0100.001
2.7063.8416.63510.828

参考公式:,其中
7 . 某高中为了了解高三学生每天自主参加体育锻炼的情况,随机抽取了100名学生进行调查,其中女生有55名.下面是根据调查结果绘制的学生自主参加体育锻炼时间的频率分布直方图:

将每天自主参加体育锻炼时间不低于40分钟的学生称为体育健康A类学生,已知体育健康A类学生中有10名女生.
(Ⅰ)根据已知条件完成下面列联表,并据此资料你是否认为达到体育健康A类学生与性别有关?
非体育健康A类学生体育健康A类学生合计
男生
女生
合计

(Ⅱ)将每天自主参加体育锻炼时间不低于50分钟的学生称为体育健康类学生,已知体育健康类学生中有2名女生,若从体育健康类学生中任意选取2人,求至少有1名女生的概率.
附:
P0.050.0100.005
3.8416.6357.879

2020-02-27更新 | 448次组卷 | 5卷引用:安徽省滁州市定远县育才学校2021-2022学年高三下学期第二次月考数学(文)试题
8 . 随着智能手机的普及,手机计步软件迅速流行开来,这类软件能自动记载每个人每日健步的步数,从而为科学健身提供一定的帮助.某市工会为了解该市市民每日健步走的情况,从本市市民中随机抽取了2000名市民(其中不超过40岁的市民恰好有1000名),利用手机计步软件统计了他们某天健步的步数,并将样本数据分为九组(单位:千步),将抽取的不超过40岁的市民的样本数据绘制成频率分布直方图如右,将40岁以上的市民的样本数据绘制成频数分布表如下,并利用该样本的频率分布估计总体的概率分布.
分组
(单位:千步)
频数1020203040020020010020
(1)现规定,日健步步数不低于13000步的为“健步达人”,填写下面列联表,并根据列联表判断能否有%的把握认为是否为“健步达人”与年龄有关;
健步达人非健步达人总计
40岁以上的市民
不超过40岁的市民
总计
(2)(ⅰ)利用样本平均数和中位数估计该市不超过40岁的市民日健步步数(单位:千步)的平均数和中位数;
(ⅱ)由频率分布直方图可以认为,不超过40岁的市民日健步步数(单位:千步)近似地服从正态分布,其中近似为样本平均数(每组数据取区间的中点值),的值已求出约为.现从该市不超过40岁的市民中随机抽取5人,记其中日健步步数位于的人数为,求的数学期望.
参考公式:,其中.
参考数据:
,则.
11-12高二下·河南鹤壁·阶段练习
9 . 足球是世界普及率最高的运动,我国大力发展校园足球.为了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:
年份x20142015201620172018
足球特色学校y(百个)0.300.601.001.401.70
(1)根据上表数据,计算yx的相关系数r,并说明yx的线性相关性强弱.
(已知:,则认为yx线性相关性很强;,则认为yx线性相关性一般;,则认为yx线性相关性较弱):
(2)求y关于x的线性回归方程,并预测A地区2020年足球特色学校的个数(精确到个).
参考公式和数据:
2022-09-13更新 | 472次组卷 | 32卷引用:安徽省合肥市第一中学2022届高三下学期最后一卷文科数学试题
10 . 为了解网络外卖的发展情况,某调查机构从全国各城市中抽取了100个相同等级地城市,分别调查了甲乙两家网络外卖平台(以下简称外卖甲、外卖乙)在今年3月的订单情况,得到外卖甲该月订单的频率分布直方图,外卖乙该月订单的频数分布表,如下图表所示.
订单:(单位:万件)
频数1223
订单:(单位:万件)
频数402020102

(1)现规定,月订单不低于13万件的城市为“业绩突出城市”,填写下面的列联表,并根据列联表判断是否有90%的把握认为“是否为业绩突出城市”与“选择网络外卖平台”有关.
业绩突出城市业绩不突出城市总计
外卖甲
外卖乙
总计

(2)由频率分布直方图可以认为,外卖甲今年3月在全国各城市的订单数(单位:万件)近似地服从正态分布,其中近似为样本平均数(同一组数据用该区间的中点值作代表),的值已求出,约为3.64,现把频率视为概率,解决下列问题:
①从全国各城市中随机抽取6个城市,记为外卖甲在今年3月订单数位于区间的城市个数,求的数学期望;
②外卖甲决定在今年3月订单数低于7万件的城市开展“订外卖,抢红包”的营销活动来提升业绩,据统计,开展此活动后城市每月外卖订单数将提高到平均每月9万件的水平,现从全国各月订单数不超过7万件的城市中采用分层抽样的方法选出100个城市不开展营销活动,若每按一件外卖订单平均可获纯利润5元,但每件外卖平均需送出红包2元,则外卖甲在这100个城市中开展营销活动将比不开展营销活动每月多盈利多少万元?
附:①参考公式:,其中.
参考数据:
0.150.100.050.0250.0100.001
2.7022.7063.8415.0246.63510.828
②若,则.
共计 平均难度:一般