组卷网 > 知识点选题 > 统计案例
更多: | 只看新题 精选材料新、考法新、题型新的试题
解析
| 共计 30 道试题
1 . 为提高学生的数学应用能力和创造力,学校打算开设“数学建模”选修课,为了解学生对“数学建模”的兴趣度是否与性别有关,学校随机抽取该校30名高中学生进行问卷调查,其中认为感兴趣的人数占70%.
感兴趣不感兴趣合计
男生12
女生5
合计30
(1)根据所给数据,完成下面的2×2列联表,并根据列联表判断,依据小概率值α=0.15的独立性检验,分析学生对“数学建模”选修课的兴趣度与性别是否有关?
(2)若感兴趣的女生中恰有4名是高三学生,现从感兴趣的女生中随机选出3名进行二次访谈,记选出高三女生的人数为X,求X的分布列与数学期望
附:,其中.
0.150.100.050.0250.0100.0050.001
2.0722.7063.8415.0246.6357.87910.828
2 . 红蜘蛛是柚子的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数y(个)和平均温度x(℃)有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.

   

(1)根据散点图判断,(其中…为自然对数的底数)哪一个更适合作为平均产卵数y(个)关于平均温度x(℃)的回归方程类型?(给出判断即可,不必说明理由)
(2)由(1)的判断结果及表中数据,求出y关于x的回归方程.(计算结果精确到0.1)
附:回归方程中

参考数据(

5215

17713

714

27

81.3

3.6

(3)根据以往每年平均气温以及对果园年产值的统计,得到以下数据:平均气温在22℃以下的年数占60%,对柚子产量影响不大,不需要采取防虫措施;平均气温在22℃至28℃的年数占30%,柚子产量会下降20%;平均气温在28℃以上的年数占10%,柚子产量会下降50%.为了更好的防治红蜘蛛虫害,农科所研发出各种防害措施供果农选择.
在每年价格不变,无虫害的情况下,某果园年产值为200万元,根据以上数据,以得到最高收益(收益=产值-防害费用)为目标,请为果农从以下几个方案中推荐最佳防害方案,并说明理由.
方案1:选择防害措施A,可以防止各种气温的红蜘蛛虫害不减产,费用是18万;
方案2:选择防害措施B,可以防治22℃至28℃的蜘蛛虫害,但无法防治28℃以上的红蜘蛛虫害,费用是10万;
方案3:不采取防虫害措施.
2023-09-22更新 | 2803次组卷 | 21卷引用:重庆市巴南区重庆市实验中学校2024届高三上学期期中数学试题
3 . 为了研究y关于x的线性相关关系,收集了5组样本数据(见下表):
x12345
y0.50.811.21.5
假设经验回归方程为,则(       
A.
B.当时,y的预测值为2.2
C.样本数据y的40%分位数为0.8
D.去掉样本点后,xy的样本相关系数r不变
2023-04-20更新 | 3175次组卷 | 5卷引用:重庆市第一中学校2023-2024学年高二下学期期中考试数学试题
4 . 某数学兴趣小组为研究本校学生数学成绩与语文成绩的关系,采取有放回的简单随机抽样,从学校抽取样本容量为200的样本,将所得数学成绩与语文成绩的样本观测数据整理如下:

语文成绩

合计

优秀

不优秀

数学

成绩

优秀

50

30

80

不优秀

40

80

120

合计

90

110

200

(1)根据的独立性检验,能否认为数学成绩与语文成绩有关联?
(2)在人工智能中常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.现从该校学生中任选一人,表示“选到的学生语文成绩不优秀”,表示“选到的学生数学成绩不优秀”请利用样本数据,估计的值.
(3)现从数学成绩优秀的样本中,按分层抽样的方法选出8人组成一个小组,从抽取的8人里再随机抽取3人参加数学竞赛,求这3人中,语文成绩优秀的人数的概率分布列及数学期望.
附:
智能选题,一键自动生成优质试卷~
5 . 某部门统计了某地区今年前7个月在线外卖的规模如下表:

月份代号x

1

2

3

4

5

6

7

在线外卖规模y(百万元)

11

13

18

28

35

其中4、6两个月的在线外卖规模数据模糊,但这7个月的平均值为23.若利用回归直线方程来拟合预测,且7月相应于点的残差为,则       
A.1.0B.2.0C.3.0D.4.0
6 . 伴随经济的飞速发展,中国全民健身赛事活动日益丰富,公共服务体系日趋完善.据相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.健身之于个人是一种自然而然的习惯,之于国家与民族,则是全民健康的基础柱石之一,某市一健身连锁机构对去年的参与了该连锁机构健身的会员进行了统计,制作成如下两个统计图,图1为该健身连锁机构会员年龄等级分布图,图2为一个月内会员到健身连锁机构频数分布扇形图

若将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类,将一月内来健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有是“年轻人”.
(1)现从该健身连锁机构会员中随机抽取一个容量为100人的样本,根据上图的数据,补全下方列联表,并判断依据小概率值的独立性检验,能否认为是否为“健身达人”与年龄有关;
类别年轻人非年轻人合计
健身达人
健身爱好者
合计100
临界值表:

(2)将(1)中的频率作为概率,连锁机构随机选取会员进行回访,抽取3人回访.
①若选到的3人中2人为“年轻人”,1人为“非年轻人”,再从这3人中随机选取的1人,了解到该会员是“健身达人”,求该人为非年轻人的概率;
②设3人中既是“年轻人”又是“健身达人”的人数为随机变量X,求X的分布列和期望值.
2022-10-11更新 | 979次组卷 | 6卷引用:重庆市凤鸣山中学教育集团2023届高三上学期期中数学试题
7 . 甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单位:cm)及个数y,如下表:

零件尺寸x

1.01

1.02

1.03

1.04

1.05

零件个数y

3

7

8

9

3

7

4

4

4

a

由表中数据得y关于x的经验回归方程为,其中合格零件尺寸为
(1)求a的值
(2)完成列联表,并依据小概率值的独立性检验,分析加工零件的质量与甲、乙机床是否有关.
附:

α

8 . 新型冠状病毒肺炎COVID-19疫情发生以来,在世界各地逐渐蔓延.在全国人民的共同努力和各级部门的严格管控下,我国的疫情已经得到了很好的控制.然而,小王同学发现,每个国家在疫情发生的初期,由于认识不足和措施不到位,感染人数都会出现快速的增长.下表是小王同学记录的某国连续8天每日新型冠状病毒感染确诊的累计人数.
日期代码x12345678
累计确诊人数y481631517197122
为了分析该国累计感染人数的变化趋势,小王同学分别用两杆模型:①,②对变量xy的关系进行拟合,得到相应的回归方程并进行残差分析,残差图如下(注:残差):经过计算得,其中.

(1)根据残差图,比较模型①,②的拟合效果,应该选择哪个模型?并简要说明理由;
(2)根据(1)问选定的模型求出相应的回归方程(系数均保留两位小数);
(3)由于时差,该国截止第9天新型冠状病毒感染确诊的累计人数尚未公布.小王同学认为,如果防疫形势没有得到明显改善,在数据公布之前可以根据他在(2)问求出的回归方程来对感染人数做出预测,那么估计该地区第9天新型冠状病毒感染确诊的累计人数是多少?(结果保留整数)
附:回归直线的斜率和截距的最小二乘估计公式分别为:.
2022-05-23更新 | 2001次组卷 | 21卷引用:重庆市南开中学2019-2020学年高三下学期(线上测试)期中数学(理)试题
9 . 下列判断正确的是(       
A.若样本数据的方差为3,则的方差为11
B.根据一组样本数据的散点图判断出两个变量线性相关,由最小二乘法求得其回归方程为,若样本中心点为,则
C.用相关指数来刻画回归的效果,的值越接近0,说明模型的拟合效果越好
D.从装有2个红球和2个黑球的口袋内任取2个球,至少有一个黑球与至少有一个红球是两个互斥而不对立的事件
2021-09-02更新 | 265次组卷 | 3卷引用:重庆市外国语学校2020-2021学年高二下学期期中数学试题
10 . 某校为了解学生每天的校内体育锻炼情况,随机选取了60名学生进行调查,其中男生40人.根据调查结果绘制学生日均校内体育锻炼时间(单位:分钟)的频率分布直方图.将日均校内体育锻炼时间在内的学生评价为“锻炼时间达标”,已知样本中“锻炼时间达标”的女生有6人.

(1)求的值,并估计该校学生日均校内体育锻炼时间的平均值;
(2)根据样本数据完成下面的列联表,并据此判断是否有90%的把握认为“锻炼时间达标”与性别有关?
是否达标
性别
锻炼时间达标锻炼时间未达标合计
合计
参考公式:
0.150.100.050.0250.0100.0050.001
2.0722.7063.8415.0246.6357.87910.828
共计 平均难度:一般