专题10 概率、统计与统计案例
【要点提炼】
1.抽样方法
抽样方法包括简单随机抽样、分层抽样,两种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围.
2.统计中的四个数据特征
(1)众数:在样本数据中,出现次数最多的那个数据.
(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.
(3)平均数:样本数据的算术平均数,即= (x1+x2+…+xn).
(4)方差与标准差.
s2= [(x1-)2+(x2-)2+…+(xn-)2],
3.直方图的两个结论
(1)小长方形的面积=组距×=频率.
(2)各小长方形的面积之和等于1.
4.回归分析与独立性检验
(1)回归直线=x+经过样本点的中心(,),若x取某一个值代入回归直线方程=x+中,可求出y的估计值.
(2)独立性检验
对于取值分别是{x1,x2}和{y1,y2}的分类变量X和Y,其样本频数列联表是:
y1 | y2 | 总计 | |
x1 | a | b | a+b |
x2 | c | d | c+d |
总计 | a+c | b+d | n |
则K2= (其中n=a+b+c+d为样本容量).
5.概率模型公式及相关结论
(1)古典概型的概率公式.
P(A)==.
(2)条件概率.
在A发生的条件下B发生的概率:P(B|A)==.
(3)相互独立事件同时发生的概率:若A,B相互独立,则P(AB)=P(A)·P(B).
(4)若事件A,B互斥,则P(A∪B)=P(A)+P(B),
P()=1-P(A).
【方法指导】
1、古典概型求解的关键点
(1)正确求出基本事件总数和所求事件包含的基本事件数,这常常用到排列、组合的有关知识;
(2)对于较复杂的题目计数时要正确分类,分类时应不重不漏.
2、几何概型的适用条件及其关键
(1)适用条件:当构成实验的结果的区域为长度、面积、体积、弧长、夹角等时,应考虑使用几何概型;
(2)关键:寻找构成实验全部结果的区域和事件发生的区域是关键,有时需要设出变量,在坐标系中表示所需要的区域.
3、求相互独立事件同时发生的概率的主要方法:
(1)利用相互独立事件的概率乘法公式直接求解.运用公式 时,一定要注意公式成立的条件,只有当事件 相互独立时,公式才成立;
(2)正面计算较繁琐(如求用“至少”表述的事件的概率)或难以入手时,可从其对立事件入手计算.
4、平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
6、用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
7、线性回归分析问题的类型及解题方法:
(1)、求线性回归方程:(1)利用公式,求出回归系数;(2)待定系数法:利用回归直线过样本的中心点求系数;
(2)、利用回归直线方程进行预测,把线性回归方程看作一次函数,求函数值;
(3)、利用回归直线判定正、负相关,决定正相关还是负相关的是系数.
8、独立性检验应用的三个步骤:
(1)根据样本数据画出列联表;
(2)根据公式,计算的值;
(3)查表比较与临界值的大小关系,得出结论.
命题点一会求古典概型和几何概型
【典例1】(1)(2021·湖南永州市·高三二模)
A. | B. | C. | D. |
【知识点】 实际问题中的组合计数问题解读 计算古典概型问题的概率
(2)(2021·辽宁高三一模(文))
A. | B. | C. | D. |
【拓展练习】
(2021·广东揭阳市·高三一模)
A. | B. | C. | D. |
【知识点】 组合数的计算解读 计算古典概型问题的概率
(2021·安徽安庆市·高三一模(理))
A. | B. | C. | D. |
【知识点】 用随机模拟法估算几何概率解读
命题点二会求互相独立事件和独立重复实验的概率
【典例2】(2020·全国高三专题练习)
A. | B. | C. | D. |
【知识点】 独立重复试验的概率问题解读
【拓展练习】
(2020·天津和平区·高三二模)
A. | B. | C. | D. |
【知识点】 相互独立事件与互斥事件解读 独立事件的乘法公式解读
命题点三利用条件概率公式求概率
【典例3】(2020·贵州毕节市·高三其他模拟(理))
A. | B. | C. | D. |
【拓展练习】
(2020·山西太原市·太原五中(理))
A. | B. | C. | D. |
命题点四会解决用样本估计总体问题
【典例4】(2021·河南郑州市·高三一模(文))
等级 | 标准果 | 优质果 | 精品果 | 礼品果 |
个数 |
(2)用样本估计总体,超市老板参考以下两种销售方案进行销售:
方案1;不分类卖出,单价为元/;
方案2;分类卖出,分类后的水果售价如表所示:
等级 | 标准果 | 优质果 | 精品果 | 礼品果 |
售价(元/) |
【知识点】 计算几个数的平均数解读 用平均数的代表意义解决实际问题解读
【拓展练习】
(2021·赣州市赣县第三中学高二开学考试(理))
餐厅分数的频数分布表 | |
分数区间 | 频数 |
2 | |
3 | |
5 | |
15 | |
40 | |
35 |
(1)在抽样的人中,求对餐厅评分低于的人数;
(2)从对餐厅评分在范围内的人中随机选出人,求人中恰有人评分在范围内的概率.
(3)如果从、两家餐厅中选择一家用餐,你会选择哪一家?说明理由.
【知识点】 频率分布直方图的实际应用解读 计算古典概型问题的概率
命题点五会应用回归方程解决实际问题
【典例5】(2020·山东淄博市·高三零模)
(1)已知第天的报名人数为,求关于的线性回归方程,并预测第7天的报名人数(结果四舍五入取整数).
(2)该社团为了解中学生对航空航天的兴趣爱好和性别是否有关系,随机调查了100名学生,并得到如下列联表:
有兴趣 | 无兴趣 | 合计 | |
男生 | 45 | 5 | 50 |
女生 | 30 | 20 | 50 |
合计 | 75 | 25 | 100 |
参考公式及数据:回归方程中斜率的最小二乘估计公式为:,;
,其中.
0.10 | 0.05 | 0.010 | 0.005 | 0.001 | |
2.706 | 3.841 | 6.635 | 7.879 | 10.828 |
【拓展练习】
(2020·渝中区·重庆巴蜀中学高三月考(理))
2.72 | 19 | 139.09 | 1095 |
(1)从9个样本点中任意选取2个,在2个点的日生产量都不高于三十万只的条件下,求2个都高于二十万只的概率;
(2)由散点图分析,样本点都集中在曲线的附近,请求y关于t的方程,并估计该厂从什么时候开始日生产量超过四十万只.
参考公式:回归直线方程是,,.
参考数据:.
命题点六会求解独立性检验的应用问题
【典例6】(2021·云南高三其他模拟(理))
人均可支配年收入(元) 电商扶贫年度总投入(万元) | (5000,10000] | (10000,15000] | (15000,20000] |
(0,500] | 5 | 3 | 2 |
(500,1000] | 3 | 21 | 6 |
(1000,3000) | 2 | 34 | 24 |
(2)根据所给数据完成下面的列联表,并判断是否有99%的把握认为当地的人均可支配年收入是否过万与当地电商扶贫年度总投入是否超过千万有关.
人均可支配年收入≤10000元 | 人均可支配年收入>10000元 | |
电商扶贫年度总投入不超过1000万 | ||
电商扶贫年度总投入超过1000万 |
0.050 | 0.01 | 0.005 | |
3.841 | 6.635 | 7.879 |
【拓展练习】
(2020·四川内江市·高三一模(文))
(1)根据已知条件完成下面的列联表,能否在犯错误的概率不超过0.10的前提下认为网购迷与年龄不超过40岁有关?
网购迷 | 非网购迷 | 合计 | |
年龄不超过40岁 | |||
年龄超过40岁 | |||
合计 |
(2)若将所抽取样本中周平均网购次数为6次的市民称为超级网购迷,且已知超级网购迷中有2名年龄超过40岁,若从超级网购迷中任意挑选2名,求至少有一名市民年龄超过40岁的概率.
(附:)
0.15 | 0.10 | 0.05 | 0.01 | |
2.072 | 2.706 | 3.841 | 6.635 |
【知识点】 完善列联表解读 独立性检验解决实际问题解读 计算古典概型问题的概率
【专题训练】
一、单选题
(2021·江西高三其他模拟(文))
A. | B. | C. | D. |
(2021·广东梅州市·高三一模)
A.5000元 | B.5500元 | C.6000元 | D.6500元 |
(2021·江苏盐城市·高三一模)
年轻人 | 非年轻人 | 总计 | |
经常用流行语 | 125 | 25 | 150 |
不常用流行用语 | 35 | 15 | 50 |
总计 | 160 | 40 | 200 |
下面的临界值表供参考:
0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
A.有95%的把握认为“经常用流行用语”与“年轻人”有关系 |
B.没有95%的把握认为“经常用流行用语”与“年轻人”有关系 |
C.有97.5%的把握认为“经常用流行用语”与“年轻人”有关系 |
D.有97.5%的把握认为“经常用流行用语”与“年轻人”没有关系 |
【知识点】 卡方的计算解读 独立性检验的基本思想解读
(2021·福建高三其他模拟)
A. | B. | C. | D. |
【知识点】 相互独立事件与互斥事件解读 独立事件的乘法公式解读
(2021·全国高三其他模拟)
月份 | 4月 | 5月 | 6月 | 7月 | 8月 |
月份代码 | 1 | 2 | 3 | 4 | 5 |
摊位数(万个) | 290 | 330 | 440 | 480 |
若与线性相关,且求得其线性回归方程为,则表中的值为( )
A.340 | B.360 | C.380 | D.无法确定 |
【知识点】 根据回归方程求原数据中的值解读
(2021·全国高三其他模拟)
A.0.6 | B.0.4 | C.0.36 | D.0.144 |
(2021·江西上饶市·高三其他模拟(理))
A. | B. | C. | D. |
【知识点】 计算古典概型问题的概率
二、多选题
(2021·湖南永州市·高三二模)
A.线性回归方程对应的直线至少经过其样本数据点中的一个点 |
B.10件产品中有7件正品,3件次品,从中任取2件,恰好取到1件次品的概率为 |
C.某高中为了解在校学生对参加某项社会实践活动的意向,拟采用分层抽样的方法从该校三个年级的学生中抽取一个容量为60的样本,已知该校高一、高二、高三年级学生之比为,则应从高二年级中抽取20名学生 |
D.从装有2个红球和2个黑球的口袋内任取2个球,“至少有一个黑球”与“至少有一个红球”是互斥而不对立的事件 |
(2021·湖北高三一模)
A.甲、乙两组成绩的平均分相等 | B.甲、乙两组成绩的中位数相等 |
C.甲、乙两组成绩的极差相等 | D.甲组成绩的方差小于乙组成绩的方差 |
(2021·湖南长沙市·长郡中学高三二模)
A.从中任取3球,恰有一个白球的概率是 |
B.从中有放回的取球6次,每次任取一球,则取到红球次数的方差为 |
C.现从中不放回的取球2次,每次任取1球,则在第一次取到红球后,第二次再次取到红球的概率为 |
D.从中有放回的取球3次,每次任取一球,则至少有一次取到红球的概率为 |
三、填空题
(2021·福建漳州市·高三其他模拟)
【知识点】 实际问题中的组合计数问题解读 计算古典概型问题的概率
(2021·宁夏吴忠市·高三一模(理))
【知识点】 排列组合综合解读 计算古典概型问题的概率
(2021·福建高三其他模拟)
【知识点】 元素(位置)有限制的排列问题解读 相邻问题的排列问题解读
四、解答题
(2021·广东广州市·高三二模)
(1)月市场占有率与月份代码符合线性回归模型拟合的关系,求关于的线性回归方程,并预测公司2021年3月份(即时)的市场占有率;
(2)为进一步扩大市场,公司拟再采购一批单车.现有采购成本分别为1000元/辆和1200元/辆的两款车型可供选择,按规定每辆单车最多使用4年,但由于多种原因(如骑行频率等)会导致车辆报废年限各不相同.考虑到公司运营的经济效益,该公司决定先对两款车型的单车各100辆进行科学模拟测试,得到两款单车使用寿命频数表如下:
报废年限 | 1年 | 2年 | 3年 | 4年 |
型车(辆) | 20 | 35 | 35 | 10 |
型车(辆) | 10 | 30 | 40 | 20 |
参考公式及数据:回归直线方程为,其中,,,
(2021·安徽安庆市·高三一模(文))
未感染病毒 | 感染病毒 | 总计 | |
未注射疫苗 | 60 | ||
注射疫苗 | 30 | ||
总计 | 110 | 90 | 200 |
(1)能否有的把握认为注射此疫苗有效?
(2)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取6只进行病理分析,然后从这6只小白鼠中随机抽取2只对注射疫苗的情况进行核实,求至少有1只为注射过疫苗的概率.
附:.
0.05 | 0.025 | 0.010 | 0.005 | 0.001 | |
3.841 | 5.024 | 6.635 | 7.879 | 10.828 |