1 . 某纺织厂为了生产一种高端布料,准备从A农场购进一批优质棉花,厂方技术员从A农场存储的优质棉花中随机抽取了100处棉花,分别测量了其纤维长度(单位:mm)的均值,收集到100个样本数据,并制成如下频数分布表:
长度(单位:mm) | [23,25) | [25,27) | [27,29) | [29,31) | [31,33) | [33,35) | [35,37) | [37,39] |
频数 | 4 | 9 | 16 | 24 | 18 | 14 | 10 | 5 |
(1)求这100个样本数据的平均数和样本方差(同一组数据用该区间的中点值作代表);
(2)将收集到的数据绘成直方图可以认为这批棉花的纤维长度服从分布
其中,
①利用正态分布,求;
②纺织厂将A农场送来的这批优质棉进行二次检验,从中随机抽取20处测量其纤维均值yi(i=1,2…,20),数据如下:
y1 | y2 | y3 | y4 | y5 | y6 | y7 | y8 | y9 | y10 |
24.1 | 31.8 | 32.7 | 28.2 | 28.4 | 34.3 | 29.1 | 34.8 | 37.2 | 30.8 |
y11 | y12 | y13 | y14 | y15 | y16 | y17 | y18 | y19 | y20 |
30.6 | 25.2 | 32.9 | 27.1 | 35.9 | 28.9 | 33.9 | 29.5 | 35.0 | 29.9 |
若20个样本中纤维均值的频率不低于①中即可判断该批优质棉花合格,否则认为农场运送时掺杂了次品,判断该批棉花不合格.按照此依据判断A农场送来的这批棉花是否为合格的优质棉花,并说明理由.
附:若,则,,
(Ⅰ)从该地区的蜻蜓中随机捕捉一只,求这只蜻蜓的翼长在区间的概率;
(Ⅱ)记该地区蜻蜓的翼长为随机变量,若用正态分布来近似描述的分布,请你根据(Ⅰ)中的结果,求参数和的值(精确到0.1);
(Ⅲ)在(Ⅱ)的条件下,从该地区的蜻蜓中随机捕捉3只,记这3只中翼长在区间的个数为,求的分布列及数学期望(分布列写出计算表达式即可).
注:若,则,,.
月份 | 2021.12 | 2022.01 | 2022.02 | 2022.03 | 2022.04 |
月份编号t | 1 | 2 | 3 | 4 | 5 |
竞拍人数y(万人) | 1.7 | 2.1 | 2.5 | 2.8 | 3.4 |
(2)某市场调研机构对200位拟参加2022年5月份车牌竞拍人员的报价进行了一个抽样调查,得到如下的一份频数表:
报价区间(万元) | ||||||
频数 | 20 | 60 | 60 | 30 | 20 | 10 |
(ii)假设所有参与竞价人员的报价X可视为服从正态分布,且与可分别由(i)中所求的样本平均数及估值.若2022年5月份实际发放车牌数量是5000,请你合理预测(需说明理由)竞拍的最低成交价.
参考公式及数据:①回归方程,其中,;②;③若,令,则,且;④方差.
月份 | |||||
月份编号 | |||||
竞拍人数(万人) |
(2)某市场调研机构对位拟参加年月份车牌竞拍人员的报价价格进行了一个抽样调查,得到如下的一份频数表:
报价区间(万元) | ||||||
频数 |
(ii)假设所有参与竞价人员的报价可视为服从正态分布,且与可分别由(i)中所求的样本平均数及估值.若年月份实际发放车牌数量为,请你合理预测(需说明理由)竞拍的最低成交价.
参考公式及数据:①回归方程,其中,;②,,;③若随机变量服从正态分布,则,,.
(1)为了对数据进行分析,将60分以下的成绩定为不合格,60分以上(含60分)的成绩定为合格.为科学评估该校学生数学建模水平决定利用分层抽样的方法从这60名学生中选取10人,然后从这10人中抽取4人参加座谈会.记为抽取的4人中,成绩不合格的人数,求的分布列和数学期望;
(2)已知这60名学生的数学建模竞赛成绩服从正态分布,其中可用样本平均数近似代替,可用样本方差近似代替(用一组数据的中点值作代表),若成绩在46分以上的学生均能得到奖励,本次数学建模竞赛满分为100分,试估计此次竞赛受到奖励的人数.(结果根据四舍五入保留到整数位)
解题中可参考使用下列数据:,,.
(1)计算该样本的平均值,方差;(同一组中的数据用该组区间的中点值作代表)
(2)根据长期生产经验,可以认为这台设备在正常状态下生产的产品的质量指标值服从正态分布,其中近似为样本平均值,近似为样本方差.任取一个产品,记其质量指标值为.若,则认为该产品为一等品;,则认为该产品为二等品;若,则认为该产品为不合格品.已知设备正常状态下每天生产这种产品1000个.
(i)用样本估计总体,问该工厂一天生产的产品中不合格品是否超过?
(ii)某公司向该工厂推出以旧换新活动,补足50万元即可用设备换得生产相同产品的改进设备.经测试,设备正常状态下每天生产产品1200个,生产的产品为一等品的概率是,二等品的概率是,不合格品的概率是.若工厂生产一个一等品可获得利润50元,生产一个二等品可获得利润30元,生产一个不合格品亏损40元,试为工厂做出决策,是否需要换购设备?
参考数据:①;②;③,.
分数 | 5 | 6 | 7 | 8 | 9 | 10 |
频数 | 4 | 8 | 20 | 24 | 16 | 8 |
(2)若从打分不低于8分的贫困户中,任意抽取两户的分数和为Y,求Y的分布列;
(3)为了更好调查消费扶贫对贫困户帮扶情况.某地民政部门从本地20000户贫困户中抽取200户对2020年的收入进行了一个抽样调查,得到如表所示的频数表:
收入(千元) | ||||||
频数 | 20 | 60 | 60 | 30 | 20 | 10 |
(ⅱ)假设所有参与贫困户的收入X可视为服从正态分布N(μ,σ2)且μ与σ2可分别由(ⅰ)中所求的样本平均数及样本方差s2估计.若2021年计划帮扶贫困户的户数是3174户,根据调查,最低收入高于样本平均数,请你预测(需说明理由)需要帮扶贫困户最低收入.
参考公式及数据:若随机变量X服从正态分布N(μ,σ2),则P(μ﹣σ<X<μ+σ)=0.6826,P(μ﹣2σ<X<μ+2σ)=0.9544,P(μ﹣3σ<X<μ+3σ)=0.9974.
(1)实际情景
大家在农贸市场购物时,通常会发现在农贸市场管理处的窗口,都会有一个电子秤,以方便老百姓核对斤两与价格,这是为了放置商贩在售卖中缺斤少两.国家有关部门也对缺斤少两作出了相应的定义:比如粮食、蔬菜、水果或每公斤不高于6元的食品,称重范围等于或小于1公斤的其负偏差不能超过20克;大于1公斤,等于或小于2公斤的不能超过40克;大于2公斤,等于或小于4公斤的不能超过80克;大于4公斤,等于或小于25公斤的不能超过100克.其实在网购时也有缺斤少两的问题时,由此产生经济纠纷.
(2)提出问题
李师傅想利用手机在某外卖平台商家购买1份水果,商家对水果的描述用数学语言表达是:每份水果的均重为1000克,重量偏差在50克内.李师傅打开用户评价,发现用户给商家的评价中有缺斤少两的反馈,请问李师傅该是否相信这样的反馈?
(3)分析问题
是否缺斤少两,要从统计学的角度取分析,一般来说,每份水果的质量应该服从正态分布,根据所学的原则可判断商家是否缺斤少两.
2.收集数据
李师傅决定师傅从2022年3月1日至6月8日连续100天,每天都在平台上购买一份水果,并将水果的重量记录如下:
983 | 993 | 1013 | 963 | 973 | 963 | 993 | 993 | 993 | 953 |
1023 | 1023 | 993 | 1013 | 873 | 1014 | 1003 | 1033 | 1003 | 993 |
1032 | 1023 | 993 | 993 | 1011 | 993 | 1003 | 943 | 973 | 1013 |
1013 | 973 | 1023 | 1013 | 1023 | 1003 | 963 | 943 | 963 | 1023 |
1023 | 913 | 1023 | 983 | 1013 | 973 | 973 | 993 | 1013 | 1013 |
1023 | 1023 | 953 | 873 | 973 | 993 | 823 | 993 | 1023 | 1013 |
1003 | 1022 | 1023 | 973 | 953 | 993 | 1023 | 993 | 943 | 1023 |
993 | 1001 | 983 | 953 | 993 | 1023 | 993 | 1023 | 983 | 1003 |
893 | 1013 | 973 | 933 | 1013 | 1043 | 863 | 1013 | 973 | 963 |
843 | 1013 | 983 | 1023 | 943 | 883 | 773 | 1023 | 983 | 973 |
983 | 993 | 1013 | 963 | 973 | 963 | 993 | 993 | 993 | 953 |
1023 | 1023 | 993 | 1013 | 873 | 1014 | 1003 | 1033 | 1003 | 993 |
上述数据较多,我们利用的计算功能得到水果的均值为,标准差为.
4.问题解决
水平的重量理论上重量的分布应该近似服从,而,而表格中的数据小于的数据有一个,其频率为,但根据正态分布原则,水果质量小于的概率不超过,因此商家缺斤少两,李师傅可以投诉.
5.检验模型
本案例中由于李师傅所取样本的容量为100,样本数量较少,为了减少误差,可以增加样本的容量,以保证所得结论的准确性.
6.拓展延伸
正态分布的原则,还可以用来检测生产线的稳定性,从而判断是否需要对生产线进行维修,请选择一个工厂,进行生产线稳定性的评估.
(1)已知如下结论:若,从X的取值中随机抽取个数据,记这k个数据的平均值为Y,则随机变量,利用该结论解决下面问题.
(i)假设面包师的说法是真实的,随机购买25个面包,记随机购买25个面包的平均值为Y,求;
(ii)庞加莱每天都会将买来的面包称重并记录,25天后,得到的数据都落在上,并经计算25个面包质量的平均值为.庞加莱通过分析举报了该面包师,从概率角度说明庞加莱举报该面包师的理由;
(2)假设有两箱面包(面包除颜色外,其他都一样),已知第一箱中共装有6个面包,其中黑色面包有2个;第二箱中共装有8个面包,其中黑色面包有3个.现随机挑选一箱,然后从该箱中随机取出2个面包.求取出黑色面包个数的分布列及数学期望.
附:①随机变量服从正态分布,则,,;
②通常把发生概率小于的事件称为小概率事件,小概率事件基本不会发生.
(1)若该市有4万名高中生,试估计这些高中生中竞赛成绩位于区间的人数;
(2)若规定成绩在85.2以上的学生等级为优秀,现从全市高中生中任意抽取一个进行访谈,如果取到学生等级不是优秀,则继续抽取下一个,直至取到等级为优秀的学生为止,但抽取的总次数不超过.如果抽取次数的期望值不超过6,求的最大值.
(附:,,,,,若,则,)