1 . 某纺织厂为了生产一种高端布料,准备从A农场购进一批优质棉花,厂方技术员从A农场存储的优质棉花中随机抽取了100处棉花,分别测量了其纤维长度(单位:mm)的均值,收集到100个样本数据,并制成如下频数分布表:
长度(单位:mm) | [23,25) | [25,27) | [27,29) | [29,31) | [31,33) | [33,35) | [35,37) | [37,39] |
频数 | 4 | 9 | 16 | 24 | 18 | 14 | 10 | 5 |
(1)求这100个样本数据的平均数和样本方差(同一组数据用该区间的中点值作代表);
(2)将收集到的数据绘成直方图可以认为这批棉花的纤维长度服从分布
其中,
①利用正态分布,求;
②纺织厂将A农场送来的这批优质棉进行二次检验,从中随机抽取20处测量其纤维均值yi(i=1,2…,20),数据如下:
y1 | y2 | y3 | y4 | y5 | y6 | y7 | y8 | y9 | y10 |
24.1 | 31.8 | 32.7 | 28.2 | 28.4 | 34.3 | 29.1 | 34.8 | 37.2 | 30.8 |
y11 | y12 | y13 | y14 | y15 | y16 | y17 | y18 | y19 | y20 |
30.6 | 25.2 | 32.9 | 27.1 | 35.9 | 28.9 | 33.9 | 29.5 | 35.0 | 29.9 |
若20个样本中纤维均值的频率不低于①中即可判断该批优质棉花合格,否则认为农场运送时掺杂了次品,判断该批棉花不合格.按照此依据判断A农场送来的这批棉花是否为合格的优质棉花,并说明理由.
附:若,则,,
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
6 | 11 | 21 | 34 | 66 | 101 | 196 |
观察散点图,两个变量不具有线性相关关系,现考虑用对数函数模型和指数函数模型分别对两个变量的关系进行拟合.
(1)根据散点图判断,与(,均为大于零的常数)哪一个适宜作为非原料总成本关于生产该产品的数量的回归方程类型;(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表1中的数据,建立关于的回归方程;
(3)已知每件产品的原料成本为10元,若该产品的总成本不得高于123470元,请估计最多能生产多少千件产品.
参考数据:
62.14 | 1.54 | 2535 | 50.12 | 3.47 |
参考公式:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计公式分别为,.
(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不比计算出结果)
(2)如果随机抽取名同学的数学、物理成绩(单位:分)对应如下表:
(i)若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为,求的分布列和数学期望;
(ii)根据上表数据,求物理成绩关于数学成绩的线性回归方程(系数精确到0.01),若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分?
附:线性回归方程,其中 ,.
(1)通过计算写出中一至四等奖分别对应的情况(写出字母即可);
(2)已知顾客摸出的第一个球是红球,求他获得二等奖的概率;
(3)设顾客抽一次奖小张获利元,求变量的分布列;若小张不打算在活动中亏本,求的最大值.
0.25 | 0.5 | 1 | 2 | 4 | |
16 | 12 | 5 | 2 | 1 |
(2)根据(1)的判断结果及表中数据,建立变量关于的回归方程;
(3)根据(2)中所求的变量关于的回归方程预测:当时,对应的值为多少?(保留四位有效数字)
平均温度/℃ | 21 | 23 | 25 | 27 | 29 | 32 | 35 | |||||
平均产卵数/个 | 7 | 11 | 21 | 24 | 66 | 115 | 325 | |||||
27.429 | 81.286 | 3.612 | 40.182 | 147.714 |
(1)根据散点图判断,与(其中为自然对数的底数)哪一个更适宜作为平均产卵数关于平均温度的回归方程类型?(给出判断即可不必说明理由)并由判断结果及表中数据,求出关于的回归方程.(计算结果精确到小数点后第三位)
(2)根据以往统计,该地每年平均温度达到28℃以上时红铃虫会造成严重伤害,需要人工防治,其他情况均不需要人工防治,记该地每年平均温度达到28℃以上的概率为.
(ⅰ)记该地今后5年中,恰好需要3次人工防治的概率为,求的最大值,并求出相应的概率.
(ⅱ)当取最大值时,记该地今后5年中,需要人工防治的次数为,求的数学期望和方差.
附:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为:,.
A地区: | 62 | 73 | 81 | 92 | 95 | 85 | 74 | 64 | 53 | 76 |
78 | 86 | 95 | 66 | 97 | 78 | 88 | 82 | 76 | 89 | |
B地区: | 73 | 83 | 62 | 51 | 91 | 46 | 53 | 73 | 64 | 82 |
93 | 48 | 95 | 81 | 74 | 56 | 54 | 76 | 65 | 79 |
(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度的平均值及分散程度(不要求算出具体值,给出结论即可):(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个等级:
满意度评分 | 低于70分 | 70分到89分 | 不低于90分 |
满意度等级 | 不满意 | 满意 | 非常满意 |
记事件C:“A地区用户的满意度等级高于B地区用户的满意度等级”,假设两地区用户的评价结果相互独立,根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.
(1)利用散点图判断和(其中均为大于0的常数)哪一个更适合作为年销售量和年研发费用的回归方程类型(只要给出判断即可,不必说明理由);
(2)对数据作出如下处理,令,得到相关统计量的值如表:根据第(1)问的判断结果及表中数据,求关于的回归方程;
15 | 15 | 28.25 | 56.5 |
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
(I)根据散点图判断在推广期内,与(c,d为为大于零的常数)哪一个适宜作为扫码支付的人次y关于活动推出天数x的回归方程类型?(给出判断即可,不必说明理由)
(Ⅱ)根据(I)的判断结果求y关于x的回归方程,并预测活动推出第8天使用扫码支付的人次.
参考数据:
4 | 62 | 1.54 | 2535 | 50.12 | 140 | 3.47 |
其中,
附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为:,.
(Ⅰ)活动开始后,一位参加者问:盒中有几张“五环”卡?主持人答:我只知道,从盒中抽取两张都是“会徽”卡的概率是,求抽奖者获奖的概率;
(Ⅱ)现有甲、乙、丙、丁四人依次抽奖,用表示获奖的人数,求的分布列及的值.