名校
1 . 某网红直播平台为确定下一季度的广告投入计划,收集了近6个月广告投入量(单位:万元)和收益(单位:万元)的数据如下表:
用两种模型①,②分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值:
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:
(i)剔除的异常数据是哪一组?
(ii)剔除异常数据后,求出(1)中所选模型的回归方程;
(iii)广告投入量时,(ii)中所得模型收益的预报值是多少?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
月份 | 1 | 2 | 3 | 4 | 5 | 6 |
广告投入量/万元 | 2 | 4 | 6 | 8 | 10 | 12 |
收益/万元 | 14.21 | 20.31 | 31.8 | 31.18 | 37.83 | 44.67 |
7 | 30 | 1464.24 | 364 |
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型?并说明理由.
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除:
(i)剔除的异常数据是哪一组?
(ii)剔除异常数据后,求出(1)中所选模型的回归方程;
(iii)广告投入量时,(ii)中所得模型收益的预报值是多少?
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:,.
您最近一年使用:0次
2020-05-18更新
|
570次组卷
|
14卷引用:湖北省部分重点中学2019-2020学年高三上学期第一次联考考数学(文)试题
湖北省部分重点中学2019-2020学年高三上学期第一次联考考数学(文)试题【市级联考】湖南省长沙市2019届上学期高三统一检测理科数学【市级联考】新疆乌鲁木齐地区2019届高三第二次质量监测数学(理)试题(已下线)2020届高三12月第01期(考点09)(文科)-《新题速递·数学》2020届福建省福州第一中学高三上学期期末数学(文)试题广东省华美实验学校2019-2020学年高三下学期4月网上考试数学(文)试题四川省仁寿第二中学2020届高三第三次高考模拟数学(文)试题(已下线)专题09 概率与统计——2020年高考真题和模拟题文科数学分项汇编(已下线)专题10.2 变量相关性与统计案例(精练)-2021年高考数学(理)一轮复习学与练广东省中山市2018-2019学年高二下学期期末数学(理)试题广东省中山市2018-2019学年高二下学期期末数学(文)试题安徽省合肥市第一中学2019-2020学年高二下学期返校考试数学试题黑龙江大庆实验中学2019-2020学年高二下学期线上期中考试数学(文)试题安徽省合肥一中2019-2020学年高二(下)开学数学试题
名校
解题方法
2 . 2020年寒假期间新冠肺炎肆虐,全国人民众志成城抗疫情.某市要求全体市民在家隔离,同时决定全市所有学校推迟开学.某区教育局为了让学生“停课不停学”,要求学校各科老师每天在网上授课辅导,每天共200分钟.教育局为了了解高三学生网上学习情况,上课几天后在全区高三学生中采取随机抽样的方法抽取了80名学生(其中男女生恰好各占一半)进行问卷调查,按男女生分为两组,再将每组学生在线学习时间(分钟)分为5组,,,,得到如图所示的频率分布直方图.全区高三学生有3000人(男女生人数大致相等),以频率估计概率回答下列问题:
(1)估计全区高三学生中网上学习时间不超过40分钟的人数;
(2)在调查的80名高三学生且学习时间不超过40分钟的学生中,男女生按分层抽样的方法抽取6人.若从这6人中随机抽取2人进行电话访谈,求至少抽到1名男生的概率.
(1)估计全区高三学生中网上学习时间不超过40分钟的人数;
(2)在调查的80名高三学生且学习时间不超过40分钟的学生中,男女生按分层抽样的方法抽取6人.若从这6人中随机抽取2人进行电话访谈,求至少抽到1名男生的概率.
您最近一年使用:0次
2020-05-13更新
|
493次组卷
|
4卷引用:湖北省华大新高考联盟2020届高三下学期4月教学质量测评数学(文)试题
名校
3 . 目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如下图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.
(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;
(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关;
(3)研究发现,某药物对新冠病毒有一定的抑制作用,需要在抽取的300人中分层选取7位60岁以下的患者做Ⅰ期临床试验,再从选取的7人中随机抽取两人做Ⅱ期临床试验,求两人中恰有1人为“长潜伏者”的概率.
附表及公式:
(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;
(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关;
短潜伏者 | 长潜伏者 | 合计 | |
60岁及以上 | 90 | ||
60岁以下 | 140 | ||
合计 | 300 |
(3)研究发现,某药物对新冠病毒有一定的抑制作用,需要在抽取的300人中分层选取7位60岁以下的患者做Ⅰ期临床试验,再从选取的7人中随机抽取两人做Ⅱ期临床试验,求两人中恰有1人为“长潜伏者”的概率.
附表及公式:
0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
您最近一年使用:0次
2020-05-09更新
|
529次组卷
|
2卷引用:2020届湖北省宜昌市高三下学期4月线上统一调研测试数学(文)试题
名校
解题方法
4 . 目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如下图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.
(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;
(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:
(3)研究发现,有5种药物对新冠病毒有一定的抑制作用,其中有2种特别有效,现在要通过逐一试验直到把这2种特别有效的药物找出来为止,每一次试验花费的费用是500元,设所需要的试验费用为X,求X的分布列与数学期望.
附表及公式:
短潜伏者 | 长潜伏者 | 合计 | |
60岁及以上 | 90 | ||
60岁以下 | 140 | ||
合计 | 300 |
(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;
(2)为研究潜伏期与患者年龄的关系,以潜伏期是否高于平均数为标准进行分层抽样,从上述500名患者中抽取300人,得到如下列联表,请将列联表补充完整,并根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:
(3)研究发现,有5种药物对新冠病毒有一定的抑制作用,其中有2种特别有效,现在要通过逐一试验直到把这2种特别有效的药物找出来为止,每一次试验花费的费用是500元,设所需要的试验费用为X,求X的分布列与数学期望.
附表及公式:
0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 | |
2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
您最近一年使用:0次
2020-05-08更新
|
608次组卷
|
4卷引用:2020届湖北省宜昌市高三下学期4月线上统一调研测试数学(理)试题
名校
5 . 某市旅游局为尽快恢复受疫情影响的旅游业,准备在本市的景区推出旅游一卡通(年卡).为了更科学的制定一卡通的有关条例,市旅游局随机调查了2019年到本市景区旅游的1000个游客的年旅游消费支出(单位:百元),并制成如下频率分布直方图:
由频率分布直方图,可近似地认为到本市景区旅游的游客,其旅游消费支出服从正态分布,其中近似为样本平均数(同一组数据用该组区间的中点值作代表).
(1) 若2019年到本市景区旅游游客为500万人,试估计2019年有多少游客在本市的年旅游消费支出不低于1820元;
(2) 现依次抽取个游客,假设每个游客的旅游消费支出相互独立,记事件表示“连续3人的旅游消费支出超出”.若表示的概率,为常数),且.
(ⅰ)求,及,;
(ⅱ)判断并证明数列从第三项起的单调性,试用概率统计知识解释其实际意义.
参考数据:,,
由频率分布直方图,可近似地认为到本市景区旅游的游客,其旅游消费支出服从正态分布,其中近似为样本平均数(同一组数据用该组区间的中点值作代表).
(1) 若2019年到本市景区旅游游客为500万人,试估计2019年有多少游客在本市的年旅游消费支出不低于1820元;
(2) 现依次抽取个游客,假设每个游客的旅游消费支出相互独立,记事件表示“连续3人的旅游消费支出超出”.若表示的概率,为常数),且.
(ⅰ)求,及,;
(ⅱ)判断并证明数列从第三项起的单调性,试用概率统计知识解释其实际意义.
参考数据:,,
您最近一年使用:0次
2020-05-07更新
|
470次组卷
|
2卷引用:湖北省黄冈中学2020届高三下学期6月第三次模拟考试理科数学试题
解题方法
6 . 某校共有学生2000人,其中男生900人,女生1100人,为了调查该校学生每周平均体育锻炼时间,采用分层抽样的方法收集该校100名学生每周平均体育锻炼时间(单位:小时).
(1)应抽查男生与女生各多少人?
(2)根据收集100人的样本数据,得到学生每周平均体育锻炼时间的频率分布表:
若在样本数据中有38名男学生平均每周课外体育锻炼时间超过2小时,请完成每周平均体育锻炼时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育锻炼时间与性别有关”?
附:K2.
(1)应抽查男生与女生各多少人?
(2)根据收集100人的样本数据,得到学生每周平均体育锻炼时间的频率分布表:
时间(小时) | [0,1] | (1,2] | (2,3] | (3,4] | (4,5] | (5,6] |
频率 | 0.05 | 0.20 | 0.30 | 0.25 | 0.15 | 0.05 |
男生 | 女生 | 总计 | |
每周平均体育锻炼时间不超过2小时 | |||
每周平均体育锻炼时间超过2小时 | |||
总计 |
P(K2≥k0) | 0.100 | 0.050 | 0.010 | 0.005 |
2.706 | 3.841 | 6.635 | 7.879 |
您最近一年使用:0次
名校
解题方法
7 . 2020年春节期间,新型冠状病毒(2019﹣nCoV)疫情牵动每一个中国人的心,危难时刻全国人民众志成城.共克时艰,为疫区助力.我国S省Q市共100家商家及个人为缓解湖北省抗疫消毒物资压力,募捐价值百万的物资对口输送湖北省H市.
(1)现对100家商家抽取5家,其中2家来自A地,3家来自B地,从选中的这5家中,选出3家进行调研.求选出3家中1家来自A地,2家来自B地的概率.
(2)该市一商家考虑增加先进生产技术投入,该商家欲预测先进生产技术投入为49千元的月产增量.现用以往的先进技术投入xi(千元)与月产增量yi(千件)(i=1,2,3,…,8)的数据绘制散点图,由散点图的样本点分布,可以认为样本点集中在曲线的附近,且:,,,,,其中,,,根据所给的统计量,求y关于x回归方程,并预测先进生产技术投入为49千元时的月产增量.
附:对于一组数据(u1,v1)(u2,v2),其回归直线v=α+βu的斜率和截距的最小二乘法估计分别为
(1)现对100家商家抽取5家,其中2家来自A地,3家来自B地,从选中的这5家中,选出3家进行调研.求选出3家中1家来自A地,2家来自B地的概率.
(2)该市一商家考虑增加先进生产技术投入,该商家欲预测先进生产技术投入为49千元的月产增量.现用以往的先进技术投入xi(千元)与月产增量yi(千件)(i=1,2,3,…,8)的数据绘制散点图,由散点图的样本点分布,可以认为样本点集中在曲线的附近,且:,,,,,其中,,,根据所给的统计量,求y关于x回归方程,并预测先进生产技术投入为49千元时的月产增量.
附:对于一组数据(u1,v1)(u2,v2),其回归直线v=α+βu的斜率和截距的最小二乘法估计分别为
您最近一年使用:0次
2020-05-04更新
|
536次组卷
|
4卷引用:2020届湖北省高三下学期4月高考模拟文科数学试题
2020高三·全国·专题练习
解题方法
8 . 在某学校进行的一次语文与历史考试中,随机抽取了25位考生的成绩进行分析.25位考生的语文成绩已经统计在茎叶图中,历史成绩如下:85,52,64,49,55,71,90,66,46,66,39,61,56,78,67,77,58,73,42,80,72,67,70,51,65.
(1)请根据数据在茎叶图中完成历史成绩的统计;
(2)请根据数据完成语文成绩的频数分布表及语文成绩的频率分布直方图;
(3)设上述样本中第位考生的语文、历史成绩分别为,通过对样本数据进行初步处理发现:语文历史成绩具有线性相关关系,得到,,,,.求关于的线性回归方程,并据此预测,当某考生的语文成绩为110分时,该生的历史成绩为多少?(精确到1分)
附:回归直线方程的斜率和截距的最小二乘法估计公式分别为,
.
(1)请根据数据在茎叶图中完成历史成绩的统计;
(2)请根据数据完成语文成绩的频数分布表及语文成绩的频率分布直方图;
语文成绩分组 | |||||||
频数 |
(3)设上述样本中第位考生的语文、历史成绩分别为,通过对样本数据进行初步处理发现:语文历史成绩具有线性相关关系,得到,,,,.求关于的线性回归方程,并据此预测,当某考生的语文成绩为110分时,该生的历史成绩为多少?(精确到1分)
附:回归直线方程的斜率和截距的最小二乘法估计公式分别为,
.
您最近一年使用:0次
9 . 某大学就业部从该大学2018年毕业且已就业的大学本科生中随机抽取了100人进行了问卷调查,其中有一项是他们的薪酬,经调查统计,他们的月薪在3000元到10000元之间,根据统计数据得到如下频率分布直方图:
若月薪在区间的左侧,则认为该大学本科生属“就业不理想”的学生,学校将与本人联系,为其提供更好的指导意见.其中,分别是样本平均数和样本标准差,计算得(同一组中的数据用该组区间的中点值作代表)
(1)现该校2018届本科毕业生张静的月薪为3600元,判断张静是否属于“就业不理想”的学生?用样本估计总体,从该校2018届本科毕业生随机选取一人,属于“就业不理想”的概率?
(2)为感谢同学们对调查的支持配合,该校利用分层抽样的方法从样本的前3组中抽出6人,每人赠送一份礼品,并从这6人中再抽取2人,每人赠送新款某手机1部,求获赠手机的2人中恰有1人月薪不超过5000元的概率.
若月薪在区间的左侧,则认为该大学本科生属“就业不理想”的学生,学校将与本人联系,为其提供更好的指导意见.其中,分别是样本平均数和样本标准差,计算得(同一组中的数据用该组区间的中点值作代表)
(1)现该校2018届本科毕业生张静的月薪为3600元,判断张静是否属于“就业不理想”的学生?用样本估计总体,从该校2018届本科毕业生随机选取一人,属于“就业不理想”的概率?
(2)为感谢同学们对调查的支持配合,该校利用分层抽样的方法从样本的前3组中抽出6人,每人赠送一份礼品,并从这6人中再抽取2人,每人赠送新款某手机1部,求获赠手机的2人中恰有1人月薪不超过5000元的概率.
您最近一年使用:0次
2020-05-03更新
|
260次组卷
|
2卷引用:2019届湖北省鄂东南省级示范高中教育教学改革联盟学校高三下学期第一次模拟考试数学(文)试题
解题方法
10 . 某电信运营公司为响应国家5G网络建设政策,拟实行5G网络流量阶梯定价.每人月用流量中不超过(一种流量计算单位)的部分按2元收费;超出的部分按4元收费.从用户群中随机调查了10000位用户,获得了他们某月的流量使用数据.整理得到如下的频率分布直方图:
(1)若为整数,依据本次调查,为使80以上用户在该月的流量价格为2元,至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当时,试估计用户该月的人均流量费.
(1)若为整数,依据本次调查,为使80以上用户在该月的流量价格为2元,至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当时,试估计用户该月的人均流量费.
您最近一年使用:0次