名校
1 . 某市联考后,从全体考生中随机抽取44名,获取他们本次考试的数学成绩和物理成绩,绘制成如图散点图:
(1)若不剔除两名考生的数据,用44组数据作回归分析,设此时与的相关系数为.试判断与的大小关系,并说明理由;
(2)求关于的线性回归方程,并估计如果考生参加了这次物理考试(已知考生的数学成绩为126分),物理成绩是多少?
(3)从概率统计规律看,本次考试该市的物理成绩服从正态分布,以剔除后的物理成绩作为样本,用样本平均数作为的估计值,用样本方差作为的估计值.试求该市共40000名考生中,物理成绩位于区间的人数的数学期望.
附:①回归方程中:
②若,则
③
根据散点图可以看出与之间有线性相关关系,但图中有两个异常点.经调查得知,考生由于重感冒导致物理考试发挥失常,考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据作处理,得到一些统计的值:其中,分别表示这42名同学的数学成绩、物理成绩,,2,…,42,与的相关系数.
(1)若不剔除两名考生的数据,用44组数据作回归分析,设此时与的相关系数为.试判断与的大小关系,并说明理由;
(2)求关于的线性回归方程,并估计如果考生参加了这次物理考试(已知考生的数学成绩为126分),物理成绩是多少?
(3)从概率统计规律看,本次考试该市的物理成绩服从正态分布,以剔除后的物理成绩作为样本,用样本平均数作为的估计值,用样本方差作为的估计值.试求该市共40000名考生中,物理成绩位于区间的人数的数学期望.
附:①回归方程中:
②若,则
③
您最近半年使用:0次
名校
2 . 下列命题正确的是( )
A.若样本数据的方差为2,则数据的方差为8 |
B.已知互不相同的30个样本数据,若去掉其中最大和最小的数据,剩下28个数据的20%分位数不等于原样本数据的20%分位数 |
C.若A,B两组成对数据的样本相关系数分别为,,则A组数据比B组数据的线性相关程度更强 |
D.若决定系数的值越接近于1,则表示回归模型的拟合效果越好 |
您最近半年使用:0次
名校
3 . 下列命题正确的是( )
A.若A,B两组成对数据的样本相关系数分别为,,则A组数据比B组数据的相关性较强 |
B.决定系数越大的模型,拟合的效果越好 |
C.回归直线至少会经过其中一个样本点 |
D.以模型去拟合某组数据时,为了求出回归方程,设,将其变换后得到线性方程,则a,b的值分别为2,6 |
您最近半年使用:0次
名校
4 . 已知由样本数据(i=1,2,3,…,10)组成的一个样本,得到回归直线方程为,且.剔除一个偏离直线较大的异常点后,得到新的回归直线经过点.则下列说法正确的是
A.相关变量x,y具有正相关关系 |
B.剔除该异常点后,样本相关系数的绝对值变大 |
C.剔除该异常点后的回归直线方程经过点 |
D.剔除该异常点后,随x值增加相关变量y值减小速度变小 |
您最近半年使用:0次
2024-04-15更新
|
1306次组卷
|
3卷引用:安徽省芜湖市安徽师范大学附属中学2024届高三第二次模拟考试数学试题
名校
解题方法
5 . 将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15个区域进行编号,统计抽取到每个区域的某种水源指标和区域内该植物分布的数量(,2,…,15),得到数组.已知,,.
(1)求样本(,2…,15)的相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数).研究人员统计大量数据后发现:对于任意的,寿命为的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均等于0.1,这种现象被称为“几何分布的无记忆性”.
(ⅰ)求()的表达式;
(ⅱ)推导该植物寿命期望的值.
附:相关系数.
(1)求样本(,2…,15)的相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数).研究人员统计大量数据后发现:对于任意的,寿命为的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均等于0.1,这种现象被称为“几何分布的无记忆性”.
(ⅰ)求()的表达式;
(ⅱ)推导该植物寿命期望的值.
附:相关系数.
您最近半年使用:0次
2024-04-13更新
|
1076次组卷
|
2卷引用:湖南省部分学校2024届高三下学期一起考大联考模拟(二)数学试题
6 . 某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量.随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
并计算得.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
附:相关系数,.
样本号i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 总和 |
根部横截面积 | 0.04 | 0.06 | 0.04 | 0.03 | 0.08 | 0.05 | 0.05 | 0.07 | 0.07 | 0.06 | 0.6 |
材积量 | 0.25 | 0.40 | 0.22 | 0.54 | 0.51 | 0.34 | 0.36 | 0.46 | 0.42 | 9.40 | 3.9 |
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01).
附:相关系数,.
您最近半年使用:0次
2024高三·全国·专题练习
解题方法
7 . 近年来,随着国家对新能源汽车产业的支持,很多国产新能源汽车迅速崛起,其因颜值高、动力充沛、提速快、空间大、用车成本低等特点得到民众的追捧,但是充电难成为影响新能源汽车销量的主要原因,国家为了加快新能源汽车的普及程度,在全国范围内逐步增建充电桩.某地区2019-2023年的充电桩数量及新能源汽车的年销量如表所示:
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明(结果精确到0.001);
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
年份 | 2019 | 2020 | 2021 | 2022 | 2023 |
充电桩数量x/万台 | 1 | 3 | 5 | 7 | 9 |
新能源汽车年销量y/万辆 | 25 | 37 | 48 | 58 | 72 |
(2)求y关于x的线性回归方程,预测当该地区充电桩数量为24万台时,新能源汽车的年销量是多少万辆?
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
参考数据:,,,.
您最近半年使用:0次
8 . ①线性回归方程必过;②独立性检验的统计假设是各事件之间相互独立③相关系数越小,表明两个变量相关性越弱;④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;其中正确的说法是___________ .(把你认为正确的结论都写在横线上)
您最近半年使用:0次
名校
解题方法
9 . 下列说法错误的是( )
A.若随机变量、满足且,则 |
B.样本数据,,,,,,,,,的第百分位数为 |
C.若事件、相互独立,则 |
D.若、两组成对数据的相关系数分别为、,则组数据的相关性更强 |
您最近半年使用:0次
2024-04-08更新
|
948次组卷
|
2卷引用:山东省菏泽第一中学南京路校区2024届高三下学期3月月考数学试题
名校
解题方法
10 . 下列结论正确的是( )
A.一组样本数据的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为 |
B.已知随机变量,若,则 |
C.在列联表中,若每个数据均变成原来的2倍,则也变成原来的2倍(,其中) |
D.分别抛掷2枚质地均匀的骰子,若事件“第一枚骰子正面向上的点数是奇数”,“2枚骰子正面向上的点数相同”,则互为独立事件 |
您最近半年使用:0次
2024-04-08更新
|
1534次组卷
|
3卷引用:山东省临沂市2024届高三下学期一模考试数学试题