1 . 如下图所示的是“概率”知识的________ .
您最近一年使用:0次
2 . 针对两个分类变量作独立性检验,若统计量的值越大,则说明这两个分类变量间有关系的可能性________ .
您最近一年使用:0次
2023高二·全国·专题练习
3 . 一元线性回归模型及其应用
(1)一元线性回归模型
在研究两个变量线性相关时,我们常利用成对样本数据建立统计模型,并利用模型进行预测. ①我们称①式为Y关于x的_____________ . 其中,Y称为_________ 或__________ ,x称为_________ 或_________ ;a和b为模型的未知参数,a称为_________ ,b称为_________ ;e是Y与bx+a之间的_________ . 如果_________ ,那么Y与x之间的关系就可用一元线性函数模型来描述.
(2)一元线性回归模型参数的最小二乘估计回归直线方程过样本点的中心,是回归直线方程最常用的一个特征.
我们将称为关于的_________ ,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做_________ ,求得的叫做b,a的_________ ,其中
(3)回归分析
①残差:对于响应变量Y,通过观测得到的数据称为________ ,通过经验回归方程得到的称为预测值,观测值减去预测称为________ .
②刻画回归效果的方式:一是残差图法,残差点比较均匀地落在水平的________ 中,说明选用的模型比较合适,带状区域的宽度________ ,说明模型拟合精度越高;二是残差平方和法,称为残差平方和,残差平方和________ ,模型的拟合效果越好;三是用决定系数R2比较,,R2越大,模型的拟合效果________ ,R2越小,模型的拟合效果________ .
(1)一元线性回归模型
在研究两个变量线性相关时,我们常利用成对样本数据建立统计模型,并利用模型进行预测. ①我们称①式为Y关于x的
(2)一元线性回归模型参数的最小二乘估计回归直线方程过样本点的中心,是回归直线方程最常用的一个特征.
我们将称为关于的
(3)回归分析
①残差:对于响应变量Y,通过观测得到的数据称为
②刻画回归效果的方式:一是残差图法,残差点比较均匀地落在水平的
您最近一年使用:0次
2023高二·全国·专题练习
4 . 列联表与独立性检验
(1)分类变量与列联表
①分类变量:为了表述的方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为________ .
②列联表:一般地,假设两个分类变量和,它们的取值为,其样本频数列联表(也称为列联表)为
(2)等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
(3)独立性检验
①计算公式:,其中.
②临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值________ .
③独立性检验:,通常称为________ 或________ .基于小概率值的检验规则是:当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立.这种利用的取值推断分类变量和是否独立的方法称为________ ,读作“卡方独立性检验”,简称________ .
④临界值表
(1)分类变量与列联表
①分类变量:为了表述的方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为
②列联表:一般地,假设两个分类变量和,它们的取值为,其样本频数列联表(也称为列联表)为
合计 | |||
合计 |
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.
(3)独立性检验
①计算公式:,其中.
②临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值
③独立性检验:,通常称为
④临界值表
0. 1 | 0. 05 | 0. 01 | 0. 005 | 0. 001 | |
2. 706 | 3. 841 | 6. 635 | 7. 879 | 10. 828 |
您最近一年使用:0次
2023高二·全国·专题练习
5 . 成对数据的统计相关性
(1)变量的相关关系
①相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为______ .
②散点图:将样本中n个数据点()描在平面直角坐标系中得到的统计图叫做______ .
③正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现______ 的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现______ 的趋势,则称这两个变量负相关.
④线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在______ 附近,我们称这两个变量线性相关. 如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量______ 或______ .
(2)样本相关系数
①样本相关系数r的计算公式.我们称r为变量x和变量y的______ .
②r与标准化数据向量夹角的关系
令,,其中,,则.则,故r∈______ .
③样本相关系数r的性质:当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.当|r|越接近于1时,成对样本数据的线性相关程度______ ;当|r|越接近于0时,成对样本数据的线性相关程度______ .当r=0时,只表明成对样本数据间没有线性相关关系,但不排除它们之间有其他相关关系.
(1)变量的相关关系
①相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为
②散点图:将样本中n个数据点()描在平面直角坐标系中得到的统计图叫做
③正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现
④线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在
(2)样本相关系数
①样本相关系数r的计算公式.我们称r为变量x和变量y的
②r与标准化数据向量夹角的关系
令,,其中,,则.则,故r∈
③样本相关系数r的性质:当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.当|r|越接近于1时,成对样本数据的线性相关程度
您最近一年使用:0次