23-24高二下·全国·课前预习
1 . 变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;
(2)散点图:将样本中n个数据点()描在平面直角坐标系中得到的统计图叫做散点图,是描述成对数据之间关系的一种直观方法;
(3)正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量________ ;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量________ ;
(4)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;
(5)非线性相关与曲线相关:如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关;
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;
(2)散点图:将样本中n个数据点()描在平面直角坐标系中得到的统计图叫做散点图,是描述成对数据之间关系的一种直观方法;
(3)正相关与负相关:如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量
(4)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;
(5)非线性相关与曲线相关:如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关;
您最近一年使用:0次
23-24高二下·全国·课前预习
2 . 样本相关系数
(1)样本相关系数:设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
两组数据和的线性相关系数是度量两个变量x与y之间线性相关程度的统计量,
其计算公式为_______ ,
其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质
①当时,称成对样本数据正相关;
当时,成对样本数据负相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为[-1,1];
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
(1)样本相关系数:设由变量x和y获得的两组数据分别为和(i=1,2,…,n),其对应关系如下表所示:
变量x | … | |||||||
变量y | … |
其计算公式为
其中,,,它们分别是这两组数据的算术平均数.
(2)相关系数r的性质
①当时,称成对样本数据正相关;
当时,成对样本数据负相关;
当时,成对样本数据间没有线性相关关系;
②样本相关系数r的取值范围为[-1,1];
当越接近1时,成对样本数据的线性相关程度越强;
当越接近0时,成对样本数据的线性相关程度越弱.
您最近一年使用:0次
23-24高二下·全国·课前预习
3 . 一元线性回归模型
(1)一元线性回归模型
在研究两个变量线性相关时,我们常利用成对样本数据建立统计模型,并利用模型进行预测. ①我们称①式为Y关于x的一元线性回归模型.
其中,Y称为因变量或________ ,x称为自变量或__________ ;
a和b为模型的未知参数,a称为______ 参数,b称为斜率参数;e是Y与bx+a之间的_______ .
如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.
(2)一元线性回归模型参数的最小二乘估计
回归直线方程过样本点的中心_______ ,是回归直线方程最常用的一个特征.
(3)我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计,其中
(1)一元线性回归模型
在研究两个变量线性相关时,我们常利用成对样本数据建立统计模型,并利用模型进行预测. ①我们称①式为Y关于x的一元线性回归模型.
其中,Y称为因变量或
a和b为模型的未知参数,a称为
如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.
(2)一元线性回归模型参数的最小二乘估计
回归直线方程过样本点的中心
(3)我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.
这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计,其中
您最近一年使用:0次
23-24高二下·全国·课前预习
4 . n重伯努利试验
(1)伯努利试验:我们把只包含两个可能结果的试验叫做伯努利试验;
(2)定义:将一个伯努利实验独立地重复进行次所组成的随机试验称为n重伯努利实验;
(3)特征:(1)同一个伯努利实验重复做n次;(2)各次试验的结果______ .
(1)伯努利试验:我们把只包含两个可能结果的试验叫做伯努利试验;
(2)定义:将一个伯努利实验独立地重复进行次所组成的随机试验称为n重伯努利实验;
(3)特征:(1)同一个伯努利实验重复做n次;(2)各次试验的结果
您最近一年使用:0次
5 . 二项分布
(1)二项分布:一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为,用X表示事件A发生的次数,则X的分布列为,.如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作______ ,且有______ ,______ .
注:n次独立重复试验中恰好发生k次的概率与第k次才发生的概率计算公式分别是与.
(2)确定一个二项分布模型的步骤
①明确伯努利试验及事件A的意义,确定事件A发生的概率p;
②确定重复试验的次数,并判断各次试验的独立性;
③设的次独立重复试验中事件发生的次数,则
(1)二项分布:一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为,用X表示事件A发生的次数,则X的分布列为,.如果随机变量X的分布列具有上式的形式,则称随机变量X服从二项分布,记作
注:n次独立重复试验中恰好发生k次的概率与第k次才发生的概率计算公式分别是与.
(2)确定一个二项分布模型的步骤
①明确伯努利试验及事件A的意义,确定事件A发生的概率p;
②确定重复试验的次数,并判断各次试验的独立性;
③设的次独立重复试验中事件发生的次数,则
您最近一年使用:0次
23-24高二下·全国·课前预习
解题方法
6 . 分类变量
(1)分类变量:为了方便,用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
(2)取值:分类变量的取值可以用________ 表示.
(3)范围:本节主要讨论取值于的分类变量的关联性问题.
(4)判断分类变量之间关系的方法
①利用数形结合思想,借助等高堆积条形图来判断两个分类变量是否相关是判断变量是否相关的常见方法;
②在等高堆积条形图中,与相差越大,两个分类变量有关系的可能性就越大.
(1)分类变量:为了方便,用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
(2)取值:分类变量的取值可以用
(3)范围:本节主要讨论取值于的分类变量的关联性问题.
(4)判断分类变量之间关系的方法
①利用数形结合思想,借助等高堆积条形图来判断两个分类变量是否相关是判断变量是否相关的常见方法;
②在等高堆积条形图中,与相差越大,两个分类变量有关系的可能性就越大.
您最近一年使用:0次
23-24高二下·全国·课前预习
7 . 列联表
列联表:一般地,假设两个分类变量和,它们的取值为,其样本频数列联表(也称为列联表)为
列联表给出了成对分类变量数据的____________ .
列联表:一般地,假设两个分类变量和,它们的取值为,其样本频数列联表(也称为列联表)为
合计 | |||
合计 |
您最近一年使用:0次
23-24高二下·全国·课前预习
8 . 等高堆积条形图
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据__________ 的原理,我们可以推断结果.
等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征,依据
您最近一年使用:0次
23-24高二下·全国·课前预习
9 . 独立性检验
(1)计算公式:,其中.
(2)临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值越大.
(3)独立性检验:,通常称为_______ 或原假设.
基于小概率值的检验规则是:
当时,我们就推断不成立,即认为和______ ,该推断犯错误的概率不超过;
当时,我们没有充分证据推断不成立,可以认为和独立.
这种利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“_______________ ”,简称独立性检验.
(4)独立性检验中几个常用的小概率值和相应的临界值
(1)计算公式:,其中.
(2)临界值的定义:对于任何小概率值,可以找到相应的正实数,使得成立,我们称为的临界值,概率值越小,临界值越大.
(3)独立性检验:,通常称为
基于小概率值的检验规则是:
当时,我们就推断不成立,即认为和
当时,我们没有充分证据推断不成立,可以认为和独立.
这种利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“
(4)独立性检验中几个常用的小概率值和相应的临界值
0. 1 | 0. 05 | 0. 01 | 0. 005 | 0. 001 | |
2. 706 | 3. 841 | 6. 635 | 7. 879 | 10. 828 |
您最近一年使用:0次
23-24高二下·全国·课前预习
10 . 0-1分布
(1)定义:对于只有两个可能结果的随机试验,用A表示“成功”,表示“失败”,
定义如果,则________ ,那么X的分布列如表所示.
我们称X服从两点分布或0-1分布.
【注意】随机变量X只取0和1,才是两点分布,否则不是.
(2)两点分布的适用范围
①研究只有两个结果的随机试验的概率分布规律;
②研究某一随机事件是否发生的概率分布规律.
如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等,都可以用两点分布来研究.
(1)定义:对于只有两个可能结果的随机试验,用A表示“成功”,表示“失败”,
定义如果,则
X | 0 | 1 |
【注意】随机变量X只取0和1,才是两点分布,否则不是.
(2)两点分布的适用范围
①研究只有两个结果的随机试验的概率分布规律;
②研究某一随机事件是否发生的概率分布规律.
如抽取的彩票是否中奖;买回的一件产品是否为正品;新生婴儿的性别;投篮是否命中等,都可以用两点分布来研究.
您最近一年使用:0次