年份序号x | 1 | 2 | 3 | 4 | 5 |
招生人数y/千人 | 0.8 | 1 | 1.3 | 1.7 | 2.2 |
(2)求关于的回归直线方程,并预测当年份序号为7时该校的招生人数.
参考数据:,,.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,.
父亲身高 | 160 | 170 | 175 | 185 | 190 |
儿子身高 | 170 | 174 | 175 | 180 | 186 |
(1)根据表中数据,求出y关于x的线性回归方程,并利用回归直线方程分别确定儿子比父亲高和儿子比父亲矮的条件,由此可得到怎样的遗传规律?
(2)记,,其中为观测值,为预测值,为对应的残差.求(1)中儿子身高的残差的和、并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立加以证明;若不成立说明理由.
学生编号i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号i | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01);
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:;
(ii)用(i)的公式求得这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”约为0.91,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.
;;.
天数 | 1 | 2 | 3 | 4 | 5 | 6 |
繁殖个数 | 6 | 12 | 25 | 49 | 95 | 190 |
(1)在图中作出繁殖个数关于天数变化的散点图,并由散点图判断(为常数)与(为常数,且)哪一个适宜作为繁殖个数关于天数变化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程(为常数,且),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.
3.50 | 62.83 | 3.53 | 17.50 | 596.57 | 12.09 |
(ⅱ)根据(ⅰ)的判断结果及表中数据,建立关于的回归方程(系数保留2位小数).
附:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.
航空公司编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
航班正点率/% | 82 | 77 | 77 | 76 | 74 | 73 | 71 | 70 | 91 | 69 |
顾客投诉次数/次 | 21 | 58 | 79 | 68 | 74 | 93 | 72 | 122 | 18 | 125 |
(1)(i)证明:样本相关系数;
(ii)根据以上数据计算样本相关系数(结果保留2位小数),并由此推断顾客投诉次数与航班正点率之间的线性相关程度(若,则认为线性相关程度很强;若,则认为线性相关程度一般;若,则认为线性相关程度很弱).
(2)用一元线性回归模型对上表中的样本数据进行拟合,得到顾客投诉次数关于航班正点率的经验回归方程为.现有一家航空公司拟通过加强内部管理来减少由于公司自身原因引起的航班延误次数,并希望一年内收到的顾客投诉不超过73次,试估计该公司的航班正点率应达到多少?
参考公式:样本相关系数.
x | … | 2.7 | 3.6 | 3.2 | 3.9 | … |
y | … | 50.6 | 63.7 | 52.1 | 54.3 | … |
(1)利用最小二乘估计建立y关于x的线性回归方程;
(2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系下,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.设前者与后者的斜率分别为,,比较,的大小关系,并证明.
附:y关于x的回归方程中,斜率和截距的最小二乘估计公式分别为: ,,
(1)如果某同学进行该抽球游戏时,最多进行三轮,即使第三轮不成功,也停止抽球,记其进行抽球试验的轮次数为随机变量,求的分布列和数学期望;
(2)为验证抽球试验成功的概率不超过,假设有1000名学生独立的进行该抽球试验,记表示成功时抽球试验的轮次数,表示对应的人数,部分统计数据如下:
1 | 2 | 3 | 4 | 5 | |
120 | 62 | 33 | 20 | 15 |
(3)证明:.
附:经验回归方程系数:,;
参考数据:,,(其中,).
8 . 某校20名学生的数学成绩和知识竞赛成绩如下表:
学生编号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
数学成绩 | 100 | 99 | 96 | 93 | 90 | 88 | 85 | 83 | 80 | 77 |
知识竞赛成绩 | 290 | 160 | 220 | 200 | 65 | 70 | 90 | 100 | 60 | 270 |
学生编号 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
数学成绩 | 75 | 74 | 72 | 70 | 68 | 66 | 60 | 50 | 39 | 35 |
知识竞赛成绩 | 45 | 35 | 40 | 50 | 25 | 30 | 20 | 15 | 10 | 5 |
计算可得数学成绩的平均值是,知识竞赛成绩的平均值是,并且,,.
(1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到).
(2)设,变量和变量的一组样本数据为,其中两两不相同,两两不相同.记在中的排名是第位,在中的排名是第位,.定义变量和变量的“斯皮尔曼相关系数”(记为)为变量的排名和变量的排名的样本相关系数.
(i)记,.证明:.
(ii)用(i)的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确到).
(3)比较(1)和(2)(ii)的计算结果,简述“斯皮尔曼相关系数”在分析线性相关性时的优势.
注:参考公式与参考数据.;;.
x | … | 2.7 | 3.6 | 3.2 | … |
y | … | 57.8 | 64.7 | 62.6 | … |
(1)利用最小二乘法估计建立y关于x的线性回归方程;
(2)该小组又利用这组数据建立了x关于y的线性回归方程,并把这两条拟合直线画在同一坐标系xOy下,横坐标x,纵坐标y的意义与植被覆盖面积x和野生动物数量y一致.
(i)求这两条直线的公共点坐标.
(ii)比较与的斜率大小,并证明.
附:y关于x的线性回归方程中.,,
10 . 为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下:
天数x | 1 | 2 | 3 | 4 | 5 | 6 |
繁殖个数y | 6 | 12 | 25 | 49 | 95 | 190 |
(1)在图中作出繁殖个数y关于天数x变化的散点图,并由散点图判断(a,b为常数)与(,为常数,且,)哪一个适宜作为繁殖个数y关于天数x变化的回归方程类型?(给出判断即可,不必说明理由)
(2)对于非线性回归方程(,为常数,且,),令,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值.
3.50 | 62.83 | 3.53 | 17.50 | 596.57 | 12.09 |
①证明:“对于
②根据(1)的判断结果及表中数据,建立y关于x的回归方程(系数保留2位小数).
附:对于一组数据,,…,,其回归直线方程的斜率和截距的最小二乘估计分别为,.