1.简单随机抽样
(1)定义:一般来说,一个群体包含N个个体,逐一选取N个个体作为样本(n≤N)。如果在每次抽样时,群体中的每个个体都有均等的机会被选中,这种抽样方法称为简单随机抽样。这样选出的样本称为简单随机样本。
(2)常用方法:抽签和随机数。
2.分层抽样
(1)抽样时,将整个种群分成不相交的层,然后按一定比例从每层中独立抽取一定数量的个体,将每层抽取的个体一起作为样本。这种抽样方法是分层抽样。
(2)分层抽样的适用范围
当总体由几个差异明显的部分组成时,常采用分层抽样。
3.频率分布直方图
(1)纵轴表示组间距(频率),即小矩形的高度=组间距(频率);
(2)小矩形的面积=组距×组距(频率)=频率;
(3)每个小正方形的面积之和等于1。
4.频率分布表的绘制
第一步:求值域,确定组数和组距,组距=组数(值域);
第二步:分组,通常取组内值所在区间的左闭和右开区间,取最后一组的闭区间;
第三步:登记频率,计算频率,列出频率分布表。
5.条形图、折线图和扇形图
(1)柱状图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据的类型,纵轴上的单位长度表示一定的量。根据每个样本(或一定范围内的样本)的量,画出等宽的不同长度的矩形,然后将这些矩形按照一定的顺序排列。这种表达和分析数据的统计图称为条形图。
(2)线图:建立直角坐标系,用横轴上的数字代表样本值,纵轴上的单位长度代表某个量。根据样本值和数量,画出相应的点,然后用线段将点依次连接起来,得到一条折线,用这条折线来表示样本数据。这种表示和分析数据的统计图称为线图。
(3)扇形图:用一个圆来代表总体,圆内的每个扇形代表总体的不同部分,每个扇形的大小反映了所代表的部分在总体中所占的百分比。这种用于表示和分析数据的统计图称为扇形图。
6.中位数、众数和平均数的定义
(1)中位数
按大小顺序排列一组数据,中间的数据(或中间两个数据的平均值)称为这组数据的中位数。
(二)模式
在一组数据中出现频率最高的数据称为这组数据的模式。
(3)平均
一组数据的算术平均值就是这组数据的平均值,n个数据x1,x2,…,xn = n (1) (x1+x2+…+xn)的平均值。
7.样本的数字特征
1.频率分布直方图中的常见结论
(1)模式的估计值是对应于最高矩形的中点的横坐标。
(2)平均值的估计值等于频率分布直方图中每个小矩形的面积之和乘以小矩形底部中点的横坐标。
(3)中值估计左右小矩形的面积和相等。
2.均值和方差公式的推广
(1)如果数据x1,x2,…,xn的平均值为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均值为m+a .
(2)如果数据x1,x2,…,xn的方差为s2,那么数据ax1+b,ax2+b,…,axn+b的方差为a2s2。
1.简单随机抽样应用中应注意的问题
(1)抽样检测能否使用抽签取决于两点:一是抽签是否方便;就是2号拍品是不是好搅。一般来说,当总体容量和样本容量较小时,可以采用抽签法。
(2)使用随机数法时,如果遇到三位数或四位数,可以从所选随机数表中一行或一列的数字开始计数,从左到右每三位数或四位数选一个,超过总数或有重复数的数字将被丢弃。
2.分层抽样问题的类型及解决方法。
(1)求某一层要抽的个体数:根据该层占总数的比例计算。
(2)给定某一层的个体数,求总容量或反过来:按分层抽样,即按比例抽样,列按比例计算。
(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=总容量(样本容量)=每层个体数(每层样本数)”。
1.变量之间的相关性
(1)两个变量之间有两种常见的关系:一种是函数关系,一种是相关关系;与函数关系不同,相关关系是一种非确定性关系。
(2)从散点图上看,点分散在从左下角到右上角的区域,两个变量之间的这种相关性称为正相关;点分散在左上角到右下角的区域,两个变量的相关性为负。
2.两个变量的线性相关
(1)从散点图上看,如果这些点总体上大致分布在一条穿过散点图中心的直线附近,则称两个变量之间存在线性相关关系,这条直线称为回归直线。
(2)回归方程为(y) = (b) x+(a),其中
^(b)=)2(n)=2(2)、^(a)=-^(b).
(3)通过寻找(yi-bxi-a) 2 (n)的最小值得到回归线,即样本数据到回归线的距离的平方和最小。这种方法称为最小二乘法。
(4)相关系数:
当r > 0时,两个变量正相关;
当r < 0时,两个变量负相关。
r的绝对值越接近1,两个变量之间的线性相关性越强。r的绝对值越接近0,两个变量之间的线性相关性越小。通常,当|r|大于0.75时,认为这两个变量具有很强的线性相关性。
3.独立性检验
(1)2×2列联表
设x,y为两个变量,它们的值分别为{x1,x2}和{y1,y2},它们的样本频率序列列联表(2×2列联表)如下:
y1
y2
相当于
x1
a
b
a+b
x2
c
d
c+d
相当于
a+c
b+d
a+b+c+d
(2)独立性测试
独立性检验是判断两个变量之间关系的可靠性,而不是判断它们是否相关。
[共同结论]
1.求解回归方程的关键是确定回归系数(a)、(b),回归直线要充分利用穿过样本的中心点(,)。
2.根据K2的值,我们可以判断两个分类变量之间相关性的可靠性。如果K2越大,两个分类变量之间的相关性的置信度就越大。
3.根据回归方程计算的(y)值只是预测值,不是真实值。
判断相关性的两种方法
(1)散点图法:如果所有样本点都落在一个函数的曲线附近,则变量之间存在相关性。如果所有样本点都落在一条直线附近,则变量之间存在线性相关性。
(2)相关系数法:用相关系数来判断|r|越接近1,相关性越强。
以上就是由优质生活领域创作者 果果生活网小编 整理编辑的,如果觉得有帮助欢迎收藏转发~
本文标题:频率怎么求(频率频数组距之间的关系)
本文地址:https://www.gjuuu.com/677110.html,转载请说明来源于:果果生活网
声明:本站部分文章来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场。