主页 > imtokenios下载 > 2011安全生产管理辅导:统计学基础知识(4)

2011安全生产管理辅导:统计学基础知识(4)

imtokenios下载 2023-03-22 07:50:13

四、统计描述和统计推断

统计学的主要工作是对统计数据进行统计描述和统计推断。统计描述是统计分析的最基本内容,是指利用统计指标、统计表格、统计图表等方法,衡量和描述数据的数量特征和分布;而统计推断是指通过抽样等方法进行样本估计。人口特征的过程,包括参数估计和假设检验。

(一)统计说明

1、测量数据的统计描述

测量数据的统计描述主要通过编制频率分布表、计算中心趋势指数和离散趋势指数以及统计图表来进行。

(1)中心趋势。指频率表中的频率分布为频率集中在某个位置的趋势。

集中趋势的描述性指标:

1)算术平均值。

直接法:

x为观测值,z为数加权法,也称为频数表法,适用于频数表数据,在观测例数较多时使用。

f 是每个组段的频率。

2)几何平均值(8e.mebic 平均值)。几何平均值用符号G表示,用来反映一组变量值经过对数变换后对称分布的量化平均值。

直接法:

加权法也称为频率表法。当观测例数 n 较大时,可先编制频数分布表,通过此方法计算几何平均数:

3)百分位数和中位数。百分位是一种位置指标,用符号Px表示。常用的百分位数是 p2.5、p5、p25、p50、 p95、p95、p99.@ >5 等,其中 p25、p50、p75 也称为四分位数。百分位数常用于描述一组观测值在某个百分位数的水平,多个百分位数可以组合使用,更全面地描述数据的分布特征。

中位数是一个特定的百分位数或 s.,用符号 M 表示。按降序(或从大到小)排列一组观测值,中心的数据是中位数。中位数也是反映频率分布集中位置的统计指标,但只是从中间位置的一些变量值计算得出,不能反映所有值的变化,所以中位数缺乏敏感性。中位数理论上可以用于任何分布类型的数据,但在实践中常用于具有偏态分布的数据和分布两端值不确定的数据。计算方法有两种:直接法和频率表法。

直接法:这种方法常用于观察例数 n 不大的情况。首先将观测值按数量级排列,并使用以下公式求 M。

频数表法:当观察病例数较多时,可先编制频数表,再通过频数表计算中位数。

公式为:

式中,i为组段的组距,L为下限,∑fI为小于L的各组的累积频率,fX为中值所在组段的频率。

(2)离散趋势。虽然频率​​集中在某个位置,但频率分布表明每个组都有一个频率分布,而不是所有频率都分布在一个集中位置的趋势。

集中趋势的常见指标有:

1)计算范围的公式为:

和=xMAX-Xmin。

全距离越大,变量的可变性越大。度量单位与原始变量的单位相同。

2)四分位距(quartile)是一组数值变量值的上四分位数(即P75,记为Qu)和下四分位数。

数字之间的差异(即 P25,表示为 QL)由符号 QR 表示。计算公式为:

QR=P75-P25

一般与中位数一起使用来描述偏态数据的分布特征。

2.计数数据的统计说明

计数数据的统计描述不同于测量数据的统计描述。通常用三类指标来描述:比率、构成比和比率。这些指标由两个指标的比值组成,所以称为相对数。

(1)比率(也称为相对比率)。是两个相关指标的比率,表示A是B的几倍或百分比。

(2) 成分比。也叫成分指数,是指一个事物内某一成分的观察单元数与该事物之间的差值

各成分的观察单元总数之比,​​用来描述事物中各成分的比例或分布。

注:各组分的组成比之和为100%。如果某一部分的比例增加,其他部分相应减少。

(3)率。它是指一个现象在一定条件下实际发生的观测单元数与可能发生的观测单元总数的比值,用来描述一个现象发生的频率或强度。一定的现象。

例如:发病率、患病率、死亡率、病死率等。

注:不受其他指标影响;这些比率是相互独立的,并且它们的总和不是 1(如果是统计全距怎么算,那是巧合)。

应用相对数的注意事项:

1)比率不能代替分析中的比率。

2)计算相对数时分母不能太小。

3)总率(平均率)的计算:不能直接相加求和。

4)数据可比性:两种速率均在相同条件下运行。例如,研究方法相同,研究对象同质,观察时间相等,地域、民族、年龄、性别等。

(二)统计推断

从样本信息推断总体特征称为统计推断。参数估计和假设检验是统计推断的两个重要方面。

1. 参数估计

参数估计是通过样本估计整体特征,包括点值估计和区间估计。

(1)点值估计。即直接将样本均值作为总体均值的估计值。

(2)区间估计。总体均值的 95% 置信区间的含义是由样本均值确定的总体均值的位置。

周长包含总体均值的可能性为 95%。根据样本均值符合t分布的特点,采用f分布曲线下面积来估计总体均值可能落入的区间和范围。当样本量较大时,可以采用u分布反而。

2. 假设检验

假设检验是一种统计推断方法,用于判断样本与总体的差异是由抽样误差还是本质差异引起的。

(1)假设检验的基本思想。假设检验的基本思想是小概率反证法的思想。小概率思想是指小概率事件(P3< @0),样本均值符合正态分布,所以可以使用U检验进行分析,当样本量n较小时,如果观测值x符合正态分布,则使用t检验(所以样本均值符合 t 分布),当 x 为未知分布时统计全距怎么算,应使用秩和检验。

(1)比较样本均值和总体均值的 t 检验。比较样本均值和总体均值的 t 检验实际上是在推断样本来自的总体均值 μ 不同于已知的人口均值μ0(常为理论值或标准值)是否存在差异,如根据大量调查,已知健康成年男性的平均脉搏为72次/分。为74.2次/分,标准差为6.0次/分,是否可以认为该山区成年男性的平均脉率高于一般成年男性。

上述两种方式的差异可能是采样误差造成的,也可能是环境差异的影响。为此,可以用t检验来判断。测试过程如下:

1)创建假设

h0:μ=μo=72次/min,H1:μ>Lu μ0,检测水平为单面0.05.

2)计算统计。在进行比较样本均值和总体均值的 t 检验时,t 值是样本均值与总体均值之差的绝对值除以标准误差的商,其中标准误差是标准差除以样本量的算术平方根。

3)确定概率并做出判断。取自由度v(样本量n减去1)查看t边界值表,0.025

需要注意的是,当样本量“较大”时,可以使用检验代替 f 检验。

(2)配对设计,测试。配对设计是一种比较特殊的设计方法,可以很好地控制非实验因素对结果的影响。有自匹配和非自匹配之分。配对设计data ,检验实际上是比较成对差值与整体均值“o”,即推断差值的总体均值是否为“o”。因此,检验过程类似于比较样本均值和比较样本均值的f检验整体平均值,即:

1)创建假设

Ho:ud=0,即差的整体均值为“0”,H1:μd>0或μd=0.05,则Ho不能被拒绝。

(3)组设计两样本均值比较,检验。组设计两样本均值比较t检验也称为组比较或完全随机设计t检验,其目的是分别推断出两个样本是否代表总体均值相等或不相等,测试过程同以上两种;

对于两个样本均值的比较,一般假设为:Ho:μ1=μ2,即两个样本的总体均值相等,H1:μ1>μ2或μ1