统计分析_P值的含义
发布时间:2019-09-11 发布者:文案编辑 来源:原创/投稿/转载

  统计分析_P值的含义_医药卫生_专业资料。P 值是怎么来的 从某总体中抽 ⑴、这一样本是由该总体抽出,其差别是由抽样误差所致; 这一样本是由该总体抽出,其差别是由抽样误差所致; ⑵、这一样本不是从该总体抽出,所以有所不同。 这一样本不是从该总

  P 值是怎么来的 从某总体中抽 ⑴、这一样本是由该总体抽出,其差别是由抽样误差所致; 这一样本是由该总体抽出,其差别是由抽样误差所致; ⑵、这一样本不是从该总体抽出,所以有所不同。 这一样本不是从该总体抽出,所以有所不同。 如何判断是那种原因呢?统计学中用显著性检验赖判断。其步骤是: 如何判断是那种原因呢?统计学中用显著性检验赖判断。其步骤是: :如要比较 药的疗效是否相等, ⑴、建立检验假设(又称无效假设,符号为 H0) 如要比较 A 药和 B 药的疗效是否相等,则假设两组样本 建立检验假设(又称无效假设, 无效假设 ) : 来自同一总体, 药相等,差别仅由抽样误差引起的碰巧出现的。 来自同一总体,即 A 药的总体疗效和 B 药相等,差别仅由抽样误差引起的碰巧出现的。⑵、选择适当的统计方 成立的可能性即概率有多大, 值表示。 根据选定的显著性水平( ,决定接 法计算 H0 成立的可能性即概率有多大,概率用 P 值表示。⑶、根据选定的显著性水平(0.05 或 0.01) 决定接 ) , 差别由抽样误差引起”, 受还是拒绝 H0。如果 P>0.05,不能否定 差别由抽样误差引起 ,则接受 H0;如果 P<0.05 或 P <0.01,可 。 > ,不能否定“差别由抽样误差引起 ; < , 以认为差别不由抽样误差引起, 以认为差别不由抽样误差引起,可以拒绝 H0,则可以接受令一种可能性的假设(又称备选假设,符号为 H1) , 可以接受令一种可能性的假设(又称备选假设, ) , 即两样本来自不同的总体,所以两药疗效有差别。 即两样本来自不同的总体,所以两药疗效有差别。 统计学上规定的 P 值意义见下表 P 值 碰巧的概率 对无效假设 统计意义 P>0.05 碰巧出现的可能性大于 5% 不能否定无效假设 两组差别无显著意义 > P<0.05 碰巧出现的可能性小于 5% 可以否定无效假设 两组差别有显著意义 < P <0.01 碰巧出现的可能性小于 1% 可以否定无效假设 两者差别有非常显著意义 下述几点必须注意: 理解 P 值,下述几点必须注意: 的意义不表示两组差别的大小, 反映两组差别有无统计学意义,并不表示差别大小。因此, ⑴P 的意义不表示两组差别的大小,P 反映两组差别有无统计学意义,并不表示差别大小。因此,与对照 组相比, 组相比,C 药取得 P<0.05,D 药取得 P <0.01 并不表示 D 的药效比 C 强。 < , ⑵ P>0.05 时,差异无显著意义,根据统计学原理可知,不能否认无效假设,但并不认为无效假设肯定成 > 差异无显著意义,根据统计学原理可知,不能否认无效假设, 两组差别无显著意义”与 两组基本等效 两组基本等效”相同的做法是缺 立。在药效统计分析中,更不表示两药等效。哪种将“两组差别无显著意义 与“两组基本等效 相同的做法是缺 在药效统计分析中,更不表示两药等效。哪种将 两组差别无显著意义 乏统计学依据的。 乏统计学依据的。 值表示, ⑶统计学主要用上述三种 P 值表示,也可以计算出确切的 P 值,有人用 P <0.001,无此必要。 ,无此必要。 ⑷显著性检验只是统计结论。判断差别还要根据专业知识。样所得的样本,其统计量会与总体参数有所不 显著性检验只是统计结论。判断差别还要根据专业知识。样所得的样本, 同,这可能是由于两种原因 值是最常用的一个统计学指标, 值的由来、 P 值是最常用的一个统计学指标,几乎统计软件输出结果都有 P 值。了解 p 值的由来、计算和意义很有必 要。 统计学意义( )(这是经理每次争论的焦点 这是经理每次争论的焦点) 统计学意义(p 值)(这是经理每次争论的焦点) 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p 值为结果可信程度的 结果的统计学意义是结果真实程度( 能够代表总体)的一种估计方法。 专业上, 一个递减指标, 值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标 总体中各变量关联的可靠指标。 一个递减指标,p 值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p 值是将观察 结果认为有效即具有总体代表性的犯错概率。 结果认为有效即具有总体代表性的犯错概率。如 p=0.05 提示样本中变量关联有 5%的可能是由于偶然性造成 的可能是由于偶然性造成 个实验中有一个实验, 的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约 20 个实验中有一个实验,我们所研究 即假设总体中任意变量间均无关联,我们重复类似实验, 的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联, 的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到 5%或 95%次数的 。(这并不是说如果变量间存在关联 或 次数的 相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究 相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究 。) 领域, 值通常被认为是可接受错误的边界水平。 领域,0.05 的 p 值通常被认为是可接受错误的边界水平。 如何判定结果具有真实的显著性 如何判定结果具有真实的显著性 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说, 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无 效而被拒绝接受的水平的选择具有武断性。实践中, 效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先 验性还是仅仅为均数之间的两两比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研 验性还是仅仅为均数之间的两两 比较,依赖于总体数据集里结论一致的支持性证据的数量, 比较 究领域的惯例。通常, 值的结果≤0.05 被认为是统计学意义的边界线,但是这显著性 被认为是统计学意义的边界线, 究领域的惯例。通常,许多的科学领域中产生 p 值的结果 水平还包含了相当高的犯错可能性。 被认为是具有统计学意义, 水平还包含了相当高的犯错可能性。结果 0.05≥p0.01 被认为是具有统计学意义,而 0.01≥p≥0.001 被认为具 有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 计学意义 所有的检验统计都是正态分布的吗? 所有的检验统计都是正态分布的吗? 并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如 t 检验、f 检验或 并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来, 检验、 卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。 卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的 确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。 确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分 析非正态分布变量的数据时问题就产生了, 参阅非参数和方差分析的正态性检验) 这种条件下有两种方法: (参阅非参数和方差分析的正态性检验 。这种条件下有两种方法 析非正态分布变量的数据时问题就产生了, 参阅非参数和方差分析的正态性检验) 这种条件下有两种方法: ( 。 一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看, 一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法 检验),但这种方法不方便 统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下, 统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提 下的检验。后一种方法是基于一个相当重要的原则产生的, 下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的 作用。 作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。 随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。 1 统计软件的选择 在进行统计分析时, 进行统计分析。 在进行统计分析时,作者常使用非专门的数理统计软件 Excel 进行统计分析。由于 Excel 提供的统计分 析功能十分有限,很难满足实际需要。目前,国际上已开发出的专门用于统计分析的商业软件很多,比较著名 析功能十分有限, 很难满足实际需要。 国际上已开发出的专门用于统计分析的商业软件很多, 有 SPSS(Statistical Package for Social Sciences) 、 SAS(Statistical Analysis System) 、 BMDP 和 STATISTICA 等。其中,SPSS 是专门为社会科学领域的研究者设计的(但是,此软件在自然科学领域也得到 其中, 是专门为社会科学领域的研究者设计的(但是, 广泛应用); 是专门为生物学和医学领域研究者编制的统计软件。目前, 广泛应用);BMDP 是专门为生物学和医学领域研究者编制的统计软件。目前,国际学术界有一条不成文的约 ); 软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法 由此可见, 明具体算法。 定:凡是用 SPSS 和 SAS 软件进行统计分析所获得的结果,在国际学术交流中不必说明具体算法。由此可见, SPSS 和 SAS 软件已被各领域研究者普遍认可。建议作者们在进行统计分析时尽量使用这 2 个专门的统计软 软件已被各领域研究者普遍认可。 件。 2 均值的计算 在处理实验数据或采样数据时, 在处理实验数据或采样数据时,经常会遇到对相同采样或相同实验条件下同一随机变量的多个不同取值 进行统计处理的问题。此时,多数作者会不假思索地直接给出算术平均值和标准差。显然, 进行统计处理的问题。此时,多数作者会不假思索地直接给出算术平均值和标准差。显然,这种做法是不严谨 接给出算术平均值和标准差 的。在数理统计学中,作为描述随机变量总体大小特征的统计量有算术平均值、几何平均值和中位数等。何时 在数理统计学中,作为描述随机变量总体大小特征的统计量有算术平均值、 几何平均值和中位数等。 用算术平均值?何时用几何平均值?以及何时用中位数?这不能由研究者根据主观意愿随意确定, 用算术平均值?何时用几何平均值?以及何时用中位数?这不能由研究者根据主观意愿随意确定,而要根据随 机变量的分布特征确定。反映随机变量总体大小特征的统计量是数学期望, 机变量的分布特征确定。反映随机变量总体大小特征的统计量是数学期望,而在随机变量的分布服从正态分布 时,其总体的数学期望就是其算术平均值。此时,可用样本的算术平均值描述随机变量的大小特征。如果所研 其总体的数学期望就是其算术平均值。此时,可用样本的算术平均值描述随机变量的大小特征。 究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下 究的随机变量不服从正态分布,则算术平均值不能准确反映该变量的大小特征。在这种情况下,可通过假设检 验来判断随机变量是否服从对数正态分布。如果服从对数正态分布, 验来判断随机变量是否服从对数正态分布。如果服从对数正态分布,则可用几何平均值描述该随机变量总体的 大小。此时,就可以计算变量的几何平均值。如果随机变量既不服从正态分布也不服从对数正态分布, 大小。此时,就可以计算变量的几何平均值。如果随机变量既不服从正态分布也不服从对数正态分布,则按现 有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。退而求其次, 有的数理统计学知识,尚无合适的统计量描述该变量的大小特征。退而求其次,此时可用中位数来描述变量的 大小特征。 大小特征。 3 相关分析中相关系数的选择 在相关分析中,作者们常犯的错误是简单地计算 Pearson 积矩相关系数,而且既不给出正态分布检验结 在相关分析中, 积矩相关系数, 积矩相关系数。 果,也往往不明确指出所计算的相关系数就是 Pearson 积矩相关系数。常用的相关系数除有 Pearson 积矩相 关系数外, 秩相关系数等。其中, 关系数外,还有 Spearman 秩相关系数和 Kendall 秩相关系数等。其中,Pearson 积矩相关系数可用于描述 2 个随机变量的线性相关程度(相应的相关分析方法称为“参数相关分析 ,该方法的检验功效高,检验结果明 个随机变量的线性相关程度(相应的相关分析方法称为 参数相关分析 参数相关分析”,该方法的检验功效高, 秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势, 确);Spearman 或 Kendall 秩相关系数用来判断两个随机变量在二维和多维空间中是否具有某种共变趋势, ); 而不考虑其变化的幅度(相应的相关分析称为 非参数相关分析 非参数相关分析” 该方法的检验功效较参数方法稍差, 而不考虑其变化的幅度(相应的相关分析称为“非参数相关分析 ,该方法的检验功效较参数方法稍差,检验结 果也不如参数方法明确)。各种成熟的统计软件如 等均提供了这些相关系数的计算模块。 果也不如参数方法明确)。各种成熟的统计软件如 SPSS、SAS 等均提供了这些相关系数的计算模块。在相关 )。各种成熟的 、 分析中,计算各种相关系数是有前提的。对于二元相关分析, 个随机变量服从二元正态分布, 分析中,计算各种相关系数是有前提的。对于二元相关分析,如果 2 个随机变量服从二元正态分布,或 2 个随 , 机变量经数据变换后服从二元正态分布 则可以用 Pearson 积矩相关系数描述这 2 个随机变量间的相关关系 此 ( 时描述的是线性相关关系) ,而不宜选用功效较低的 秩相关系数。 时描述的是线性相关关系) 而不宜选用功效较低的 Spearman 或 Kendall 秩相关系数。如果样本数据或其变 , 换值不服从正态分布,则计算 Pearson 积矩相关系数就毫无意义。退而求其次,此时只能计算 Spearman 或 换值不服从正态分布, 积矩相关系数就毫无意义。 退而求其次, Kendall 秩相关系数(尽管这样做会导致检验功效的降低)。因此,在报告相关分析结果时,还应提供正态分 秩相关系数(尽管这样做会导致检验功效的降低)。因此,在报告相关分析结果时, 这样做会导致检验功效的降低)。因此 布检验结果,以证明计算所选择的相关系数是妥当的。需要指出的是, 布检验结果,以证明计算所选择的相关系数是妥当的。需要指出的是,由于 Spearman 或 Kendall 秩相关系数 ( 设计的相关系数, , ,如果所采集的数据不是确定的数值而仅仅是秩 则使用 Spearman , 是基于顺序变量 秩) 设计的相关系数 因此, 因此 如果所采集的数据不是确定的数值而仅仅是秩, 秩相关系数进行非参数相关分析就成为唯一的选择。 或 Kendall 秩相关系数进行非参数相关分析就成为唯一的选择。 4 相关分析与回归分析的区别 相关分析和回归分析是极为常用的 2 种数理统计方法,在地质学研究领域有着广泛的用途。然而,由于 种数理统计方法, 在地质学研究领域有着广泛的用途。然而, 种数理统计方法在计算方面存在很多相似之处 算方面存在很多相似之处, 这 2 种数理统计方法在计算方面存在很多相似之处,且在一些数理统计教科书中没有系统阐明这 2 种数理统计 方法的内在差别,从而使一些研究者不能严格区分相关分析与回归分析。最常见的错误是, 方法的内在差别,从而使一些研究者不能严格区分相关分析与回归分析。最常见的错误是,用回归分析的结果 解释相关性问题。例如,作者将 回归直线 曲线) 称为 相关性图”或 相关关系图 回归直线( 称为“相关性图 相关关系图”; 解释相关性问题。例如,作者将“回归直线(曲线)图”称为 相关性图 或“相关关系图 ;将回归直线(拟 拟 合度,或称 可决系数 错误地称为“相关系数 可决系数”)错误地称为 相关系数”或 相关系数的平方 相关系数的平方”; 合度,或称“可决系数 错误地称为 相关系数 或“相关系数的平方 ;根据回归分析的结果宣称 2 个变量之间存 在正的或负的相关关系。这些情况在国内极为普遍。 在正的或负的相关关系。这些情况在国内极为普遍。 个或多个随机变量间关联性的方法, 种数理统计方法存在本质的差 相关分析与回归分析均为研究 2 个或多个随机变量间关联性的方法,但 2 种数理统计方法存在本质的差 别,即它们用于不同的研究目的。相关分析的目的在于检验两个随机变量的共变趋势(即共同变化的程度), 即它们用于不同的研究目的。相关分析的目的在于检验两个随机变量的共变趋势(即共同变化的程度), 回归分析的目的则在于试图用自变量来预测因变量的值。在相关分析中,两个变量必须同时都是随机变量, 回归分析的目的则在于试图用自变量来预测因变量的值。在相关分析中,两个变量必须同时都是随机变量,如 果其中的一个变量不是随机变量,就不能进行相关分析。这是相关分析方法本身所决定的。对于回归分析, 果其中的一个变量不是随机变量,就不能进行相关分析。这是相关分析方法本身所决定的。对于回归分析,其 中的因变量肯定为随机变量 这是回归分析方法本身所决定的) 而自变量则可以是普通变量 规范的叫法是“固 ( 这是回归分析方法本身所决定的) ,而自变量则可以是普通变量 规范的叫法是 固 , ( 定变量”,有确定的取值)也可以是随机变量。如果自变量是普通变量,采用的回归方法就是最为常用的 最小 定变量 ,有确定的取值)也可以是随机变量。如果自变量是普通变量,采用的回归方法就是最为常用的“最小 二乘法 ,即模型Ⅰ回归分析;如果自变量是随机变量,所采用的回归方法与计算者的目的有关---在以预测为目 二乘法”,即模型Ⅰ回归分析;如果自变量是随机变量,所采用的回归方法与计算者的目的有关 在以预测为目 的的情况下,仍采用“最小二乘法 最小二乘法”,在以估值为目的的情况下须使用相对严谨的“主轴法 主轴法”、 约化主轴法 约化主轴法”或 的的情况下, 仍采用 最小二乘法 ,在以估值为目的的情况下须使用相对严谨的 主轴法 、“约化主轴法 或 “Bartlett 法”,即模型Ⅱ回归分析。显然,对于回归分析,如果是模型Ⅰ回归分析,就根本不可能回答变量的 相 ,即模型Ⅱ回归分析。显然,对于回归分析,如果是模型Ⅰ回归分析,就根本不可能回答变量的“相 关性”问题,因为普通变量与随机变量之间不存在 相关性 这一概念(问题在于,大多数的回归分析都是模型Ⅰ 相关性”这一概念 关性 问题,因为普通变量与随机变量之间不存在“相关性 这一概念(问题在于,大多数的回归分析都是模型Ⅰ 问题 回归分析!)。此时, 个变量间的“共变趋势 而改用相关分析, 共变趋势”而改用相关分析 回归分析!)。此时,即使作者想描述 2 个变量间的 共变趋势 而改用相关分析,也会因相关分析的前提不存 !)。此时 在而使分析结果毫无意义。如果是模型Ⅱ回归分析,鉴于两个随机变量客观上存在 相关性 问题, 相关性”问题 在而使分析结果毫无意义。如果是模型Ⅱ回归分析,鉴于两个随机变量客观上存在“相关性 问题,但因回归分 分析结果毫无意义 , , , 析方法本身不能提供针对自变量和因变量之间相关关系的准确的检验手段 因此 若以预测为目的 最好不提“相 最好不提 相 关性”问题;若以探索两者的 共变趋势 为目的,建议作者改用相关分析。 共变趋势”为目的 关性 问题;若以探索两者的“共变趋势 为目的,建议作者改用相关分析。 问题 需要特别指出的是,回归分析中的 R2 在数学上恰好是 Pearson 积矩相关系数 r 的平方。因此,这极易 需要特别指出的是, 的平方。 因此, 的含义, 相关系数”或 相关系数的平方 问题在于, 相关系数的平方”。 使作者们错误地理解 R2 的含义,认为 R2 就是 “相关系数 或“相关系数的平方 。问题在于,对于自变量是普 相关系数 通变量(即其取值具有确定性)、因变量为随机变量的模型Ⅰ回归分析, 个变量之间的“相关性 相关性”概念根本不 通变量(即其取值具有确定性)、因变量为随机变量的模型Ⅰ回归分析,2 个变量之间的 相关性 概念根本不 )、因变量为随机变量的模型 存在,又何谈 相关系数 相关系数”呢?(说明 说明: 存在,又何谈“相关系数 呢?(说明:二元回归可决系数符号用小写 r2) )

相关内容