文章中相关性分析报告的内容解读

发布时间:2018-11-14

相关性分析——比如最常见的Pearson相关性分析——是极具价值的统计学方法,用以确定变量之间是否存在相关关系以及相关程度的大小。
 然而,人们对这一类分析结果的意义以及如何对结果进行表述经常有误解。我们今天就要把这个问题搞清楚。
 首先,最佳步骤是参考期刊的指南。那些经常用到相关性分析的期刊通常对报告指标有明确要求,或者会提出参考其它机构的要求。这种情况下,请遵循这些特定的指南。

其次,在期刊没有特殊要求的情况下,你可以采取以下这些方法。必须要报告的内容有:

相关系数(r)或决定系数(r2)

两个系数一起报告很有意义,但至少要报告其中一个。既然r2可以从r推导出来,通常报告一个就可以了。这通常跟目标变量有关。例如,求模型契合度时,主要关注的是相关性的强度(r),而一个自变量可以解释因变量的变化的比例(r2)则用来表达一个变量对另一个变量所产生的影响的重要性。
p值
p值在假设检验中被用来判断所检验的关系是否存在统计显著性。需要注意的是,不要认为p值跟所检验的关系的强度或重要性有任何关联。
自由度
现在许多期刊要求此项,因为自由度提供了计算统计学参数所使用的数据量的必要信息。
样本大小
报告上述统计信息时并不一定要同时报告样本大小,但实验设计一定要清楚地表明用于相关性分析的样本大小。


 

最后,明智的做法是为所有相关性分析附上散点图。因为相关性的强度是一个主观上的评价,所以应该给读者们一个直观评估数据的机会。作者不应该隐藏那些造成统计显著相关性的异常数据,比如聚集在相关关系两端的数据群。另外,把相关性分析中生成的回归方程放在图中也很重要。

 AEIC学术交流

 

X