R与结构方程模型

降维

主成分分析

因子分析(Factor Analysis)

结构和测量模型

因子分析的其他问题

术语

潜变量的其他用途

总结

R包

原文链接:https://m-clark.github.io/sem/

并非我们想要衡量的一切都有一个明显的标准。如果一个人想衡量一个人的幸福感,他们会有什么可支配的?

他们在微笑吗?

他们刚刚得到加薪吗?

他们是否与他人互动良好?

他们相对健康吗?

其中任何一个都可以作为他们当前幸福状态的指标,但当然,他们都不会告诉我们他们是否真的快乐。充其量它们可以被认为是不完美的措施。如果我们把这些指标和其他指标放在一起考虑,也许我们可以得到一个潜在的衡量标准,我们可以称之为幸福感、满足感或其他一些任意但描述性的名字。

尽管上面对潜在变量的描述与它们在心理学,教育学和相关领域中的通常使用方式一致,但潜在变量模型的使用实际上随处可见,并且可能与我们将在这里主要关注的内容无关。从广义上讲,因子分析可以被视为一种降维技术,或者可以看作是一种对测量误差进行建模和理解潜在结构的方法。我们将对 1前者 进行一些描述,同时重点介绍 2后者 。

降维

在进入SEM上下文中我们称之为测量模型之前,我们可以首先从更一般的角度来看待事物,特别是在降维方面。很多时候,我们只是想获取大量变量,将它们减少到更少,同时保留尽可能多的有关原始变量的信息。例如,这是图像和音频压缩领域非常常见的目标。适合这些方法的统计技术通常被称为 矩阵因式分解。

主成分分析

最常用的因子分析技术可能是主成分分析(PCA)。它试图从一组变量中提取 组件,每个组件都包含尽可能多的能够解释原始变异。相同,它可以被看作是在低维子空间上的投影,这些子空间与原始数据的距离最小。组件是原始变量的线性组合。

PCA 通过协方差/相关矩阵进行分析,PCA得到的主成分个数和原始变量数相同。所有 组件的方差依次减少,并且对所有组件求和,将得到100% 的原始数据中的总差异。通过适当的步骤,组件可以完全再现原始数据/相关矩阵。但是,由于目标是降维,我们只想保留其中一些组件,因此再现的矩阵将不精确。然而,这给了我们一些目标感,同样的想法也用于因子分析/ SEM,我们也使用协方差矩阵,并且更喜欢那些更能够精确复现原始数据相关矩阵的模型。

我们可以将PCA显示为如下的图形模型。这是一个有四个组件/变量的。组件的大小表示每个科目的差异量。

让我们看一个示例。下面是关于一个非常小的数据集,来自洛杉矶的12个人口普查区里的5个社会经济指标(哈曼,1967年的经典例子1)。我们将使用 psych 包,以及其中principal函数。要使用该函数,我们提供了包内的函数,指定我们要保留的组件/因子的数量以及其他选项( 在这种情况下,旋转解决方案可能更具可解释性,但通常不会在 PCA 中使用,因此我们指定“无” )。与标准PCA包和功能相比,psych包为我们提供了更多的选择,并且与我们稍后将花时间使用的因子分析技术更加一致。虽然我们也将使用lavaan进行因子分析,以与SEM方法保持一致,但psych包是标准因子分析,评估可靠性(scale reliability)和其他有趣内容的绝佳工具。

对于 PCA,我们将保留三个组件,并且不使用旋转,并且我们还使用标准化数据。如果不这样做,将导致组件偏向于相对于其他变量具有更大方差的变量2。由于这种标准化几乎总是作为PCA的预处理步骤进行,尽管在这里可以选择将其指定为函数的一部分(covar=F3)

library(psych)

pc = principal(Harman.

推荐链接

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: