网站首页 > 人工智能 > 正文

R语言使用自组织映射神经网络（SOM）进行客户聚类细分

区块链技术通俗讲解人工智能 2024-04-17 10 0

最近我们被客户要求撰写关于自组织映射神经网络的研究报告，包括一些图形和统计输出。

【视频】KMEANS均值聚类和层次聚类：R语言分析生活幸福质量系数可视化实例

KMEANS均值聚类和层次聚类：R语言分析生活幸福质量系数可视化实例

，时长06:05

自组织映射神经网络（SOM）是一种无监督的数据可视化技术，可用于可视化低维（通常为2维）表示形式的高维数据集。在本文中，我们研究了如何使用R创建用于客户细分的SOM。

SOM由1982年在芬兰的Teuvo Kohonen首次描述，而Kohonen在该领域的工作使他成为世界上被引用最多的芬兰科学家。通常，SOM的可视化是六边形节点的彩色2D图。

SOM

SOM可视化由多个“节点”组成。每个节点向量具有：

在SOM网格上的位置

与输入空间维度相同的权重向量。（例如，如果您的输入数据代表人，则可能具有变量“年龄”，“性别”，“身高”和“体重”，网格上的每个节点也将具有这些变量的值）

输入数据中的关联样本。输入空间中的每个样本都“映射”或“链接”到网格上的节点。一个节点可以代表多个输入样本。

SOM的关键特征是原始输入数据的拓扑特征保留在图上。这意味着将相似的输入样本（其中相似性是根据输入变量（年龄，性别，身高，体重）定义的）一起放置在SOM网格上。例如，所有高度大约为1.6m的55岁女性将被映射到网格同一区域中的节点。考虑到所有变量，身材矮小的人将被映射到其他地方。在身材上，高个的男性比小个的胖男性更接近高个头的女性，因为他们“相似”得多。

SOM热图

典型的SOM可视化是“热图”。热图显示了变量在SOM中的分布。理想情况下，相似年龄的人应该聚集在同一地区。

下图使用两个热图说明平均教育水平和失业率之间的关系。

金钥匙

R语言使用自组织映射神经网络（SOM）进行客户聚类细分

机器学习 R语言数据探索和分析6-EM算法和聚类运用和数据分析

机器学习人工智能数据挖掘数据分析 R语言层次聚类：通过内平方和（Within Sum of Squares, WSS）选择最优的聚类K值、以内平方和（WSS）和K的关系并通过弯头法（elbow method）获得最优的聚类个数

发表评论取消回复

金钥匙

R语言使用自组织映射神经网络（SOM）进行客户聚类细分

机器学习 R语言数据探索和分析6-EM算法和聚类运用和数据分析

机器学习 人工智能 数据挖掘 数据分析 R语言层次聚类：通过内平方和（Within Sum of Squares, WSS）选择最优的聚类K值、以内平方和（WSS）和K的关系并通过弯头法（elbow method）获得最优的聚类个数

相关文章

发表评论取消回复

机器学习人工智能数据挖掘数据分析 R语言层次聚类：通过内平方和（Within Sum of Squares, WSS）选择最优的聚类K值、以内平方和（WSS）和K的关系并通过弯头法（elbow method）获得最优的聚类个数