文章目录

背景代码数据代码

背景

很多人写得太复杂了,更多人谈到sklearn的时候,早就知道了kmeas的原理,只是想快速上手而已。

代码

数据

我们知道,kmeans是无监督,没有标签。所以,我们的数据如下:

import numpy as np

X = np.array([[1, 2], [1, 4], [1, 0],

[10, 2], [10, 4], [10, 0]])

6个数据点,每一个点是二维的。我们使用kmeas进行聚类。

代码

导入包

from sklearn.cluster import KMeans

#指定要聚多少个类别,以及拟合我们的数据X。

kmeans = KMeans(n_clusters=2, random_state=0).fit(X)#

print(kmeans.cluster_centers_)

#输出聚类中心,我们是两个类,所以有两个中心。

print(kmeans.labels_)

#由于两个类别的中心已经知道,所以这6个点的类别当然也知道,看距离谁最近即可。

print(kmeans.predict([[0, 0], [12, 3]]))

#预测新的2个点的类别。和上面同理。

是不是很简单,核心已经说完了。

完结撒花

精彩文章

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: