python Kmeans聚类 - CPU or GPU?

开源和不开源的区别人工智能 2024-01-03 18 0

Kmeans聚类 - CPU or GPU

引言一、时间对比二、代码三、推荐博文

引言

k均值聚类算法1，一种经典的聚类算法，被广泛应用于机器学习领域。本文主要对比了python库中CPU和GPU的Kmeans效率： cpu: from sklearn.cluster import KMeans gpu: from kmeans_pytorch import kmeans (pip install kmeans-pytorch2) GPU版本源码：PyTorch implementation of kmeans for utilizing GPU

一、时间对比

结论: 直接使用CPU版本sklearn中的KMeans or 使用以下推荐方法的GPU加速方法推荐方法：CUDA编程方法3:从配置环境到实现KMeans算法的CUDA优化

设备：4GB GEFORECE GTX GPU and an 8-core 8GB CPU 表1：不同条目数 (特征维度:32) 在不同设备聚16类所需时间 - 单位秒

方法\数量51210242048163841000001000000CPU (sklearn)0.390.160.253.1228.91278.90GPU (kmeans-pytorch)0.090.140.263.2252.20489.06

每次运行结果不一样，有一定的随机性，随便取了一次结果如上表这个结果上下两行数据换一下还好理解，很奇怪GPU一开始速度还可以越到后面越慢了 … 和其源码cpu_vs_gpu.ipynb相反需要注明：我使用sklearn的KMeans和它的算法进行对比，而它的图使用自己的算法在CPU和GPU设备上进行对比最后猜测：

python实现的GPU加速，相比c++慢了些可能由于本身CPU内存略小，数量大的时候CPU和GPU交互时间也越长，所以在GPU上跑也很慢参数设置差异

其它可能的原因4:GPU vs CPU

二、代码

import numpy as np

import random

import torch

import time

from sklearn.cluster import KMeans

from kmeans_pytorch import kmeans

# 1.固定随机数

seed = 0

random.seed(seed)

np.random.seed(seed)

torch.manual_seed(seed)

torch.cuda.manual_seed(seed)

torch.cuda.manual_seed_all(seed)

# 2.对比实验类别：16 特征维度：32

cpu_t = []

gpu_t = []

for i in [512, 1024, 2048, 16384, 100000, 1000000]:

print(i)

feature = np.random.random([i, 32]) # 随机数

# cpu

t_s = time.time()

_ = KMeans(n_clusters=16, random_state=0).fit(feature)

cpu_t.append(time.time() - t_s)

# gpu

t_s = time.time()

_, _ = kmeans(torch.from_numpy(feature), num_clusters=16, device=torch.device('cuda:0'))

gpu_t.append(time.time() - t_s)

print(cpu_t)

print(gpu_t)

三、推荐博文

GPU优化K-Means算法方案5:基于GPU的K-Means聚类算法 k-medoids算法6:聚类算法——k-medoids算法

百度百科 ↩︎ 机器学习：Kmeans聚类算法总结及GPU配置加速demo ↩︎ CUDAC编程—从配置环境到实现KMeans算法的CUDA优化 ↩︎ GPU vs CPU ↩︎ 基于GPU的K-Means聚类算法 ↩︎ 聚类算法——k-medoids算法 ↩︎

参考阅读

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

python kmeans 聚类 GPU CPU

本文由用户于 2024-01-03 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/17817142.html

金钥匙

python Kmeans聚类 - CPU or GPU?

机器学习论文阅读1--A Survey on Incomplete Multi-view Clustering（不完全多视图聚类的调查）阅读笔记

机器学习无监督学习算法概览：聚类、降维、异常检测等

发表评论取消回复

金钥匙

python Kmeans聚类 - CPU or GPU?

机器学习 论文阅读1--A Survey on Incomplete Multi-view Clustering（不完全多视图聚类的调查）阅读笔记

机器学习 无监督学习算法概览：聚类、降维、异常检测等

相关文章

发表评论取消回复

机器学习论文阅读1--A Survey on Incomplete Multi-view Clustering（不完全多视图聚类的调查）阅读笔记

机器学习无监督学习算法概览：聚类、降维、异常检测等