聚类包PyClustering的使用方法

  • A+
所属分类:Python库介绍
摘要这一篇文章介绍一个python的库,PyClustering的使用方法。也是之前看了一下他的使用方法,想在这里记录一下,方便自己以后的使用和查看。

文章目录(Table of Contents)

前言

这个系列一直以来就是用作记录,方便自己之后查找的,所以为了更加方便,我在github上建了一个仓库用来存放一些数据分析使用的代码。

今天这一篇文章就讲一下大概的使用方法,具体的可以去下载源文件进行查看。

数据分析代码仓库

简单示例

我们首先导入要使用的模块

  1. # 这里选择聚类的方法.
  2. from pyclustering.cluster.birch import birch;
  3. # 这里选择k-means聚类方法,具体的介绍查看 https://codedocs.xyz/annoviko/pyclustering/
  4. from pyclustering.cluster.kmeans import kmeans
  5. # 这里选择聚类的案例数据
  6. from pyclustering.utils import read_sample;
  7. from pyclustering.samples.definitions import FCPS_SAMPLES;
  8. # 可视化
  9. from pyclustering.cluster import cluster_visualizer

接着我们导入测试的数据集,并查看一下数据样例:

  1. # 导入数据集
  2. sample = read_sample(FCPS_SAMPLES.SAMPLE_LSUN);
  3. # 查看部分数据集
  4. sample[0:3]
  5. >>[[2.0, 3.0], [0.387577, 0.268546], [0.17678, 0.582963]]

接下来我们开始进行聚类,使用birch算法进行聚类,一共聚成三类

  1. # 使用birch算法,聚成三类,这里将类实例化,变成对象
  2. birch_instance = birch(sample, 3);
  3. # 使用对象里的方法,开始聚类
  4. birch_instance.process();
  5. # 获取聚类结果
  6. clusters = birch_instance.get_clusters();
  7. # 查看形状,可以看到长度为3,被分为三类
  8. len(clusters)
  9. >> 3

最后进行可视化,查看聚类的效果

  1. # 进行可视化
  2. visualizer = cluster_visualizer();
  3. visualizer.append_clusters(clusters, sample);
  4. visualizer.show();
聚类包PyClustering的使用方法

结语

关于更加详细的信息,可以直接查看源代码,我也觉得直接看源代码会更加清楚一些。

数据分析代码仓库

  • 微信公众号
  • 关注微信公众号
  • weinxin
  • QQ群
  • 我们的QQ群号
  • weinxin
王 茂南

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: