聚类包PyClustering的使用方法

2018年5月18日12:05:54

评论1 1086字阅读3分37秒

摘要这一篇文章介绍一个python的库，PyClustering的使用方法。也是之前看了一下他的使用方法，想在这里记录一下，方便自己以后的使用和查看。

文章目录(Table of Contents)

前言

这个系列一直以来就是用作记录，方便自己之后查找的，所以为了更加方便，我在github上建了一个仓库用来存放一些数据分析使用的代码。

今天这一篇文章就讲一下大概的使用方法，具体的可以去下载源文件进行查看。

数据分析代码仓库

简单示例

我们首先导入要使用的模块

# 这里选择聚类的方法.
from pyclustering.cluster.birch import birch;
# 这里选择k-means聚类方法，具体的介绍查看 https://codedocs.xyz/annoviko/pyclustering/
from pyclustering.cluster.kmeans import kmeans
# 这里选择聚类的案例数据
from pyclustering.utils import read_sample;
from pyclustering.samples.definitions import FCPS_SAMPLES;
# 可视化
from pyclustering.cluster import cluster_visualizer

接着我们导入测试的数据集，并查看一下数据样例：

# 导入数据集
sample = read_sample(FCPS_SAMPLES.SAMPLE_LSUN);
# 查看部分数据集
sample[0:3]
>>[[2.0, 3.0], [0.387577, 0.268546], [0.17678, 0.582963]]

接下来我们开始进行聚类，使用birch算法进行聚类，一共聚成三类

# 使用birch算法，聚成三类,这里将类实例化，变成对象
birch_instance = birch(sample, 3);
# 使用对象里的方法，开始聚类
birch_instance.process();
# 获取聚类结果
clusters = birch_instance.get_clusters();
# 查看形状，可以看到长度为3，被分为三类
len(clusters)
>> 3

最后进行可视化，查看聚类的效果

# 进行可视化
visualizer = cluster_visualizer();
visualizer.append_clusters(clusters, sample);
visualizer.show();

聚类包PyClustering的使用方法

结语

关于更加详细的信息，可以直接查看源代码，我也觉得直接看源代码会更加清楚一些。

数据分析代码仓库

微信公众号
关注微信公众号

QQ群
我们的QQ群号

使用 uv 管理 Python 项目

使用 uv 管理 Python 项目

Python 使用 sqlite3 介绍

Python 使用 sqlite3 介绍

Python 日志工具 loguru

Python 日志工具 loguru

argparse 模块用法介绍

argparse 模块用法介绍

Python 第三方打印库 PrettyPrinter

Python 第三方打印库 PrettyPrinter

Python 临时文件模块 tempfile

Python 临时文件模块 tempfile

Python OpenCV 使用介绍

Python OpenCV 使用介绍

Python GUI 工具 tkinter 介绍

Python GUI 工具 tkinter 介绍

Python 打包分发工具 setuptools 简介

Python 打包分发工具 setuptools 简介

使用 PyQt 快速搭建带有 GUI 的应用（8）--多窗口之间跳转

使用 PyQt 快速搭建带有 GUI 的应用（8）–多窗口之间跳转

本文由王茂南发表于 2018年5月18日12:05:54
转载请务必保留本文链接：https://mathpretty.com/9374.html

目录

繁
本页二维码