Python加载arff文件

  • A+
所属分类:大数据分析
摘要这一篇简单记录一下如何使用Python读取arff文件.

简介

有些时候, 我们下载的数据会以arff文件的格式(.arff type files are used for weka)进行保存, 这个时候如果要进行模型的训练, 我们还是希望可以转换为numpy的格式. 此时, scipy.io.arff.loadarff就可以用来完成对arff文件的读取.

这里主要还是记录一下loadarff的使用, 方便以后遇到arff文件的时候知道应该如何进行处理.

参考资料

 

Python读取arff文件简单例子

下面看一个读取的简单例子.

  1. from scipy.io import arff
  2. import pandas as pd

接着使用arff.loadarff来进行文件的读取, 此时会有两部分内容返回:

  • data. The data of the arff file, accessible by attribute names.
  • meta Contains information about the arff file such as name and type of attributes, the relation (name of the dataset), etc.
  1. data, meta = arff.loadarff('TimeBasedFeatures-Dataset-15s.arff')

我们需要的数据在data中, 此时已经是array的格式. 为了显示的方便, 我们还是可以将其转换为dataframe的格式.

  1. df = pd.DataFrame(data)
  2. data.head()

最后可以得到如下形式的数据.

Python加载arff文件
  • 微信公众号
  • 关注微信公众号
  • weinxin
  • QQ群
  • 我们的QQ群号
  • weinxin
王 茂南

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: