Python加载arff文件

王 茂南 2020年7月17日07:32:54
评论
3 693字阅读2分18秒
摘要这一篇简单记录一下如何使用Python读取arff文件.

文章目录(Table of Contents)

简介

有些时候, 我们下载的数据会以arff文件的格式(.arff type files are used for weka)进行保存, 这个时候如果要进行模型的训练, 我们还是希望可以转换为numpy的格式. 此时, scipy.io.arff.loadarff就可以用来完成对arff文件的读取.

这里主要还是记录一下loadarff的使用, 方便以后遇到arff文件的时候知道应该如何进行处理.

参考资料

 

Python读取arff文件简单例子

下面看一个读取的简单例子.

  1. from scipy.io import arff
  2. import pandas as pd

接着使用arff.loadarff来进行文件的读取, 此时会有两部分内容返回:

  • data. The data of the arff file, accessible by attribute names.
  • meta Contains information about the arff file such as name and type of attributes, the relation (name of the dataset), etc.
  1. data, meta = arff.loadarff('TimeBasedFeatures-Dataset-15s.arff')

我们需要的数据在data中, 此时已经是array的格式. 为了显示的方便, 我们还是可以将其转换为dataframe的格式.

  1. df = pd.DataFrame(data)
  2. data.head()

最后可以得到如下形式的数据.

Python加载arff文件

  • 微信公众号
  • 关注微信公众号
  • weinxin
  • QQ群
  • 我们的QQ群号
  • weinxin
王 茂南
  • 本文由 发表于 2020年7月17日07:32:54
  • 转载请务必保留本文链接:https://mathpretty.com/12777.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: