使用weka将CSV转换为ARFF

Lum*_*ack 18 weka

我一直试图将这个数据集http://archive.ics.uci.edu/ml/datasets/Communities+and+Crime+Unnormalized输入Weka并且根本没有运气.我将其转换为CSV,然后将其加载到Weka中,然后尝试将其转换为ARFF,但仍然给我错误"attribute names are not unique".

此外,我是否必须从测试数据集中传播训练数据集或将它们保持在一起?

EsT*_*eGe 31

您也可以使用ArffViewer(工具 - > ArffViewer或Ctrl + A).然后打开您的CSV文件.

接下来转到文件 - >另存为...并选择Arff数据文件(默认情况下应该选中).

请注意,您的字段必须用逗号分隔,而不能用分号分隔.

  • 这工作得很好!应该是选定的答案 (3认同)

aru*_*aku 14

在WEKA中实施了一些转换器.以下是与此主题相关的API页面:http://weka.sourceforge.net/doc.stable/weka/core/converters/package-summary.html

例如,以下是如何从CSV转换为ARFF:

java -cp /path/to/weka.jar weka.core.converters.CSVLoader filename.csv > filename.arff
Run Code Online (Sandbox Code Playgroud)


Dul*_*sta 5

将.CSV格式文件上传到此.从那里你的.CSV格式将转换为WEKA .arff格式.完成后,将.arff文件提取到Weka工具.现在您可以继续进行数据分析.


Rus*_*ams 1

我没有遇到任何问题。好的,执行以下操作。在您指定的网页中,

  • 复制“.arff header for weka:”和“相关论文”之间的段。
  • 将其粘贴到 .txt 文件上
  • 打开此位置的数据文件
  • 复制实例并将其附加到 .txt 文件中的 @data 部分之后
  • 将 .txt 文件另存为 .arff 文件

现在您可以走了。

我是否必须将训练数据集与测试数据集分开还是将它们放在一起?

这取决于你的分类方法。如果您选择 10 倍 CV,则将它们放在一起。如果要使用约定方法,请将它们分开。同样,这完全取决于您的方法。