Weka - 加载 UTF-8 编码的 csv

Alb*_*toD 1 java utf-8 weka

Weka 3.7.13 有没有办法加载 UTF-8 编码的文件而不将它们转换为 ANSII?

我正在尝试加载一个包含字符串属性的 csv 文件,其值可以包含表情符号,我不需要丢失它们。

SJB*_*SJB 5

非常有可能做到这一点。请参阅此链接,它描述了如何从命令行或 GUI 执行此操作。

如果使用命令行,请添加此参数-Dfile.encoding=utf-8

如果使用 GUI,则编辑RunWEKA.ini文件。将fileEncoding占位符更改为utf-8.