首先打开需要转化的文件,我这边是xls格式
然后另存为csv格式
然后在weka中将csv格式转化为arff格式的方法有三种,可以供大家自由选择。
方法一:
进入“Exploer”模块open file 找到我们刚才保存的csv文件,并type选择CSV
点击右上角的save
type选择arff ,保存到桌面就行了
方法二:
使用WEKA所带的命令行工具。
运行WEKA的主程序,在菜单中找到“Simple CLI”模块,它可提供命令行功能。
在新窗口的最下方(上方是不能写字的):输入框写上
java weka.core.converters.CSVLoader filename.csv > filename.arff
filename.csv写上csv刚才文件保存的绝对路径
filename.arff 写上合适的生成位置
然后回车执行就可以了
方法三:
在WEKA 3.5之后提供了一个“Arff Viewer”模块,我们可以用它打开一个CSV文件将进行浏览,然后另存为ARFF文件。
同理找到保存的csv文件并打开
另存,选择arff格式
上面介绍的是的xls格式转换为arff格式的方法,其他格式转化为arff格式的方法也类同。
注意:
当我们打开arff文件,可能会出现下面乱码的情况
是因为weka默认的字符集编码是Cp1252,如果导入的数据中有中文字符,就会显示为乱码。
解决方法:
打开weka安装目录下的RunWeka.ini文件,找到【fileEncoding=】这一行,将Cp1252编码改为需要的字符集编码,比如utf-8,cp936(简体中文),cp950(繁体中文)。 若我们有时遇到不能修改文件的状况,可以先把文件进行修改,之后保存到桌面,接着再复制粘贴替换到原始文件的目录路径下即可。 2.重新打开weka软件。打开arff文件。
参考阅读
发表评论