我在Mac OSX Mountain Lion上使用scikit_learn-0.14运行python 2.7.5.
然而,我运行svmlight命令的所有内容都会收到以下警告:
DeprecationWarning:使用非整数而不是整数将导致将来出现错误
我正在尝试使用SVM灯构建分类器,该分类器将文档分类为两个类中的一个.我已经训练并测试了分类器,并将模型文件保存到磁盘中.现在我想使用这个模型文件来分类全新的文档.这应该是什么输入文件格式?它可能是纯文本文件(我认为不会起作用)或者可能只是文本文件中存在的功能的简单列表,没有任何类标签和功能权重(在这种情况下,我必须跟踪指数训练期间特征向量中的特征)还是其他格式?
我收到以下问题:
/Users/luke/Desktop/trainHOG/trainhog ; exit;
dyld: Library not loaded: lib/libopencv_core.3.0.dylib
Referenced from: /Users/luke/Desktop/trainHOG/trainhog
Reason: image not found
Trace/BPT trap: 5
logout
我正在使用运行带有openCV 3.0 alpha的OSX v10.9.5的Mac。
有问题的库肯定在文件夹中。我尝试删除它并将其粘贴回文件夹中,我已经完全删除并重新安装了openCV和macports,并且尝试了export DYLD_LIBRARY_PATH = "path to dynamic libs here..",但没有任何效果。我什至多次重启计算机!
有人还有其他建议吗?我没主意
我有大svmlight文件,我正在用于机器学习目的.我试图看看这些文件的总和是否会导致足够好的结果.
我想提取我的文件的随机行,以将它们提供给我的模型,但我想在RAM中加载较少的信息.
我在这里看到(从Python中的文件中读取一些随机行),我可以使用linecache,但所有解决方案最终都会将所有内容加载到内存中.
有人可以给我一些提示吗?谢谢.
编辑:忘了说我事先知道我文件中的行数.