我有3个python版本,我想使用第二个版本easy_install Orange.我怎样才能做到这一点?
不必要的信息:
答:好的在这里找到它(http://peak.telecommunity.com/DevCenter/EasyInstall#multiple-python-versions),
"另外,如果您使用的是Python 2.4或更高版本,则可以使用-m easy_install运行Python来运行特定Python版本的easy_install命令"
我正在为Orange3开发一个附加小部件.有没有办法处理小部件输出的连接/断开事件?
我想推迟其中一个输出的重计算,直到此输出与另一个小部件的输入连接.
我们需要一个内容分类模块.贝叶斯分类器似乎是我正在寻找的.我们应该选择Orange还是NLTK?
我正在尝试在我的Mac OS X 10.7.3(Lion)上安装Orange,并且在使用pip或从源代码构建时我一直收到错误.首先,我收到的错误是:
error: command 'gcc-4.0' failed with exit status 1
Run Code Online (Sandbox Code Playgroud)
我有Xcode 4,它与gcc 4.2.1捆绑在一起.所以我安装了64位/ 32位Python 2.7.3,它内置了gcc 4.2.我还尝试使用以下方法覆盖编译器选项:
export CC=gcc-4.2
Run Code Online (Sandbox Code Playgroud)
但这产生了一个不同的错误:
gcc-4.2 not found, using clang instead
...
error: command 'clang' failed with exit status 1
Run Code Online (Sandbox Code Playgroud)
这是完整的日志:
$ python setup.py build
running build
running build_py
copying Orange/version.py -> build/lib.macosx-10.6-intel-2.7/Orange
running build_ext
gcc-4.2 not found, using clang instead
building 'Orange.orange' extension
running pyxtract for Orange.orange
/Library/Frameworks/Python.framework/Versions/2.7/Resources/Python.app/Contents/MacOS/Python ../pyxtract/defvectors.py
/Library/Frameworks/Python.framework/Versions/2.7/Resources/Python.app/Contents/MacOS/Python ../pyxtract/pyprops.py -n orange
/Library/Frameworks/Python.framework/Versions/2.7/Resources/Python.app/Contents/MacOS/Python ../pyxtract/pyxtract.py -m -n orange lib_kernel.cpp …Run Code Online (Sandbox Code Playgroud) 我注意到这已经是GitHub上的一个问题了.有没有人有任何代码将Pandas DataFrame转换为Orange Table?
显然,我有下表.
user hotel star_rating user home_continent gender
0 1 39 4.0 1 2 female
1 1 44 3.0 1 2 female
2 2 63 4.5 2 3 female
3 2 2 2.0 2 3 female
4 3 26 4.0 3 1 male
5 3 37 5.0 3 1 male
6 3 63 4.5 3 1 male
Run Code Online (Sandbox Code Playgroud) 我正在使用Orange(在Python中)进行一些数据挖掘任务.更具体地说,用于聚类.虽然我已经阅读了教程并阅读了大部分文档,但我仍然遇到了问题.文档和教程中的所有示例都假设我有一个带有数据的制表符分隔表.但是,没有什么可以说如何从头开始创建新表.例如,我想为不同文档中的单词频率创建一个表.
也许我错过了一些东西,所以如果有人有任何见解,我会很感激.
谢谢乔治
这就是我创建表格的方式
#First construct the domain object (top row)
vars = []
for var in variables:
vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class
#Add data rows assuming we have a matrix
t = Orange.data.Table(domain, matrix)
Run Code Online (Sandbox Code Playgroud) 我对在Python中进行套索回归技术感兴趣。但是,我想为算法加权输入数据。您能否建议一些可以考虑输入权重来执行套索回归的库?
我发现这里是scikit-learn提供加权岭回归,但不是加权套索回归。
我试图在Python中计算缺失值,并且sklearn似乎没有超出平均值(均值,中位数或模式)插补的方法.橙色插补模型似乎提供了一个可行的选择.然而,似乎Orange.data.Table没有认识到np.nan或以某种方式归因于失败.
import Orange
import numpy as np
tmp = np.array([[1, 2, np.nan, 5, 8, np.nan], [40, 4, 8, 1, 0.2, 9]])
data = Orange.data.Table(tmp)
imputer = Orange.feature.imputation.ModelConstructor()
imputer.learner_continuous = Orange.classification.tree.TreeLearner(min_subset=20)
imputer = imputer(data )
impdata = imputer(data)
for i in range(0, len(tmp)):
print impdata[i]
Run Code Online (Sandbox Code Playgroud)
输出是
[1.000, 2.000, 1.#QO, 5.000, 8.000, 1.#QO]
[40.000, 4.000, 8.000, 1.000, 0.200, 9.000]
Run Code Online (Sandbox Code Playgroud)
知道我错过了什么吗?谢谢!
我用的是橙3.22。我的模型的第一步是使用Spectroscopy.Multifile加载大约 150 个文件。在所有文件中,相关信息仅从第 22 行开始。在Data.CSVFileImport中,我可以跳过单行。如何跳过所有文件中Orange 的前 21 行?我已经在 Orange 之外有了一个 Python 解决方案。
此致
orange ×10
python ×8
scikit-learn ×2
data-mining ×1
dataframe ×1
easy-install ×1
gcc ×1
imputation ×1
line ×1
macos ×1
naivebayes ×1
nltk ×1
pandas ×1
python-2.7 ×1
regression ×1
skip ×1