小编ssh*_*hah的帖子

找不到满足python要求的版本

我试图从这里在 macOS中使用python2创建虚拟环境。pip install virtualenv在终端中运行命令时,出现以下错误。

Could not find a version that satisfies the requirement virtualenv (from versions: )
No matching distribution found for virtualenv
Run Code Online (Sandbox Code Playgroud)

python pip virtualenv

4
推荐指数
3
解决办法
5万
查看次数

如何使 RandomForestClassifier 更快?

我正在尝试使用具有大约 1M 原始数据的 twitter 情绪数据从kaggle站点实现词袋模型。我已经清理了它,但在最后一部分,当我将特征向量和情绪应用于随机森林分类器时,它花费了很多时间。这是我的代码......

from sklearn.ensemble import RandomForestClassifier
forest = RandomForestClassifier(n_estimators = 100,verbose=3)
forest = forest.fit( train_data_features, train["Sentiment"] )
Run Code Online (Sandbox Code Playgroud)

train_data_features 是 1048575x5000 稀疏矩阵。我尝试将其转换为数组,同时这样做表示内存错误。

我哪里做错了?有人可以建议我一些来源或另一种更快的方法吗?我在机器学习方面绝对是新手,没有那么多编程背景,所以一些指南会适应。

非常感谢你提前

machine-learning python-3.x sentiment-analysis pandas

0
推荐指数
1
解决办法
4864
查看次数