我试图从这里在 macOS中使用python2创建虚拟环境。pip install virtualenv在终端中运行命令时,出现以下错误。
Could not find a version that satisfies the requirement virtualenv (from versions: )
No matching distribution found for virtualenv
Run Code Online (Sandbox Code Playgroud) 我正在尝试使用具有大约 1M 原始数据的 twitter 情绪数据从kaggle站点实现词袋模型。我已经清理了它,但在最后一部分,当我将特征向量和情绪应用于随机森林分类器时,它花费了很多时间。这是我的代码......
from sklearn.ensemble import RandomForestClassifier
forest = RandomForestClassifier(n_estimators = 100,verbose=3)
forest = forest.fit( train_data_features, train["Sentiment"] )
Run Code Online (Sandbox Code Playgroud)
train_data_features 是 1048575x5000 稀疏矩阵。我尝试将其转换为数组,同时这样做表示内存错误。
我哪里做错了?有人可以建议我一些来源或另一种更快的方法吗?我在机器学习方面绝对是新手,没有那么多编程背景,所以一些指南会适应。
非常感谢你提前