我有一个由 10049972 行 x 19 列组成的数据库。我使用隔离森林来检测异常值,然后创建了一个额外的列,将异常值设置为 -1,我删除了所有包含异常值的行为 -1,然后删除了该列。
我的问题是:我是否需要训练、测试和验证隔离森林才能工作?另外有人可以确认我的代码是否有效吗?
这是我的代码。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
from sklearn.ensemble import IsolationForest
df = pd.read_csv('D:\\Project\\database\\4-Final\\Final After.csv',low_memory=True)
iForest = IsolationForest(n_estimators=100, contamination=0.1 , random_state=42, max_samples=200)
iForest.fit(df.values.reshape(-1,1))
pred = iForest.predict(df.values.reshape(-1,1))
pred=df['anomaly']
df=df.drop(df['anomaly'==-1],inplace=True)
df.to_csv('D:\\Project\\database\\4-Final\\IF TEST.csv', index=False)
Run Code Online (Sandbox Code Playgroud)
谢谢你。
python machine-learning pandas scikit-learn jupyter-notebook
问题陈述
我正在尝试运行一些需要的旧 python 代码,scikit-learn 18.0但我安装的当前版本是0.22,所以我在运行代码时收到警告/无效数据。
我试过的
我尝试安装特定版本无论是在终端:python -m pip install scikit-learn==0.18在conda和这些方法都工作过。我只能安装v 0.22. 帮助?谢谢。
终端错误
错误:scikit-learn 的构建轮失败为 scikit-learn
运行 setup.py clean
无法构建 scikit-learn
安装收集的包:scikit-learn
找到现有安装:scikit-learn 0.22.1
卸载 scikit-learn-0.22.1:
成功卸载 scikit-learn-0.22.1
运行 setup.py install for scikit-learn ... 错误
错误:命令出错,退出状态为 1:
通过 conda 环境出错:
PackagesNotFoundError:当前渠道无法提供以下软件包:
- scikit-learn==0.18 这是在创建并激活新环境之后
在Angular 2.0 stable中,我有一个应用程序,我必须根据收到的JSON数据定义/配置路由.我没有任何预定义的路由.我在我的bootstrap组件的构造函数中获取此数据.
我怎样才能实现这一目标?可能吗?