受此启发:http : //scikit-learn.org/stable/auto_examples/feature_selection/plot_rfe_with_cross_validation.html#sphx-glr-auto-examples-feature-selection-plot-rfe-with-cross-validation-py
我想知道是否有办法获得特定分数的功能:
在这种情况下,我想知道,当#Features = 10 时,选择的哪 10 个特征给出了那个峰值。
有任何想法吗?
编辑:
这是用于获取该图的代码:
from sklearn.feature_selection import RFECV
from sklearn.model_selection import KFold,StratifiedKFold #for K-fold cross validation
from sklearn.ensemble import RandomForestClassifier #Random Forest
# The "accuracy" scoring is proportional to the number of correct classifications
#kfold = StratifiedKFold(n_splits=10, random_state=1) # k=10, split the data into 10 equal parts
model_Linear_SVM=svm.SVC(kernel='linear', probability=True)
rfecv = RFECV(estimator=model_Linear_SVM, step=1, cv=kfold,scoring='accuracy') #5-fold cross-validation
rfecv = rfecv.fit(X, y)
print('Optimal number of features :', rfecv.n_features_)
print('Best features :', X.columns[rfecv.support_]) …Run Code Online (Sandbox Code Playgroud) 我想将每个项目都放置得更近一点,也就是减小行距,但是我没有发现任何有用的东西。
\begin{itemize}
\item Processor: Intel Core \textsuperscript{TM} i5-5300U CPU @ 2.3GHz
\item RAM: 8 GB
\item OS: Windows 7
\item Computer: HP840G
\end{itemize}
Run Code Online (Sandbox Code Playgroud) 我正在尝试在GCP实例中将文件夹从本地计算机移至远程服务器:
gcloud compute scp --recurse myDirectory instance-1:~/Folder
Run Code Online (Sandbox Code Playgroud)
看起来它已上传(因为我看到文件正在上传),但是当我检查远程服务器上的文件夹时,什么都没有。我做错了什么?
我有两个项目,并使用合适的项目设置了gcloud。
我想将pandas.series功能(我的数据帧的列)中的-inf值替换为np.nan,但我无法做到.
我试过了:
df[feature] = df[feature].replace(-np.infty, np.nan)
df[feature] = df[feature].replace(-np.inf, np.nan)
df[feature] = df[feature].replace('-inf', np.nan)
df[feature] = df[feature].replace(float('-inf'), np.nan)
Run Code Online (Sandbox Code Playgroud)
但它不起作用.任何想法如何取代这些价值观?
编辑:
df [feature] = df [feature] .replace(-np.inf,np.nan)
作品
但:
df = df.replace(-np.inf, np.nan)
Run Code Online (Sandbox Code Playgroud)
不起作用.