我正在从事欺诈分析项目,因此需要一些帮助。以前,我使用SAS Enterprise Miner来了解有关增强/集成技术的更多信息,并且我了解到增强可以帮助改善模型的性能。
目前,我的小组已在Python上完成以下模型:朴素贝叶斯,随机森林和神经网络我们想使用XGBoost来改善F1得分。我不确定这是否可行,因为我只遇到过有关如何单独执行XGBoost或Naive Bayes的教程。
我正在寻找一个教程,他们将向您展示如何创建朴素贝叶斯模型,然后使用Boosting。此后,我们可以比较指标是否有提升,以查看指标是否有所改善。我是机器学习的新手,所以我可能对这个概念不对。
我曾考虑过替换XGBoost中的值,但不确定要更改哪个值,或者甚至不能以这种方式工作。
朴素贝叶斯
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_sm,y_sm, test_size = 0.2, random_state=0)
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import confusion_matrix, confusion_matrix, accuracy_score, f1_score, precision_score, recall_score
nb = GaussianNB()
nb.fit(X_train, y_train)
nb_pred = nb.predict(X_test)
Run Code Online (Sandbox Code Playgroud)
XGBoost
from sklearn.model_selection import train_test_split
import xgboost as xgb
from xgboost import XGBClassifier
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_sm,y_sm, test_size = 0.2, random_state=0)
model = XGBClassifier(base_score=0.5, booster='gbtree', colsample_bylevel=1,
colsample_bynode=1, colsample_bytree=0.9, gamma=0,
learning_rate=0.1, max_delta_step=0, …Run Code Online (Sandbox Code Playgroud)