使用 Graphviz 显示此决策树

use*_*207 3 python graphviz decision-tree python-3.x scikit-learn

我正在遵循有关使用 python v3.6 通过 scikit-learn 进行机器学习的决策树的教程。

这是代码;

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import mglearn
import graphviz

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split

from sklearn.tree import DecisionTreeClassifier

cancer = load_breast_cancer()
X_train, X_test, y_train, y_test = train_test_split(cancer.data, cancer.target, stratify=cancer.target, random_state=42)
tree = DecisionTreeClassifier(random_state=0)
tree.fit(X_train, y_train)

tree = DecisionTreeClassifier(max_depth=4, random_state=0)
tree.fit(X_train, y_train)

from sklearn.tree import export_graphviz
export_graphviz(tree, out_file="tree.dot", class_names=["malignant", "benign"],feature_names=cancer.feature_names, impurity=False, filled=True)

import graphviz
with open("tree.dot") as f:
    dot_graph = f.read()
graphviz.Source(dot_graph)
Run Code Online (Sandbox Code Playgroud)

如何使用 Graphviz 查看 dot_graph 内部的内容?据推测,它应该看起来像这样;

在此输入图像描述

ern*_*cyp 8

在 jupyter Notebook 中,以下绘制了决策树:

from sklearn.tree import DecisionTreeClassifier
from sklearn import tree


model = DecisionTreeClassifier()
model.fit(X, y)
dot_data = tree.export_graphviz(model, 
                  feature_names=feature_names,  
                  class_names=class_names,  
                  filled=True, rounded=True,  
                  special_characters=True,
                   out_file=None,
                           )
graph = graphviz.Source(dot_data)
graph
Run Code Online (Sandbox Code Playgroud)

如果你想将其另存为 png:

graph.format = "png"
graph.render("file_name")
Run Code Online (Sandbox Code Playgroud)


kaz*_*ase 5

graphviz.Source(dot_graph)返回一个graphviz.files.Source对象。

g = graphviz.Source(dot_graph)
Run Code Online (Sandbox Code Playgroud)

用于g.render()创建图像文件。当我在没有参数的情况下在您的代码上运行它时,我得到了一个Source.gv.pdf,但您可以指定不同的文件名。还有一个捷径g.view(),可以保存文件并在适当的查看器应用程序中打开它。

如果您将代码原样粘贴到丰富的终端(例如带有内联图形的 Spyder/IPython 或 Jupyter 笔记本)中,它将自动显示图像而不是对象的 Python 表示形式。