决策树5：剪枝与sklearn中的决策树

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

潇洒的钥匙 · 小米与生态链公司的“功守道”_百科TA说· 6 月前 ·

朝气蓬勃的镜子 · 访问校园 - Xi'an ...· 10 月前 ·

眼睛小的领带 · 风再起时票房 - 抖音· 1 年前 ·

博学的黄瓜 · 法尼·瓦伦泰 - 萌娘百科万物皆可萌的百科全书· 2 年前 ·

傻傻的作业本 · 非职业半仙漫画免费 - 非职业半仙漫画 - ...· 2 年前 ·

腾讯云

备案控制台

开发者社区

TVP

文章/答案/技术大牛

写文章

专栏首页木东居士的专栏决策树5：剪枝与sklearn中的决策树

2 1

分享

import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasets
X,y = datasets.make_moons(noise=0.25,random_state=666)
plt.scatter(X[y==0,0],X[y==0,1])plt.scatter(X[y==1,0],X[y==1,1])plt.show()

def plot_decision_boundary(model, axis): # model是模型，axis是范围    x0, x1 = np.meshgrid(        np.linspace(axis[0], axis[1],int((axis[1]-axis[0])*100)).reshape(-1,1),        np.linspace(axis[2], axis[3],int((axis[3]-axis[2])*100)).reshape(-1,1),    )    X_new = np.c_[x0.ravel(), x1.ravel()]
    y_predict = model.predict(X_new)    zz = y_predict.reshape(x0.shape)
    from matplotlib.colors import ListedColormap    custom_cmap = ListedColormap(['#EF9A9A','#FFF59D','#90CAF9'])        plt.contourf(x0, x1, zz, linewidth=5, cmap=custom_cmap)

from sklearn.tree import DecisionTreeClassifier
# 如果在构建时不传参数，则默认是使用基尼系数进行特征划分# 不限定max_depth，则决策树会一直向下划分，直到每一个节点的基尼系数为0为止dt_clf1 = DecisionTreeClassifier()dt_clf1.fit(X,y)    plot_decision_boundary(dt_clf1, axis=[-1.5,2.5,-1.0,1.5])plt.scatter(X[y==0,0],X[y==0,1])plt.scatter(X[y==1,0],X[y==1,1])plt.show()

dt_clf2 = DecisionTreeClassifier(max_depth=2)dt_clf2.fit(X,y)
plot_decision_boundary(dt_clf2, axis=[-1.5,2.5,-1.0,1.5])plt.scatter(X[y==0,0],X[y==0,1])plt.scatter(X[y==1,0],X[y==1,1])plt.show()

dt_clf3 = DecisionTreeClassifier(min_samples_split=10)dt_clf3.fit(X,y)
plot_decision_boundary(dt_clf3, axis=[-1.5,2.5,-1.0,1.5])plt.scatter(X[y==0,0],X[y==0,1])plt.scatter(X[y==1,0],X[y==1,1])plt.show()

dt_clf4 = DecisionTreeClassifier(min_samples_leaf=6)dt_clf4.fit(X,y)

木东居士 腾讯 · 数据分析 (已认证)

决策树5：剪枝与sklearn中的决策树

决策树5：剪枝与sklearn中的决策树

0x01 剪枝

0x02 预剪枝

2.1 概念

2.3 伪代码

0x03 后剪枝

3.1 概念

3.2 具体实例

0x04 sklearn中的剪枝处理

4.1 展示

木东居士

腾讯 · 数据分析 (已认证)