我使用插入包来训练随机森林,包括重复的交叉验证.我想知道是否使用了Breiman的原始RF中的OOB,或者是否将其替换为交叉验证.如果它被替换,我是否具有与Breiman 2001中描述的相同的优点,如通过减少输入数据之间的相关性来提高准确度?由于OOB是在更换时绘制的,而CV是在没有替换的情况下绘制的,两个程序是否可比?什么是错误率的OOB估计(基于CV)?
树木是如何生长的?是否使用CART?
由于这是我的第一个主题,如果您需要更多详细信息,请告诉我.提前谢谢了.
我想*_sl_H*从许多tar.gz文件中提取所有具有模式的文件,而无需从归档文件中提取所有文件。
我找到了以下几行,但无法使用通配符(https://pymotw.com/2/tarfile/):
import tarfile
import os
os.mkdir('outdir')
t = tarfile.open('example.tar', 'r')
t.extractall('outdir', members=[t.getmember('README.txt')])
print os.listdir('outdir')
Run Code Online (Sandbox Code Playgroud)
有人有主意吗?提前谢谢了。