如何在python/R中访问xgboost模型的各个树?
下面我来自sklearn的随机森林树木.
estimator = RandomForestRegressor(oob_score = True,n_estimators = 10,max_features ='auto')estimator.fit(tarning_data,traning_target)tree1 = estimator.estimators_ [0] leftChild
= tree1.tree_.children_left rightChild = tree1.tree_.children_right
我正在尝试重现流程图:
http://www.consort-statement.org/consort-statement/flow-diagram
使用DiagrammeRR 中的包。下面是我到目前为止所得到的,但我无法让“排除”框与空白节点水平对齐。有什么建议么?
```{r, echo=FALSE, warning=FALSE, results='hide', message=FALSE}
library(pacman)
p_load(DiagrammeR)
grViz("digraph a_nice_graph {
node [fontname = Helvetica, shape = box, width = 4, fillcolor = LightSalmon, style = filled]
assessed [label = 'Assessed for Elibibility (n = )']
randomized [label = 'Randomized (n = )']
allocatedA [label = 'Allocated to intervention A (n = )']
allocatedB [label = 'Allocated to intervention B (n = )']
lostA [label = 'Lost to follow-up (n = )']
lostB [label = …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用 构建 APA 样式表flextable,它将导出为 .docx 格式。我需要页脚的第一个单词为斜体,但后面的单词不需要(脚注等)。我还没能做到。
下面是一个小例子:
require(flextable)
tab <- data.frame("Variable" = c("Reference Norm", "Suject", "Cutoff"),
"Indicators"= c("Content 1", "Content 2", "Content 3"),
"Reference Norm" = c("", "Content 4", "Content 5"),
"Subject" = c("", "", "Content 6"))
tab <- flextable(tab)
tab <- add_footer_lines(tab, values = "Note.") # This is where I need italic font
tab <- footnote(tab, i= 2, j= 2:3 , part = "body", ref_symbols="a", value = as_paragraph("Method x"), inline=T)
Run Code Online (Sandbox Code Playgroud) ggplot我第一次尝试绘制地图,但在实现我的想法时遇到问题。
首先,我有一个数据框,其中每个国家/地区代码都与一个数字相关联。例如:
id count
US 2030
DE 1001
UA 730
SY 229
Run Code Online (Sandbox Code Playgroud)
我想获得一张ggplot地图,其中国家/地区按数字范围着色(例如:超过2000个深红色,1000-2000个红色,1000-600个橙色,600-200个黄色,少于100个白色)。颜色本身并不重要,我只是想让计数越低颜色越淡。
这是我尝试过的:
world_map <- map_data(map = "world")
world_map$region <- iso.alpha(world_map$region)
ggplot(df, aes(map_id = id)) +
geom_map(aes(fill = frequency), map = world_map) +
expand_limits(x = world_map$long, y = world_map$lat) +
scale_colour_manual(name = "counts", values = cols,
breaks = c(2000,1000,600,200),
labels=c("more than 2000","2000-1000","1000-600","600-200")) +
theme_void() +
coord_fixed()
Run Code Online (Sandbox Code Playgroud)
当我尝试执行此代码时,我收到以下错误消息
不知道如何自动选择函数类型对象的比例。默认为连续。错误:美学必须是有效的数据列。有问题的审美:填充=频率。您是否输错了数据列的名称或忘记添加 after_stat()?
现在我明白我如何设置参数存在问题,但我在互联网上找不到任何解决方案(或者也许我是一个初学者,无法正确理解它)。
我正在尝试打印向量中除具有特定名称的向量之外的所有值。
capital <- c("Prague","Kairo", "Seoul")
names(capital)<-c("Czech","Egypt","Korea")
Run Code Online (Sandbox Code Playgroud)
是我的向量。
我想在不使用循环的情况下打印出除“韩国”之外的所有内容。我试过:
capital[c("Czech","Egypt")]
Run Code Online (Sandbox Code Playgroud)
它会产生正确的值,但我不确定这是否是唯一的方法。
capital[c("Czech","Egypt")]该代码应该产生没有任何循环的输出。我不确定这是否是唯一的方法,或者 if 语句是否可用于产生相同的输出。