小编rf7*_*rf7的帖子

如何导航到Jupyter Notebook中的其他目录？

我最近安装了Anaconda 5和Jupyter Notebook.我很高兴其丰富的功能,但我找不到导航到非儿童目录的方法.更具体地说,我试图双击文件夹图标,但结果是相同的视图.

您的建议将不胜感激.

navigation directory jupyter-notebook

rf7*_*rf7

lucky-day

11
推荐指数

5
解决办法

2万
查看次数

xgboost:base_score参数的含义

在xgboost的文档中,我读到:

base_score [default = 0.5]:所有实例的初始预测分数,全局偏差

这句话是什么意思？基准分数是数据集中感兴趣事件的先验概率吗？即在一个包含300个阳性和700个阴性的1,000个观测数据集中,基本得分为0.3？

如果没有,它会是什么？

您的建议将不胜感激.

parameters xgboost

rf7*_*rf7

lucky-day

11
推荐指数

1
解决办法

4236
查看次数

与dplyr安排小组

我正在使用库（nycflights13），并使用以下命令按月和日分组，选择每个组中的前3行，然后按出发延迟在每个组中按降序排序。代码如下：

flights %>% group_by(month, day)  %>% top_n(3, dep_delay) %>% arrange(desc(dep_delay))

Run Code Online (Sandbox Code Playgroud)

返回以下输出：

    year month   day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier flight tailnum origin  dest
   <int> <int> <int>    <int>          <int>     <dbl>    <int>          <int>     <dbl>   <chr>  <int>   <chr>  <chr> <chr>
1   2013     1     9      641            900      1301     1242           1530      1272      HA     51  N384HA    JFK   HNL
2   2013     6    15     1432           1935      1137     1607           2120      1127      MQ   3535  N504MQ    JFK   CMH
3   2013     1    10     1121           1635      1126     1239           1810      1109      MQ …

Run Code Online (Sandbox Code Playgroud)

sorting group-by r dplyr

rf7*_*rf7

2017 05-07

4
推荐指数

2
解决办法

1万
查看次数

了解 ROCR 的 performance() 函数返回的内容 - 在 R 中的分类

我很难理解 ROCR 包的 performance() 函数返回的内容。让我用一个可重现的例子来具体说明。我使用 mpg 数据集。我的代码如下：

library(ROCR)
library(ggplot2)
library(data.table)
library(caTools)
data(mpg)
setDT(mpg)
mpg[year == 1999, Year99 := 1]
mpg[year == 2008, Year99 := 0]
table(mpg$Year99)
# 0   1 
# 117 117 
split <- sample.split(mpg$Year99, SplitRatio = 0.75)
mpg_train <- mpg[split, ]
mpg_test <- mpg[!split, ]
model <- glm(Year99 ~ displ, mpg_train, family = "binomial")
summary(model)
predict_mpg_test <- predict(model, type = "response", newdata = mpg_test)
ROCR_mpg_test <- prediction(predict_mpg_test, mpg_test$Year99)
performance(ROCR_mpg_test, "acc")

#An object of class "performance"
#Slot "x.name":
#  [1] …

Run Code Online (Sandbox Code Playgroud)

performance r classification roc

rf7*_*rf7

2017 07-05

4
推荐指数

1
解决办法

2322
查看次数

带有正则表达式的 grep

我在使用 grepl 和正则表达式时遇到困难。

这是一个小例子：

我有一个字符向量：

text <- c(

  "D_Purpose__Repairs" ,
  "Age" ,
  "F_Job"  
)

Run Code Online (Sandbox Code Playgroud)

我想选择以 D_ 或 F_ 开头的单词。所以我写：

grepl("\\>D_.+ | \\>F_.+", text)

grepl("\\D_.+ | \\F_.+", text)

grepl("\\^D_.+ | \\^F_.+", text)

Run Code Online (Sandbox Code Playgroud)

然而这会返回：

[1] FALSE FALSE FALSE

Run Code Online (Sandbox Code Playgroud)

您能帮助我了解我做错了什么以及我应该如何纠正我的代码吗？

我们将不胜感激您的建议。

regex r grepl

rf7*_*rf7

lucky-day

3
推荐指数

1
解决办法

8165
查看次数

如何在ggplot中为平滑线设置alpha

我正在使用Alpha来设置ggplot中平滑线的透明度，但是我只能在围绕拟合线的误差带中获得透明度。

我的代码如下：

z1 <- rnorm(10)

z2 <- z1 ^ 2

error <- rnorm(10, 0.25)

y <- 1 + 0.5 * z1 + error

data1 <- data.table(y, z1, z2)

ggplot(data1) +
  geom_point(aes(x = z1, y = y), color = "blue", size = 3) +
  geom_point(aes(x = z2, y = y), color = "red", size = 3) +
  geom_smooth(method = lm, aes(x = z1, y = y), color = "blue", size = 2, alpha = 0.1) +
  geom_smooth(method = lm, aes(x = …

Run Code Online (Sandbox Code Playgroud)

alpha r scatter-plot smoothing ggplot2

rf7*_*rf7

lucky-day

3
推荐指数

1
解决办法

1528
查看次数

如何在 Seaborn 中控制图例 - Python

我试图找到有关如何控制和自定义 Seaborn 图中的图例的指导，但我找不到任何指导。

为了使问题更具体，我提供了一个可重现的示例：

surveys_by_year_sex_long

    year    sex wgt
0   2001    F   36.221914
1   2001    M   36.481844
2   2002    F   34.016799
3   2002    M   37.589905

%matplotlib inline
from matplotlib import *
from matplotlib import pyplot as plt
import seaborn as sn

sn.factorplot(x = "year", y = "wgt", data = surveys_by_year_sex_long, hue = "sex", kind = "bar", legend_out = True,
             palette = sn.color_palette(palette = ["SteelBlue" , "Salmon"]), hue_order = ["M", "F"])
plt.xlabel('Year')
plt.ylabel('Weight')
plt.title('Average Weight by Year and Sex')

Run Code Online (Sandbox Code Playgroud)

在这个例子中，我希望能够将 M 定义为男性，将 …

python matplotlib legend seaborn

rf7*_*rf7

lucky-day

3
推荐指数

2
解决办法

2万
查看次数

Pandas 中的 groupby -Python

当我尝试在 groupby 对象中执行我不理解的操作时，收到一条错误消息。

对于可重现的示例，请考虑以下内容：

import pandas as pd

species_plots_types



 record_id  plot_id plot_type   species_id
    0       1   2   Control NL
    2194    2   3   Long-term Krat Exclosure    NL
    1       3   2   Control DM
    4022    4   7   Rodent Exclosure    DM
    2195    5   3   Long-term Krat Exclosure    DM
    4838    6   1   Spectab exclosure   PF
    2       7   2   Control PE
    4839    8   1   Spectab exclosure   DM
    4840    9   1   Spectab exclosure   DM
    6833    10  6   Short-term Krat Exclosure   PF
    8415    11  5   Rodent Exclosure    DS
    4023 …

Run Code Online (Sandbox Code Playgroud)

python pandas pandas-groupby

rf7*_*rf7

lucky-day

1
推荐指数

1
解决办法

7069
查看次数