小编rf7*_*rf7的帖子

如何导航到Jupyter Notebook中的其他目录?

我最近安装了Anaconda 5和Jupyter Notebook.我很高兴其丰富的功能,但我找不到导航到非儿童目录的方法.更具体地说,我试图双击文件夹图标,但结果是相同的视图.

在此输入图像描述

您的建议将不胜感激.

navigation directory jupyter-notebook

11
推荐指数
5
解决办法
2万
查看次数

xgboost:base_score参数的含义

在xgboost的文档中,我读到:

base_score [default = 0.5]:所有实例的初始预测分数,全局偏差

这句话是什么意思?基准分数是数据集中感兴趣事件的先验概率吗?即在一个包含300个阳性和700个阴性的1,000个观测数据集中,基本得分为0.3?

如果没有,它会是什么?

您的建议将不胜感激.

parameters xgboost

11
推荐指数
1
解决办法
4236
查看次数

与dplyr安排小组

我正在使用库(nycflights13),并使用以下命令按月和日分组,选择每个组中的前3行,然后按出发延迟在每个组中按降序排序。代码如下:

flights %>% group_by(month, day)  %>% top_n(3, dep_delay) %>% arrange(desc(dep_delay))
Run Code Online (Sandbox Code Playgroud)

返回以下输出:

    year month   day dep_time sched_dep_time dep_delay arr_time sched_arr_time arr_delay carrier flight tailnum origin  dest
   <int> <int> <int>    <int>          <int>     <dbl>    <int>          <int>     <dbl>   <chr>  <int>   <chr>  <chr> <chr>
1   2013     1     9      641            900      1301     1242           1530      1272      HA     51  N384HA    JFK   HNL
2   2013     6    15     1432           1935      1137     1607           2120      1127      MQ   3535  N504MQ    JFK   CMH
3   2013     1    10     1121           1635      1126     1239           1810      1109      MQ …
Run Code Online (Sandbox Code Playgroud)

sorting group-by r dplyr

4
推荐指数
2
解决办法
1万
查看次数

了解 ROCR 的 performance() 函数返回的内容 - 在 R 中的分类

我很难理解 ROCR 包的 performance() 函数返回的内容。让我用一个可重现的例子来具体说明。我使用 mpg 数据集。我的代码如下:

library(ROCR)
library(ggplot2)
library(data.table)
library(caTools)
data(mpg)
setDT(mpg)
mpg[year == 1999, Year99 := 1]
mpg[year == 2008, Year99 := 0]
table(mpg$Year99)
# 0   1 
# 117 117 
split <- sample.split(mpg$Year99, SplitRatio = 0.75)
mpg_train <- mpg[split, ]
mpg_test <- mpg[!split, ]
model <- glm(Year99 ~ displ, mpg_train, family = "binomial")
summary(model)
predict_mpg_test <- predict(model, type = "response", newdata = mpg_test)
ROCR_mpg_test <- prediction(predict_mpg_test, mpg_test$Year99)
performance(ROCR_mpg_test, "acc")

#An object of class "performance"
#Slot "x.name":
#  [1] …
Run Code Online (Sandbox Code Playgroud)

performance r classification roc

4
推荐指数
1
解决办法
2322
查看次数

带有正则表达式的 grep

我在使用 grepl 和正则表达式时遇到困难。

这是一个小例子:

我有一个字符向量:

text <- c(

  "D_Purpose__Repairs" ,
  "Age" ,
  "F_Job"  
)
Run Code Online (Sandbox Code Playgroud)

我想选择以 D_ 或 F_ 开头的单词。所以我写:

grepl("\\>D_.+ | \\>F_.+", text)

grepl("\\D_.+ | \\F_.+", text)

grepl("\\^D_.+ | \\^F_.+", text)
Run Code Online (Sandbox Code Playgroud)

然而这会返回:

[1] FALSE FALSE FALSE
Run Code Online (Sandbox Code Playgroud)

您能帮助我了解我做错了什么以及我应该如何纠正我的代码吗?

我们将不胜感激您的建议。

regex r grepl

3
推荐指数
1
解决办法
8165
查看次数

如何在ggplot中为平滑线设置alpha

我正在使用Alpha来设置ggplot中平滑线的透明度,但是我只能在围绕拟合线的误差带中获得透明度。

我的代码如下:

z1 <- rnorm(10)

z2 <- z1 ^ 2

error <- rnorm(10, 0.25)

y <- 1 + 0.5 * z1 + error

data1 <- data.table(y, z1, z2)

ggplot(data1) +
  geom_point(aes(x = z1, y = y), color = "blue", size = 3) +
  geom_point(aes(x = z2, y = y), color = "red", size = 3) +
  geom_smooth(method = lm, aes(x = z1, y = y), color = "blue", size = 2, alpha = 0.1) +
  geom_smooth(method = lm, aes(x = …
Run Code Online (Sandbox Code Playgroud)

alpha r scatter-plot smoothing ggplot2

3
推荐指数
1
解决办法
1528
查看次数

如何在 Seaborn 中控制图例 - Python

我试图找到有关如何控制和自定义 Seaborn 图中的图例的指导,但我找不到任何指导。

为了使问题更具体,我提供了一个可重现的示例:

surveys_by_year_sex_long

    year    sex wgt
0   2001    F   36.221914
1   2001    M   36.481844
2   2002    F   34.016799
3   2002    M   37.589905

%matplotlib inline
from matplotlib import *
from matplotlib import pyplot as plt
import seaborn as sn

sn.factorplot(x = "year", y = "wgt", data = surveys_by_year_sex_long, hue = "sex", kind = "bar", legend_out = True,
             palette = sn.color_palette(palette = ["SteelBlue" , "Salmon"]), hue_order = ["M", "F"])
plt.xlabel('Year')
plt.ylabel('Weight')
plt.title('Average Weight by Year and Sex')
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

在这个例子中,我希望能够将 M 定义为男性,将 …

python matplotlib legend seaborn

3
推荐指数
2
解决办法
2万
查看次数

Pandas 中的 groupby -Python

当我尝试在 groupby 对象中执行我不理解的操作时,收到一条错误消息。

对于可重现的示例,请考虑以下内容:

import pandas as pd

species_plots_types



 record_id  plot_id plot_type   species_id
    0       1   2   Control NL
    2194    2   3   Long-term Krat Exclosure    NL
    1       3   2   Control DM
    4022    4   7   Rodent Exclosure    DM
    2195    5   3   Long-term Krat Exclosure    DM
    4838    6   1   Spectab exclosure   PF
    2       7   2   Control PE
    4839    8   1   Spectab exclosure   DM
    4840    9   1   Spectab exclosure   DM
    6833    10  6   Short-term Krat Exclosure   PF
    8415    11  5   Rodent Exclosure    DS
    4023 …
Run Code Online (Sandbox Code Playgroud)

python pandas pandas-groupby

1
推荐指数
1
解决办法
7069
查看次数