小编chr*_*ues的帖子

剧情地向图表添加源或标题

有没有一种方法可以将数据源/标题添加到Plotly中的图表，类似于可以ggplot使用caption参数完成的操作：

labs(caption = "source: data i found somewhere")

Run Code Online (Sandbox Code Playgroud)

即，因此我们可以将数据源以较小的字体显示在图的右下方。

r plotly

chr*_*ues

2017 07-14

5
推荐指数

1
解决办法

3209
查看次数

R 使用 dplyr 或 RPostgreSQL 访问架构下的 redshift 表

我正在尝试使用我的 Mac 连接到 Redshift 中的数据库。
我设法使用 dplyr 和 RPostgreSQL 连接到 Redshift，但即使我可以看到所有可用的表（无论架构如何），我也无法访问其中任何一个，因为它们都位于不同的架构下。
我已经尝试了各种语法来指定模式，但我没有得到任何结果。

这是我的 RPostgreSQL 代码：

library(RPostgreSQL)
drv <- dbDriver("PostgreSQL")
postgre.conn <-dbConnect(drv, 
    host="localhost", port="XXXX", dbname="redshiftdb", 
    user="XXXX", password="XXXX")
dbListTables(postgre.conn)

Run Code Online (Sandbox Code Playgroud)

这列出了所有表，无论架构如何。

我可以看到特定模式下的所有表，因此这有效：

dbGetQuery(postgre.conn,
       "SELECT table_name FROM information_schema.tables
       WHERE table_schema='my_schema'")

Run Code Online (Sandbox Code Playgroud)

但我无法使用以下任何命令访问 my_schema.my_table 中的数据：

dbSendQuery(postgre.conn,"SELECT * FROM my_table LIMIT 10")
dbSendQuery(postgre.conn,"SELECT * FROM my_schema.my_table LIMIT 10")
dbSendQuery(postgre.conn,"SELECT * FROM my_table WHERE table_schema='my_schema' LIMIT 10")
dbSendQuery(postgre.conn,"SELECT * FROM c("my_schema", "my_table") LIMIT 10")

Run Code Online (Sandbox Code Playgroud)

同样，这是我的 dplyr 代码：

library(dplyr)
dplyr.conn <- src_postgres(host="localhost", port="XXXX", 
    dbname = "redshiftdb", user = "XXXX", …

Run Code Online (Sandbox Code Playgroud)

r database-schema rpostgresql amazon-redshift dplyr

chr*_*ues

2017 06-08

2
推荐指数

1
解决办法

1265
查看次数

R:创建不等间距的序列

我有一个向量,其中相同的单词"数量"以不同的间隔出现:

"金额""选择""评级""金额""选择""金额""选择""选择""评级""选择""金额""选择""评级"

所以在上面的例子中,"数量"出现在位置1,4,6和11中.

我想创建一个每次遇到这个单词时会增加1的序列,这样我得到一个这样的序列:1 1 1 2 2 3 3 3 3 3 4 4 4

任何想法我怎么能做到这一点......？

提前致谢.

indexing r sequence spacing

chr*_*ues

lucky-day

1
推荐指数

1
解决办法

320
查看次数

优化插入符号的灵敏度似乎仍然优化ROC

我正在尝试使用rpart在插入符号中的模型选择中最大化灵敏度.为此,我试图复制这里给出的方法(向下滚动到带有用户定义函数FourStat的示例)插入符号的github页面

# create own function so we can use "sensitivity" as our metric to maximise:
Sensitivity.fc <- function (data, lev = levels(data$obs), model = NULL) {
    out <- c(twoClassSummary(data, lev = levels(data$obs), model = NULL))
    c(out, Sensitivity = out["Sens"])
}

rpart_caret_fit <- train(outcome~pred1+pred2+pred3+pred4,
    na.action = na.pass,
    method = "rpart", 
    control=rpart.control(maxdepth = 6),
    tuneLength = 20, 
    # maximise sensitivity
    metric = "Sensitivity", 
    maximize = TRUE,
    trControl = trainControl(classProbs = TRUE,
    summaryFunction = Sensitivity.fc))

Run Code Online (Sandbox Code Playgroud)

但是当我得到rpart_caret_fit的摘要时

它表明它仍然使用ROC标准来选择最终模型: