小编can*_*ine的帖子

Shiny app的代码分析?

对于R Shiny Web应用程序,运行代码分析的哪些好方法可以显示处理时间最长的Shiny代码部分?

我有一个大而肥胖,复杂的Shiny应用程序,而且我想弄清楚在这个迷宫代码的哪个地方,我正在减慢我的Shiny应用程序.我已经试过Rprof和profr,但没有从他们那里得到太多的了解.

r memory-profiling shiny

22
推荐指数
2
解决办法
3415
查看次数

在ggplot中生成成对的堆积条形图(仅对某些变量使用position_dodge)

我希望用它ggplot2来成对生成一组堆叠的条形,就像这样:

堆叠条形图示例

使用以下示例数据:

df <- expand.grid(name = c("oak","birch","cedar"),
        sample = c("one","two"),
        type = c("sapling","adult","dead"))
df$count <- sample(5:200, size = nrow(df), replace = T)
Run Code Online (Sandbox Code Playgroud)

我希望x轴代表树的名称,每种树种有两个条形:样品一个条形,样品条形一个条形条纹.然后每个条的颜色应由类型确定.

以下代码按类型生成带颜色的堆积条:

ggplot(df, aes(x = name, y = count, fill = type)) + geom_bar(stat = "identity")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

以下代码通过示例生成躲避条:

ggplot(df, aes(x = name, y = count, group = sample)) + geom_bar(stat = "identity", position = "dodge")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

但我不能让它躲避其中一个分组(样本)并堆叠其他分组(类型):

ggplot(df, aes(x = name, y = count, fill = type, group = sample)) + geom_bar(stat = "identity", position = "dodge")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

position r ggplot2 geom-bar

9
推荐指数
1
解决办法
7217
查看次数

返回StatsModel中样本外预测的标准和置信区间

我想从OLS模型中找到样本外预测的标准偏差和置信区间.

此问题类似于模型预测的置信区间,但明确侧重于使用样本外数据.

这个想法是针对一个函数wls_prediction_std(lm, data_to_use_for_prediction=out_of_sample_df),它返回prstd, iv_l, iv_u样本数据帧之外的函数.

例如:

import pandas as pd
import random
import statsmodels.formula.api as smf
from statsmodels.sandbox.regression.predstd import wls_prediction_std

df = pd.DataFrame({"y":[x for x in range(10)],
                   "x1":[(x*5 + random.random() * 2) for x in range(10)],
                    "x2":[(x*2.1 + random.random()) for x in range(10)]})

out_of_sample_df = pd.DataFrame({"x1":[(x*3 + random.random() * 2) for x in range(10)],
                                 "x2":[(x + random.random()) for x in range(10)]})

formula_string = "y ~ x1 + x2"
lm = smf.ols(formula=formula_string, data=df).fit()

# …
Run Code Online (Sandbox Code Playgroud)

python linear-regression confidence-interval standard-deviation statsmodels

7
推荐指数
1
解决办法
3561
查看次数

在Python应用程序中查看数据表(jQuery)的简单方法?

我喜欢DataTables (一个 jQuery 插件)的简洁性。

对于 R,RStudio 人员整理了一个简单的包 ( DT ),使您能够用两行创建一个“hello world”数据表:

library(DT)
DT::datatable(iris)
Run Code Online (Sandbox Code Playgroud)

是否有针对 Python 的 DataTables 的简单集成,也不需要设置 HTML 模板等?

或者,因为我真的很喜欢 DataTables 能够快速按列过滤,如下所示,我是否应该使用其他包?

数据表

python datatable jquery r datatables

6
推荐指数
0
解决办法
1111
查看次数

如何在变量定义的列上== 1

这是一个非常简单的问题,但我再次对data.table语法感到困惑.

如果我有一个表示列名的字符串 - 例如column <- "x"- 如何只返回与该列上的逻辑条件匹配的行?

在a中data.frame,如果我想返回列x等于的表的所有行1,我会写df[df[,column] == 1,].

我如何有效地写一个data.table

(注意,dt[x == 1]工作正常,但如果使用column表示该列名称的字符串则不行.)

这里的答案很接近但似乎不足以回答这个问题.

r unique data.table

5
推荐指数
1
解决办法
73
查看次数

在列表中查找连续数字组

这是一个重复的问题,除了对R,而不是Python的.

我想在列表中标识连续的组(有些人称它们是连续的)整数,其中重复的条目被视为在同一范围内存在.因此:

myfunc(c(2, 3, 4, 4, 5, 12, 13, 14, 15, 16, 17, 17, 20))
Run Code Online (Sandbox Code Playgroud)

收益:

min  max
2    5
12   17
20   20
Run Code Online (Sandbox Code Playgroud)

虽然任何输出格式都可以.我目前的蛮力,for-loop方法非常慢.

(如果我能轻易地重新解释Python的答案并且我是愚蠢的,那道歉!)

r list range contiguous

4
推荐指数
1
解决办法
1703
查看次数

使用单个对象将多个参数传递给函数?

假设我有一个无法改变的功能,例如:

add.these <- function(x,y,z) {
  x + y + z
}
Run Code Online (Sandbox Code Playgroud)

我想将所有三个参数作为单个对象传递.如何将此单个对象传递给函数,以便将它们作为单独的输入进行评估?

理想的结果是类似的args <- list(x,y,z),并add.these(args)返回结果.

这是一个简单的问题,一直困扰着我,但我愚蠢地无法弄明白.实际的用例是函数根据所需的输出具有可变数量的参数,我希望将它们作为列表或其他内容传递.

r function

2
推荐指数
1
解决办法
303
查看次数

查找向量中的最新非缺失值

我正在尝试使用不丢失的值返回向量中的最新行。例如,给定

x <- c(1,2,NA,NA,3,NA,4)
Run Code Online (Sandbox Code Playgroud)

然后,函数(x)将输出类似以下的列表:

c(1,2,2,2,3,3,4)
Run Code Online (Sandbox Code Playgroud)

非常简单的问题,但是在多个列上使用循环或蛮力运行它会永远花费。

r vector missing-data

1
推荐指数
1
解决办法
457
查看次数