对于R Shiny Web应用程序,运行代码分析的哪些好方法可以显示处理时间最长的Shiny代码部分?
我有一个大而肥胖,复杂的Shiny应用程序,而且我想弄清楚在这个迷宫代码的哪个地方,我正在减慢我的Shiny应用程序.我已经试过Rprof和profr,但没有从他们那里得到太多的了解.
我希望用它ggplot2来成对生成一组堆叠的条形,就像这样:

使用以下示例数据:
df <- expand.grid(name = c("oak","birch","cedar"),
sample = c("one","two"),
type = c("sapling","adult","dead"))
df$count <- sample(5:200, size = nrow(df), replace = T)
Run Code Online (Sandbox Code Playgroud)
我希望x轴代表树的名称,每种树种有两个条形:样品一个条形,样品条形一个条形条纹.然后每个条的颜色应由类型确定.
以下代码按类型生成带颜色的堆积条:
ggplot(df, aes(x = name, y = count, fill = type)) + geom_bar(stat = "identity")
Run Code Online (Sandbox Code Playgroud)

以下代码通过示例生成躲避条:
ggplot(df, aes(x = name, y = count, group = sample)) + geom_bar(stat = "identity", position = "dodge")
Run Code Online (Sandbox Code Playgroud)

但我不能让它躲避其中一个分组(样本)并堆叠其他分组(类型):
ggplot(df, aes(x = name, y = count, fill = type, group = sample)) + geom_bar(stat = "identity", position = "dodge")
Run Code Online (Sandbox Code Playgroud)

我想从OLS模型中找到样本外预测的标准偏差和置信区间.
此问题类似于模型预测的置信区间,但明确侧重于使用样本外数据.
这个想法是针对一个函数wls_prediction_std(lm, data_to_use_for_prediction=out_of_sample_df),它返回prstd, iv_l, iv_u样本数据帧之外的函数.
例如:
import pandas as pd
import random
import statsmodels.formula.api as smf
from statsmodels.sandbox.regression.predstd import wls_prediction_std
df = pd.DataFrame({"y":[x for x in range(10)],
"x1":[(x*5 + random.random() * 2) for x in range(10)],
"x2":[(x*2.1 + random.random()) for x in range(10)]})
out_of_sample_df = pd.DataFrame({"x1":[(x*3 + random.random() * 2) for x in range(10)],
"x2":[(x + random.random()) for x in range(10)]})
formula_string = "y ~ x1 + x2"
lm = smf.ols(formula=formula_string, data=df).fit()
# …Run Code Online (Sandbox Code Playgroud) python linear-regression confidence-interval standard-deviation statsmodels
我喜欢DataTables (一个 jQuery 插件)的简洁性。
对于 R,RStudio 人员整理了一个简单的包 ( DT ),使您能够用两行创建一个“hello world”数据表:
library(DT)
DT::datatable(iris)
Run Code Online (Sandbox Code Playgroud)
是否有针对 Python 的 DataTables 的简单集成,也不需要设置 HTML 模板等?
或者,因为我真的很喜欢 DataTables 能够快速按列过滤,如下所示,我是否应该使用其他包?
这是一个非常简单的问题,但我再次对data.table语法感到困惑.
如果我有一个表示列名的字符串 - 例如column <- "x"- 如何只返回与该列上的逻辑条件匹配的行?
在a中data.frame,如果我想返回列x等于的表的所有行1,我会写df[df[,column] == 1,].
我如何有效地写一个data.table?
(注意,dt[x == 1]工作正常,但如果使用column表示该列名称的字符串则不行.)
这里的答案很接近但似乎不足以回答这个问题.
这是一个重复的问题,这除了对R,而不是Python的.
我想在列表中标识连续的组(有些人称它们是连续的)整数,其中重复的条目被视为在同一范围内存在.因此:
myfunc(c(2, 3, 4, 4, 5, 12, 13, 14, 15, 16, 17, 17, 20))
Run Code Online (Sandbox Code Playgroud)
收益:
min max
2 5
12 17
20 20
Run Code Online (Sandbox Code Playgroud)
虽然任何输出格式都可以.我目前的蛮力,for-loop方法非常慢.
(如果我能轻易地重新解释Python的答案并且我是愚蠢的,那道歉!)
假设我有一个无法改变的功能,例如:
add.these <- function(x,y,z) {
x + y + z
}
Run Code Online (Sandbox Code Playgroud)
我想将所有三个参数作为单个对象传递.如何将此单个对象传递给函数,以便将它们作为单独的输入进行评估?
理想的结果是类似的args <- list(x,y,z),并add.these(args)返回结果.
这是一个简单的问题,一直困扰着我,但我愚蠢地无法弄明白.实际的用例是函数根据所需的输出具有可变数量的参数,我希望将它们作为列表或其他内容传递.
我正在尝试使用不丢失的值返回向量中的最新行。例如,给定
x <- c(1,2,NA,NA,3,NA,4)
Run Code Online (Sandbox Code Playgroud)
然后,函数(x)将输出类似以下的列表:
c(1,2,2,2,3,3,4)
Run Code Online (Sandbox Code Playgroud)
非常简单的问题,但是在多个列上使用循环或蛮力运行它会永远花费。
r ×7
python ×2
contiguous ×1
data.table ×1
datatable ×1
datatables ×1
function ×1
geom-bar ×1
ggplot2 ×1
jquery ×1
list ×1
missing-data ×1
position ×1
range ×1
shiny ×1
statsmodels ×1
unique ×1
vector ×1