我正在尝试按组计算数据帧中的行数。以下代码生成一个名为 x1 的新列,其中包含预期信息:
by(df, [:grouping_var_1, :grouping_var_2], nrow)
Run Code Online (Sandbox Code Playgroud)
但是,我不知道如何以可以定义 x1 以外的名称的方式生成此类列。到目前为止我找到的解决方案是:
@pipe df |> by(_, [:grouping_var_1, :grouping_var_2], nrow) |> rename(_, :x1 => :my_desired_name);
Run Code Online (Sandbox Code Playgroud)
无论如何,我可以直接执行此操作,而不必使用 rename 吗?
提前致谢。
为了开始使用 Julia,我试图构建一个非常简单的函数,该函数使我获得后验分布:
grid_length = 20
k_successes = 6
n_trials = 9
prior = ones(grid_length)
function plot_posterior(grid_length::Int64 , k_successes::Int64 , n_trials::Int64 , prior::Any = nothing )
# define grid, possible parameter values ( our paremeter is the probability of success vs failure)
p_grid = collect(range(0, 1, length = grid_length))
# define uninformative prior if it is not specified
if isnothing(prior)
prior = ones(grid_length)
end
# compute likelihood at each value in grid
likelihood = [prob_binomial(k_successes , n_trials , prob) for prob …Run Code Online (Sandbox Code Playgroud) 我是朱莉娅的新手。
在 DataFrames.jl 中,有没有办法选择给定类型的所有变量,或名称中带有给定子字符串的所有变量?
例如在 R 中我们有:
df %>% select_if(is.numeric)
df %>% select(matches("_some_string_"))
Run Code Online (Sandbox Code Playgroud)
谢谢。
我有一个包含 5000 个变量的数据集。一个目标和 4999 个协变量。我想为每个目标变量组合(4999 个模型)估计一个 glm。
如何在不为 GLM 手动输入 4999 公式的情况下做到这一点?
在 RI 中将简单地定义一个包含 4999 个字符串 ("target ~ x1) 的列表,将每个字符串转换为一个公式并使用 map 来估计多个 glm。在 Julia 中是否有类似的事情可以完成?或者是否有一个优雅的替代方案?
提前致谢。