小编int*_*o_r的帖子

DataFrames.jl:定义计数列名称时按组计数行

我正在尝试按组计算数据帧中的行数。以下代码生成一个名为 x1 的新列,其中包含预期信息:

by(df, [:grouping_var_1, :grouping_var_2], nrow) 

Run Code Online (Sandbox Code Playgroud)

但是,我不知道如何以可以定义 x1 以外的名称的方式生成此类列。到目前为止我找到的解决方案是:

@pipe df |> by(_, [:grouping_var_1, :grouping_var_2], nrow) |> rename(_, :x1 => :my_desired_name);
Run Code Online (Sandbox Code Playgroud)

无论如何,我可以直接执行此操作,而不必使用 rename 吗?

提前致谢。

dataframe julia

6
推荐指数
1
解决办法
1253
查看次数

MethodError:用户定义的函数中没有方法匹配

为了开始使用 Julia,我试图构建一个非常简单的函数,该函数使我获得后验分布:

grid_length = 20
k_successes = 6
n_trials = 9
prior = ones(grid_length)

function plot_posterior(grid_length::Int64 , k_successes::Int64 , n_trials::Int64 , prior::Any = nothing )

# define grid, possible parameter values ( our paremeter is the probability of success vs failure)
p_grid = collect(range(0, 1, length = grid_length)) 
    
# define uninformative prior if it is not specified
    if isnothing(prior)
        prior = ones(grid_length)
    end

# compute likelihood at each value in grid
likelihood = [prob_binomial(k_successes , n_trials , prob) for prob …
Run Code Online (Sandbox Code Playgroud)

julia

3
推荐指数
1
解决办法
139
查看次数

DataFrames.jl - 按类型或名称子字符串选择列

我是朱莉娅的新手。

在 DataFrames.jl 中,有没有办法选择给定类型的所有变量,或名称中带有给定子字符串的所有变量?

例如在 R 中我们有:

df %>% select_if(is.numeric)

df %>% select(matches("_some_string_"))

Run Code Online (Sandbox Code Playgroud)

谢谢。

dataframe julia

3
推荐指数
1
解决办法
1181
查看次数

如何在 Julia 中估计许多 GLM 模型?

我有一个包含 5000 个变量的数据集。一个目标和 4999 个协变量。我想为每个目标变量组合(4999 个模型)估计一个 glm。

如何在不为 GLM 手动输入 4999 公式的情况下做到这一点?

在 RI 中将简单地定义一个包含 4999 个字符串 ("target ~ x1) 的列表,将每个字符串转换为一个公式并使用 map 来估计多个 glm。在 Julia 中是否有类似的事情可以完成?或者是否有一个优雅的替代方案?

提前致谢。

julia

2
推荐指数
1
解决办法
129
查看次数

标签 统计

julia ×4

dataframe ×2