小编int*_*o_r的帖子

DataFrames.jl：定义计数列名称时按组计数行

我正在尝试按组计算数据帧中的行数。以下代码生成一个名为 x1 的新列，其中包含预期信息：

by(df, [:grouping_var_1, :grouping_var_2], nrow)

Run Code Online (Sandbox Code Playgroud)

但是，我不知道如何以可以定义 x1 以外的名称的方式生成此类列。到目前为止我找到的解决方案是：

@pipe df |> by(_, [:grouping_var_1, :grouping_var_2], nrow) |> rename(_, :x1 => :my_desired_name);

Run Code Online (Sandbox Code Playgroud)

无论如何，我可以直接执行此操作，而不必使用 rename 吗？

提前致谢。

dataframe julia

int*_*o_r

lucky-day

6
推荐指数

1
解决办法

1253
查看次数

MethodError：用户定义的函数中没有方法匹配

为了开始使用 Julia，我试图构建一个非常简单的函数，该函数使我获得后验分布：

grid_length = 20
k_successes = 6
n_trials = 9
prior = ones(grid_length)

function plot_posterior(grid_length::Int64 , k_successes::Int64 , n_trials::Int64 , prior::Any = nothing )

# define grid, possible parameter values ( our paremeter is the probability of success vs failure)
p_grid = collect(range(0, 1, length = grid_length)) 
    
# define uninformative prior if it is not specified
    if isnothing(prior)
        prior = ones(grid_length)
    end

# compute likelihood at each value in grid
likelihood = [prob_binomial(k_successes , n_trials , prob) for prob …

Run Code Online (Sandbox Code Playgroud)

julia

int*_*o_r

lucky-day

3
推荐指数

1
解决办法

139
查看次数

DataFrames.jl - 按类型或名称子字符串选择列

我是朱莉娅的新手。

在 DataFrames.jl 中，有没有办法选择给定类型的所有变量，或名称中带有给定子字符串的所有变量？

例如在 R 中我们有：

df %>% select_if(is.numeric)

df %>% select(matches("_some_string_"))

Run Code Online (Sandbox Code Playgroud)

谢谢。

dataframe julia

int*_*o_r

2020 08-07

3
推荐指数

1
解决办法

1181
查看次数

如何在 Julia 中估计许多 GLM 模型？

我有一个包含 5000 个变量的数据集。一个目标和 4999 个协变量。我想为每个目标变量组合（4999 个模型）估计一个 glm。

如何在不为 GLM 手动输入 4999 公式的情况下做到这一点？

在 RI 中将简单地定义一个包含 4999 个字符串 ("target ~ x1) 的列表，将每个字符串转换为一个公式并使用 map 来估计多个 glm。在 Julia 中是否有类似的事情可以完成？或者是否有一个优雅的替代方案？

提前致谢。

julia

int*_*o_r

2020 08-28

2
推荐指数

1
解决办法

129
查看次数

标签统计

julia ×4

dataframe ×2

DataFrames.jl：定义计数列名称时按组计数行

MethodError：用户定义的函数中没有方法匹配

DataFrames.jl - 按类型或名称子字符串选择列

如何在 Julia 中估计许多 GLM 模型？

标签 统计

小编int_o_r的帖子

标签统计