Jor*_*des 6 statistics dataframe julia
我正在尝试从 R 转向 Julia。
所以我有一个数据集,其中包含 2 列价格和 2 列条件列,告诉我价格是“便宜”还是“贵”。
所以我想数一下有多少“便宜”或“昂贵”的条目。
所以使用这个包DataStructures我得到了这个:
using DataStructures
counter(df.p_orellana)
Accumulator{Union{Missing, String}, Int64} with 3 entries:
"expensive" => 18
missing => 2
"cheap" => 22
Run Code Online (Sandbox Code Playgroud)
table()这与R 中的函数相同。
有什么方法可以使这些值成比例吗?
在 R 中,它可以发挥prop.Table()作用,但我不确定如何使用 Julia 来实现它。
我想拥有:
Accumulator{Union{Missing, String}, Int64} with 3 entries:
"expensive" => 0.4285
missing => 0.0476
"cheap" => 0.5238
Run Code Online (Sandbox Code Playgroud)
提前致谢!
使用 FreqTables.jl 包。
\n这是一个例子:
\njulia> using FreqTables\n\njulia> data = [fill("expensive", 18); fill(missing, 2); fill("cheap", 22)];\n\njulia> freqtable(data)\n3-element Named Vector{Int64}\nDim1 \xe2\x94\x82\n\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xbc\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\ncheap \xe2\x94\x82 22\nexpensive \xe2\x94\x82 18\nmissing \xe2\x94\x82 2\n\njulia> proptable(data)\n3-element Named Vector{Float64}\nDim1 \xe2\x94\x82\n\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xbc\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\ncheap \xe2\x94\x82 0.52381\nexpensive \xe2\x94\x82 0.428571\nmissing \xe2\x94\x82 0.047619\nRun Code Online (Sandbox Code Playgroud)\n结果按排序顺序显示。如果您想要其他顺序,请另外使用 CategoricalArrays.jl 包并设置适当的级别顺序:
\njulia> using CategoricalArrays\n\njulia> cat_data = categorical(data, levels=["expensive", "cheap"]);\n\njulia> freqtable(cat_data)\n3-element Named Vector{Int64}\nDim1 \xe2\x94\x82\n\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xbc\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\n"expensive" \xe2\x94\x82 18\n"cheap" \xe2\x94\x82 22\nmissing \xe2\x94\x82 2\n\njulia> proptable(cat_data)\n3-element Named Vector{Float64}\nDim1 \xe2\x94\x82\n\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\xbc\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\xe2\x94\x80\n"expensive" \xe2\x94\x82 0.428571\n"cheap" \xe2\x94\x82 0.52381\nmissing \xe2\x94\x82 0.047619\nRun Code Online (Sandbox Code Playgroud)\n
| 归档时间: |
|
| 查看次数: |
136 次 |
| 最近记录: |