dataframes在 Pandas 中,索引在一个或多个数字和/或字符串列中。特别是,在groupby操作之后,输出是一个数据帧,其中新索引由组给出。
同样,julia 数据框总是有一个列名Row,我认为它相当于熊猫中的索引。但是,在 groupby 操作之后,julia 数据框不使用组作为新索引。这是一个工作示例:
using RDatasets;
using DataFrames;
using StatsBase;
df = dataset("Ecdat","Cigarette");
gdf = groupby(df, "Year");
combine(gdf, "Income" => mean)
Run Code Online (Sandbox Code Playgroud)
输出:
11×2 DataFrame
? Row ? Year ? Income_mean ?
? ? Int32 ? Float64 ?
?????????????????????????????
? 1 ? 1985 ? 7.20845e7 ?
? 2 ? 1986 ? 7.61923e7 ?
? 3 ? 1987 ? 8.13253e7 ?
? 4 ? 1988 ? 8.77016e7 ?
? 5 ? 1989 ? …Run Code Online (Sandbox Code Playgroud) 我想表示地图每个区域内的种族分布。
我是 geopandas 的新手,到目前为止,我只能制作一张地图,按地区显示单个民族的份额。
我的代码如下:
geodf.plot(column="resid_preto", cmap="Blues", figsize=(20,12),
edgecolor='black', linewidth=0.5, alpha=0.9, legend=False)
plt.axis('off')
Run Code Online (Sandbox Code Playgroud)
其中“resid_preto”是包含该地区黑人人口比例的列
我failed to run custom build command for openssl-sys v0.9.60在尝试构建 Rust 程序时遇到错误。这里是main.rs和Cargo.toml文件。
主文件
extern crate reqwest;
fn main() {
let mut resp = reqwest::get("http://www.governo.mg.gov.br/Institucional/Equipe").unwrap();
assert!(resp.status().is_success());
}
Run Code Online (Sandbox Code Playgroud)
Cargo.toml
[package]
name = "get_sct"
version = "0.1.0"
authors = ["myname <myemail>"]
edition = "2018"
# See more keys and their definitions at https://doc.rust-lang.org/cargo/reference/manifest.html
[dependencies]
reqwest = "0.10.10"
Run Code Online (Sandbox Code Playgroud)
我在本地安装了openssl(如本问题中所建议),使用:
[package]
name = "get_sct"
version = "0.1.0"
authors = ["myname <myemail>"]
edition = "2018"
# See …Run Code Online (Sandbox Code Playgroud) 我正在尝试根据来自其他(数字)列的值范围创建一个分类变量。但是,当我missings在数字列中时,代码不起作用
这是一个可复制的示例:
using RDatasets;
using DataFrames;
using Pipe;
using FreqTables;
df = dataset("datasets","iris")
#lowercase columns just for convenience
@pipe df |> rename!(_, [lowercase(k) for k in names(df)]);
#without this line, the code works fine
@pipe df |> allowmissing!(_, :sepallength) |> replace!(_.sepallength, 4.9 => missing);
df[:size] = @. ifelse(df[:sepallength]<=4.7, "small", missing)
df[:size] = @. ifelse((df[:sepallength]>4.7) & (df[:sepallength]<=4.9), "avg", df[:size])
df[:size] = @. ifelse((df[:sepallength]>4.9) & (df[:sepallength]<=5), "large", df[:size])
df[:size] = @. ifelse(df[:sepallength]>5, "huge", df[:size])
println(@pipe df |> freqtable(_, :size))
Run Code Online (Sandbox Code Playgroud)
输出: …