小编Kon*_*tin的帖子

BASH:如何在调用 bash 脚本之前将数组定义为环境变量

在 bash 中,你可以这样做

MYVAR="somevalue" ./myscript.sh
Run Code Online (Sandbox Code Playgroud)

变量 MYVAR 将在运行 myscript.sh 时定义。

我的问题是:我可以对数组做同样的事情吗?不幸的是,以下方法都不起作用。

MYARR=( 1 2 ) ./myscript.sh
MYARR[0]=1 MYARR[1]=2 ./myscript.sh
declare -a MYARR=( 1 2 ) ./myscript.sh
Run Code Online (Sandbox Code Playgroud)

arrays bash shell

6
推荐指数
1
解决办法
6269
查看次数

切片 DataGrameGroupBy 对象

有没有办法切片 DataFrameGroupBy 对象?

例如,如果我有:

df = pd.DataFrame({'A': [2, 1, 1, 3, 3], 'B': ['x', 'y', 'z', 'r', 'p']})

   A  B
0  2  x
1  1  y
2  1  z
3  3  r
4  3  p

dfg = df.groupby('A')
Run Code Online (Sandbox Code Playgroud)

现在,返回的 GroupBy 对象由来自 A 的值索引,我想选择它的一个子集,例如执行聚合。它可能是这样的

dfg.loc[1:2].agg(...)
Run Code Online (Sandbox Code Playgroud)

或者,对于特定的列,

dfg['B'].loc[1:2].agg(...)
Run Code Online (Sandbox Code Playgroud)

编辑。更清楚地说:通过切片 GroupBy 对象,我的意思是只访问组的一个子集。在上面的示例中,GroupBy 对象将包含 3 个组,分别为 A = 1、A = 2 和 A = 3。出于某些原因,我可能只对 A = 1 和 A = 2 的组感兴趣。

python group-by dataframe pandas pandas-groupby

6
推荐指数
1
解决办法
3826
查看次数

选择列的子集而不进行复制

我想从 DataFrame 中选择列的子集而不复制数据。从这个答案看来,如果列有不同的数据类型,这是不可能的。有人可以确认吗?对我来说,似乎必须有一种方法,因为这个功能是如此重要。

例如,df.loc[:, ['a', 'b']]生成副本。

python indexing dataframe pandas

5
推荐指数
1
解决办法
1904
查看次数

获取 pandas.MultiIndex 中关卡的位置

给定一个pandas.MultiIndex,我想知道给定级别名称的级别号。

所以,给定

index = pd.MultiIndex(
        names=['ind1', 'ind2'],
        levels=[['a'], ['b']],
        codes=[[], []]
    )
Run Code Online (Sandbox Code Playgroud)

我想找出ind1和的位置ind2,而不必这样做

ind1_loc = [name for name in index.names if name == 'ind1'][0]
Run Code Online (Sandbox Code Playgroud)

我觉得这绝对应该是可能的,但我在文档中找不到它。

我之所以要这样做,是因为既不返回级别名称,也不返回级别iterrows()名称itertuples(),因此您必须通过级别编号访问返回的索引。

python multi-index pandas

5
推荐指数
1
解决办法
301
查看次数

`pipenv install` 和 `pipenv lock` 有什么区别?

鉴于存在 Pipfile,似乎两者都会从 Pipfile 安装所有依赖项,并更新 Pipfile.lock。那么区别是什么呢?

python pipenv pipfile

4
推荐指数
2
解决办法
1734
查看次数

使用 pyarrow 在 worker 之间共享对象

我想将共享 DataFrame 的只读访问权限授予由multiprocessing.Pool.map().

我想避免复制和酸洗。

我知道可以使用 pyarrow 。但是,我发现他们的文档非常繁琐。任何人都可以提供一个关于如何完成的例子吗?

python pandas python-multiprocessing pyarrow

4
推荐指数
1
解决办法
2956
查看次数

Python中基于中值的线性回归

我想通过最小化绝对误差中位数来执行一维线性回归.

虽然最初假设它应该是一个相当标准的用例,但快速搜索令人惊讶地发现所有回归和插值函数都使用均方误差.

因此我的问题是:是否有一个函数可以对一个维度执行基于中值误差的线性回归?

python numpy scipy linear-regression pandas

1
推荐指数
1
解决办法
1172
查看次数