小编Kon*_*tin的帖子

BASH：如何在调用 bash 脚本之前将数组定义为环境变量

在 bash 中，你可以这样做

MYVAR="somevalue" ./myscript.sh

Run Code Online (Sandbox Code Playgroud)

变量 MYVAR 将在运行 myscript.sh 时定义。

我的问题是：我可以对数组做同样的事情吗？不幸的是，以下方法都不起作用。

MYARR=( 1 2 ) ./myscript.sh
MYARR[0]=1 MYARR[1]=2 ./myscript.sh
declare -a MYARR=( 1 2 ) ./myscript.sh

Run Code Online (Sandbox Code Playgroud)

arrays bash shell

Kon*_*tin

lucky-day

6
推荐指数

1
解决办法

6269
查看次数

切片 DataGrameGroupBy 对象

有没有办法切片 DataFrameGroupBy 对象？

例如，如果我有：

df = pd.DataFrame({'A': [2, 1, 1, 3, 3], 'B': ['x', 'y', 'z', 'r', 'p']})

   A  B
0  2  x
1  1  y
2  1  z
3  3  r
4  3  p

dfg = df.groupby('A')

Run Code Online (Sandbox Code Playgroud)

现在，返回的 GroupBy 对象由来自 A 的值索引，我想选择它的一个子集，例如执行聚合。它可能是这样的

dfg.loc[1:2].agg(...)

Run Code Online (Sandbox Code Playgroud)

或者，对于特定的列，

dfg['B'].loc[1:2].agg(...)

Run Code Online (Sandbox Code Playgroud)

编辑。更清楚地说：通过切片 GroupBy 对象，我的意思是只访问组的一个子集。在上面的示例中，GroupBy 对象将包含 3 个组，分别为 A = 1、A = 2 和 A = 3。出于某些原因，我可能只对 A = 1 和 A = 2 的组感兴趣。

python group-by dataframe pandas pandas-groupby

Kon*_*tin

2017 09-16

6
推荐指数

1
解决办法

3826
查看次数

选择列的子集而不进行复制

我想从 DataFrame 中选择列的子集而不复制数据。从这个答案看来，如果列有不同的数据类型，这是不可能的。有人可以确认吗？对我来说，似乎必须有一种方法，因为这个功能是如此重要。

例如，df.loc[:, ['a', 'b']]生成副本。

python indexing dataframe pandas

Kon*_*tin

2017 11-27

5
推荐指数

1
解决办法

1904
查看次数

获取 pandas.MultiIndex 中关卡的位置

给定一个pandas.MultiIndex，我想知道给定级别名称的级别号。

所以，给定

index = pd.MultiIndex(
        names=['ind1', 'ind2'],
        levels=[['a'], ['b']],
        codes=[[], []]
    )

Run Code Online (Sandbox Code Playgroud)

我想找出ind1和的位置ind2，而不必这样做

ind1_loc = [name for name in index.names if name == 'ind1'][0]

Run Code Online (Sandbox Code Playgroud)

我觉得这绝对应该是可能的，但我在文档中找不到它。

我之所以要这样做，是因为既不返回级别名称，也不返回级别iterrows()名称itertuples()，因此您必须通过级别编号访问返回的索引。

python multi-index pandas

Kon*_*tin

lucky-day

5
推荐指数

1
解决办法

301
查看次数

`pipenv install` 和 `pipenv lock` 有什么区别？

鉴于存在 Pipfile，似乎两者都会从 Pipfile 安装所有依赖项，并更新 Pipfile.lock。那么区别是什么呢？

python pipenv pipfile

Kon*_*tin

lucky-day

4
推荐指数

2
解决办法

1734
查看次数

使用 pyarrow 在 worker 之间共享对象

我想将共享 DataFrame 的只读访问权限授予由multiprocessing.Pool.map().

我想避免复制和酸洗。

我知道可以使用 pyarrow 。但是，我发现他们的文档非常繁琐。任何人都可以提供一个关于如何完成的例子吗？

python pandas python-multiprocessing pyarrow

Kon*_*tin

lucky-day

4
推荐指数

1
解决办法

2956
查看次数

Python中基于中值的线性回归

我想通过最小化绝对误差中位数来执行一维线性回归.

虽然最初假设它应该是一个相当标准的用例,但快速搜索令人惊讶地发现所有回归和插值函数都使用均方误差.

因此我的问题是:是否有一个函数可以对一个维度执行基于中值误差的线性回归？

python numpy scipy linear-regression pandas

Kon*_*tin

lucky-day

1
推荐指数

1
解决办法

1172
查看次数

标签统计

python ×6

pandas ×5

dataframe ×2

arrays ×1

bash ×1

group-by ×1

indexing ×1

linear-regression ×1

multi-index ×1

numpy ×1

pandas-groupby ×1

pipenv ×1

pipfile ×1

pyarrow ×1

python-multiprocessing ×1

scipy ×1

shell ×1

标签 统计

小编Kon_tin的帖子

标签统计