小编Edo*_*IFP的帖子

仅对某些行的不同大小的两个 pandas 数据帧的列进行求和

我有两个 pandas 数据框,如下所示:

df1:
      n  column1
0   5.0      0.0
1   6.0      0.0
2   7.0      0.0
3   8.0      0.0
4   9.0      0.0
5  10.0      0.0

df2:
     n  column2
0  6.0      1.0
1  7.0      1.0
2  8.0      1.0
Run Code Online (Sandbox Code Playgroud)

我只想对n相同的行进行column1求和。所需的输出如下所示:column2

df3:
      n  column1
0   5.0      0.0
1   6.0      1.0
2   7.0      1.0
3   8.0      1.0
4   9.0      0.0
5  10.0      0.0
Run Code Online (Sandbox Code Playgroud)

请注意:

  • n的值可能因情况而异,因此我无法用df2零填充 的列并执行经典求和。
  • n的值最终不应被修改。因此,我想避免诸如移动n值以使它们与行索引匹配之类的解决方法。
  • 到目前为止我所尝试的结果如下:

          n  column1
    0   5.0      1.0
    1 …
    Run Code Online (Sandbox Code Playgroud)

python sum pandas

4
推荐指数
1
解决办法
2016
查看次数

使用awk将大型复杂的一列文件拆分为多个列

我有一个由一些商业软件生成的文本文件,如下所示.它由括号分隔的部分组成,每个部分都有数百万个元素,但确切的值会从一个案例变为另一个案例.

(1
 2
 3
...
)
(11
22
33
...
)
(111
222
333
...
)
Run Code Online (Sandbox Code Playgroud)

我需要实现如下输出:

 1;  11;   111
 2;  22;   222
 3;  33;   333
...  ...  ...
Run Code Online (Sandbox Code Playgroud)

我发现了一种复杂的方式:

我觉得这很糟糕,因为我循环了几百万行.即使返回时间非常好(约80秒),我也想找到一个完整的awk解决方案,但无法实现.就像是:

awk 'BEGIN{RS="(\\n)"; OFS=";"} { print …
Run Code Online (Sandbox Code Playgroud)

bash awk field rows

4
推荐指数
1
解决办法
154
查看次数

标签 统计

awk ×1

bash ×1

field ×1

pandas ×1

python ×1

rows ×1

sum ×1