小编Abh*_*til的帖子

当列中有多个具有重复值的行时选择第一行

当一列中有多个具有重复值的行时，我想选择第一行。

例如：

import pandas as pd
df = pd.DataFrame({'col1':['one', 'one', 'one', 'one', 'one', 'one', 'one', 'one'], 
                   'col2':['ID=ABCD1234', 'ID=ABCD1234', 'ID=ABCD1234', 'ID=ABCD5678', 
                           'ID=ABCD5678', 'ID=ABCD5678', 'ID=ABCD9102', 'ID=ABCD9102']})

Run Code Online (Sandbox Code Playgroud)

熊猫数据框如下所示：

print(df)
  col1         col2
0  one  ID=ABCD1234
1  one  ID=ABCD1234
2  one  ID=ABCD1234
3  one  ID=ABCD5678
4  one  ID=ABCD5678
5  one  ID=ABCD5678
6  one  ID=ABCD9102
7  one  ID=ABCD9102

Run Code Online (Sandbox Code Playgroud)

我希望第 0 行、第 3 行和第 6 行被选中并作为新数据帧输出。

预期输出：

      col1         col2
    0  one  ID=ABCD1234
    3  one  ID=ABCD5678
    6  one  ID=ABCD9102

Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

Abh*_*til

2021 08-10

5
推荐指数

2
解决办法

2836
查看次数

如何使用Shell创建具有不同名称的输出文件？

我有一个R脚本（abc.R）：

#!/usr/bin/env Rscript

print("HELLO")

Run Code Online (Sandbox Code Playgroud)

还有一个包含R脚本（example.sh）的批处理脚本：

#!/bin/bash
module load Rstats
module load RstatsPackages


Rscript /home1/R_scripts/abc.R   > "result.txt"

Run Code Online (Sandbox Code Playgroud)

还有另一个批处理脚本（multiple.sh），它调用上述脚本：

#!/bin/sh

for((i=1;i<=10;i++))
do

     sbatch -p normal -t 4:00:00 -N 1 -n 4 example.sh $i

done

sh multiple.sh

Run Code Online (Sandbox Code Playgroud)

该脚本调用上述脚本十次，因此我的Rscript将运行十次。它运行10次，但仅生成一个result.txt。不过，我想多个结果文件，如result1.txt，result2.txt，result3.txt等等。

linux bash slurm

Abh*_*til

2019 02-23

1
推荐指数

1
解决办法

54
查看次数

标签统计

bash ×1

dataframe ×1

linux ×1

pandas ×1

python ×1

slurm ×1

当列中有多个具有重复值的行时选择第一行

如何使用Shell创建具有不同名称的输出文件？

标签 统计

小编Abh_til的帖子

标签统计