我有一个数据框和一个这样的数组:
df
x y z
1 10 1
10 20 2
20 30 3
30 40 4
40 50 5
my_array= 5 35 36 40 41 45 46 47 48
Run Code Online (Sandbox Code Playgroud)
我如何遍历数据帧,以便,如果my_array存在于x和之间,则将保留行y。最终的 df 将是:
x y z
1 10 1
30 40 4
40 50 5
Run Code Online (Sandbox Code Playgroud)
我试过了 df=df[(my_array <= df['x']) and (df['y'] <= my_array)]
但它给出了值错误;Lengths must match to compare.
my_array 的长度大于行数。有什么帮助吗?
我有一个 csv 文件 chr1.step1.csv,假设它有五列。我可以这样读:
df=pd.read_csv('chr1.step1.csv',sep='\t',header=None)
df.head()
0 1 2 3 4 5
a1 b1 c1 d1 e1
a2 b2 c2 d2 e2
a3 b3 c3 d3 e3
Run Code Online (Sandbox Code Playgroud)
如何添加第六列作为文件名chr1.step1.csv,例如:
0 1 2 3 4 5 6
a1 b1 c1 d1 e1 chr1.step1.csv
a2 b2 c2 d2 e2 chr1.step1.csv
a3 b3 c3 d3 e3 chr1.step1.csv
Run Code Online (Sandbox Code Playgroud)
它只有一个文件,而不是多个文件。