我试图从一个数据帧列中提取每个唯一条目的数量并将其存储为新的数据帧,如下所示:
输入
sample_name
sample1
sample2
sample2
sample3
sample3
sample3
Run Code Online (Sandbox Code Playgroud)
所需输出
sample_name count
sample1 1
sample2 2
sample3 3
Run Code Online (Sandbox Code Playgroud)
编辑 我猜这会因为没有显示我尝试过的内容而被否决,因此对于可能发现自己处于相同情况的其他用户来说,这就是我停滞不前的地方:
给定输入数据帧,我能够提取唯一的条目:
input_df["sample_name"].unique() # ['sample1', 'sample2', 'sample3']
Run Code Online (Sandbox Code Playgroud)
以及出现的次数(不是每个唯一条目):
input_df.groupby("sample_name")["sample_name"].transform("count")
Run Code Online (Sandbox Code Playgroud)
哪个输出
0 1
1 2
2 2
3 3
4 3
5 3
Run Code Online (Sandbox Code Playgroud)
我没有弄清楚如何提取每个唯一条目的计数。
你要value_counts:
In [142]:
df['sample_name'].value_counts()
Out[142]:
sample3 3
sample2 2
sample1 1
Name: sample_name, dtype: int64
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
6875 次 |
| 最近记录: |