csv列中数百万个数据值的频率

use*_*228 0 python csv excel frequency histogram

我有一长串的数字(一列有500万行),并不是彼此独特的.我想看看它们中有哪千个是列表中最常出现的事件.关于如何轻松实现这一目标的任何想法?我也可以使用excel或python脚本或其他方法.

rsa*_*xvc 6

在Bash:

sort filename | uniq -c | sort -nr
Run Code Online (Sandbox Code Playgroud)