csv列中数百万个数据值的频率

use*_*228 0 python csv excel frequency histogram

我有一长串的数字(一列有500万行),并不是彼此独特的.我想看看它们中有哪千个是列表中最常出现的事件.关于如何轻松实现这一目标的任何想法？我也可以使用excel或python脚本或其他方法.

在Bash:

sort filename | uniq -c | sort -nr

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，5 月前
查看次数：	172 次
最近记录：	7 年，5 月前

为什么在C++中使用比Python更慢的字符串拆分？ 91

按值列出组列表 54

为什么我在VBA比赛中收到错误2042？ 14

将数据从Java导出到MS Excel的最佳方法 12

Excel - 复制条件格式,删除规则,保持格式 10

如何正确有效地使用WorkbookBeforeClose事件？ 7

用PigLatin将"3"转换为3 6

VBA - 显示子运行的时间 5

低通滤波器和采样频率 4

C＃创建Excel工作表后期绑定 3

使用Git将最近的提交移动到新分支 4647

忽略已提交到Git存储库的文件 2429

查找当前目录和文件的目录 2007

你如何改变用matplotlib绘制的数字的大小？ 1726

什么是移动语义？ 1614

传输安全性阻止了明文HTTP 1425

如何获得最近提交的Git分支列表？ 1197

命名类 - 如何避免将所有内容称为"<WhatEver> Manager"？ 1147

什么是Python 3相当于"python -m SimpleHTTPServer" 1124

如何在JavaScript中将浮点数转换为整数？ 1043