相关疑难解决方法(0)

如何使用第3列的awk排序

我有一个像这样的文件(user.csv)

ip,hostname,user,group,encryption,aduser,adattr
Run Code Online (Sandbox Code Playgroud)

想按用户打印所有列排序,

我试过awk -F ":" '{print|"$3 sort -n"}' user.csv,它不起作用.

awk

79
推荐指数
6
解决办法
12万
查看次数

用awk计算滑动窗口的中值

我需要生成一个数百万行的滑动窗口并计算第 3 列的中位数。我的数据看起来像这样,第 1 列始终相同,第 2 列等于行号,第 3 列是我需要中位数的信息为了:

HiC_scaffold_1  1   34
HiC_scaffold_1  2   34
HiC_scaffold_1  3   36
HiC_scaffold_1  4   37
HiC_scaffold_1  5   38
HiC_scaffold_1  6   39
HiC_scaffold_1  7   40
HiC_scaffold_1  8   40
HiC_scaffold_1  9   40
HiC_scaffold_1  10  41
HiC_scaffold_1  11  41
HiC_scaffold_1  12  41
HiC_scaffold_1  13  44
HiC_scaffold_1  14  44
HiC_scaffold_1  15  55
Run Code Online (Sandbox Code Playgroud)

我需要这样的结果,假设滑动窗口为 4 并四舍五入到最接近的整数。在真实数据集中,我可能会使用 1000 的滑动窗口:

HiC_scaffold_1  4   35
HiC_scaffold_1  5   37
HiC_scaffold_1  6   38
HiC_scaffold_1  7   39
HiC_scaffold_1  8   40
HiC_scaffold_1  9   40
HiC_scaffold_1  10  40 …
Run Code Online (Sandbox Code Playgroud)

bash awk median sliding-window

5
推荐指数
2
解决办法
220
查看次数

标签 统计

awk ×2

bash ×1

median ×1

sliding-window ×1