我有一个文件看起来像:
输入:
34
34
34
43
54
54
10001
10001
10001
10001
100005
100005
500000
Run Code Online (Sandbox Code Playgroud)
所以我需要每个数字只出现一次:
出去:
34
43
54
10001
100005
500000
Run Code Online (Sandbox Code Playgroud)
考虑到真实文件很大,重复次数太多,有什么建议吗?
我有一个每行 45000 个字符的文件,我想根据一行中的特定字符数拆分原始文件。作为一个小例子,我的输入文件如下所示:
输入.txt:
123394531112334455938383726644600000111234499922281133
234442221117273747474747474729292921111098887777772235
231112233647474838389292121037549284753930837475111013
Run Code Online (Sandbox Code Playgroud)
每行有 54 位数字。我希望前 10 位数字是一个单独的文件,而 11-24 是另一个文件。和从 25-32 位另一个文件和 33-50 最后一个文件,如:
out1.txt (1-10)
1233945311
2344422211
2311122336
Run Code Online (Sandbox Code Playgroud)
out2.txt (11-24)
12334455938383
17273747474747
47474838389292
Run Code Online (Sandbox Code Playgroud)
out3.txt (25-32)
72664460
47472929
12103754
Run Code Online (Sandbox Code Playgroud)
out4.txt (33-54)
0000111234499922281133
2921111098887777772235
9284753930837475111013
Run Code Online (Sandbox Code Playgroud)
请问有什么建议吗?
我有一个如下所示的文件:
ID avedebv debv2019 ebv2018 gebv2018 number avecvlean
7063993 1.06109 0.5325 0.7420 1.5084 206 66.5962
7076247 1.67947 2.1066 2.8630 3.0629 460 67.6856
7076881 -0.236859 -2.6794 0.8820 1.9994 282 66.1557
7126254 -0.409945 -2.2293 0.5860 1.2695 133 66.0323
7178892 0.464492 -0.0859 1.2640 1.3655 327 66.3985
7179256 1.33735 2.2111 1.4730 1.0873 48 67.9671
7247048 0.875797 0.8434 1.5680 2.3221 86 67.8639
7247721 2.44818 3.8560 2.2590 3.7478 306 69.2416
7271572 2.54853 4.1963 2.5310 2.4604 268 68.9649
7271958 1.48163 2.1094 2.6480 2.4154 396 67.8631
7310883 2.07762 …
Run Code Online (Sandbox Code Playgroud) 我想创建一个 2 列,如:
1 10
1 20
1 30
1 40
1 50
2 10
2 20
2 30
2 40
2 50
3 10
3 20
3 30
3 40
3 50
Run Code Online (Sandbox Code Playgroud)
请问有什么建议吗?