我有一篇大约 100,000 字的论文,用乳胶排版。我对某些词的连字符连字符相当不一致,例如“蜘蛛恐惧”和“蜘蛛恐惧”。
我想获得 tex 文件中所有带连字符的单词列表(连同计数),然后我还想计算未连字符版本也出现的次数。
大概是使用 awk、grep 或 sed 之类的工具?
我很难做一些非常简单的事情。我有大约 2000 个 .txt 文件,它们由一行数字组成。我想使用 fold 命令将单行折叠成多行的一列,并用这个新的折叠版本覆盖原始文件。我的尝试:
#!/bin/bash
for i in *.txt ; do
fold -w 1 $file > $file
done
Run Code Online (Sandbox Code Playgroud)
不起作用。帮助?谢谢。