小编Vil*_*age的帖子

如何找到括号之间出现的所有单词？

我有一个包含括号中的一些单词的文件.我想编制出现在那里的所有独特单词的列表,例如:

This is some (text).
This (text) has some (words) in parenthesis.
Sometimes, there are numbers, such as (123) in parenthesis too.

Run Code Online (Sandbox Code Playgroud)

这将是结果列表:

text
words
123

Run Code Online (Sandbox Code Playgroud)

如何列出括号内出现的所有项目？

bash grep

Vil*_*age

lucky-day

7
推荐指数

2
解决办法

2万
查看次数

为什么在通过回声运行时反斜杠会消失？

我有这样的代码,它处理CSV文件:

#!/bin/bash
while read line
do
    variable=$(echo $line | awk -F, '{print $2}')
    echo $variable
 done < ./file.csv

Run Code Online (Sandbox Code Playgroud)

如果CSV文件包含any \,则在运行此命令时,输出文本不会显示\.

如何确保\不删除？

bash echo backslash

Vil*_*age

2012 04-20

6
推荐指数

1
解决办法

7340
查看次数

在 LaTeX 中从 1 个 TEX 文件制作多个 PDF？

我想创建多个文档（运行 pdflatex 后输出为 PDF），其来源来自一个文件。

例子：

\documentclass{article}

\begin{document}
    This text will appear in the first PDF.
\end{document}

\begin{document}
    This text will appear in the second PDF.
\end{document}

Run Code Online (Sandbox Code Playgroud)

这将特别有用，因为：

我可以将所有内容保存在一个文件中，并使用一个一致的序言。
我可以使用ifthen或其他循环来自动生成文档的各种替代形式。

latex pdflatex

Vil*_*age

lucky-day

5
推荐指数

1
解决办法

4553
查看次数

找到并替换许多单词

我经常需要在文件中进行多次替换.为了解决这个问题,我已经创建了两个文件old.text和new.text.第一个包含必须找到的单词列表.第二个包含应该替换它们的单词列表.

我的所有文件都使用UTF-8并使用各种语言.

我已经构建了这个脚本,我希望可以替换它.首先,它一次读取old.text一行,然后将input.txt中该行的单词替换为new.text文件中的相应单词.

#!/bin/sh
number=1
while read linefromoldwords
do
    echo $linefromoldwords
    linefromnewwords=$(sed -n '$numberp' new.text)
    awk '{gsub(/$linefromoldwords/,$linefromnewwords);print}' input.txt >> output.txt
    number=$number+1
echo $number
done <  old.text

Run Code Online (Sandbox Code Playgroud)

但是,我的解决方案效果不佳.当我运行脚本时:

在第6行,sed命令不知道$number结束的位置.
当$number变量变为"1",然后变为"2"时,变量变为"0 + 1",然后变为"0 + 1 + 1".
awk除了将output.txt完全复制到output.txt之外,该行似乎没有做任何其他操作.

你有什么建议吗？

更新:

标记的答案效果很好,但是,我经常使用这个脚本,需要花费很多时间才能完成.因此,我提供了一个解决方案的赏金,可以更快地完成这些替换.BASH,Perl或Python 2中的解决方案都可以,只要它仍然兼容UTF-8.如果您认为使用Linux系统上常用的其他软件的其他解决方案会更快,那么这也可能没问题,只要不需要巨大的依赖关系.

ruby bash perl python-2.7

Vil*_*age

2017 07-19

5
推荐指数

1
解决办法

829
查看次数

如何在文档中标记所有CJK文本？

我有一个文件,file1.txt包含英文,中文,日文和韩文文本.为了在ConTeXt中使用,我需要根据语言标记文件中的每个文本区域(英语除外),并输出一个新文件,例如,这里是一个示例行:

The ?? ate ?.

Run Code Online (Sandbox Code Playgroud)

因为它包含中文字符的文本,所以这将标记为:

The \language[cn]{??} ate \language[cn]{?}.

Run Code Online (Sandbox Code Playgroud)

该文档保存为UTF-8.
应标明中文文字\language[cn]{*}.
应标记日语文本\language[ja]{*}.
应标记韩文文本\language[ko]{*}.
内容永远不会从一行继续到下一行.
如果代码对某些东西是中文,日文还是韩文有疑问,最好是默认为中文.

如何根据语言标记文本？

unicode multilingual cjk character-properties

Vil*_*age

2012 05-20

5
推荐指数

2
解决办法

434
查看次数

如何从列表中删除可以在列表中其他较长行中找到的行？

我有一个文件list.txt,像这样:

cat
bear
tree
catfish
fish
bear

Run Code Online (Sandbox Code Playgroud)

我需要删除文档中其他地方已经完全找到的任何行,可以是重复行,也可以在另一行中找到.例如,"熊"和"熊"的行是相同的,因此删除其中一行; "猫"可以完全在"鲶鱼"中找到,因此"猫"被删除.输出看起来像这样:

catfish
tree
bear

Run Code Online (Sandbox Code Playgroud)

如何删除所有重复行,包括在列表中较长行中找到的行？

到目前为止,我有这个:

#!/bin/bash
touch list.tmp
while read -r line
do
    found="$(grep -c $line list.tmp)"
    if [ "$found" -eq "1" ]
    then
        echo $line >> list.tmp
        echo $line" added"
    else
        echo "Not added."
fi
done < list.txt

Run Code Online (Sandbox Code Playgroud)

bash perl sed

Vil*_*age

2013 07-22

5
推荐指数

1
解决办法

267
查看次数