小编Ema*_*ini的帖子

如何将使用正则表达式提取的句子的所有单词组合在一起?

如果可能,我想与linux命令结合使用,所有以大写字母开头的单词,但不包括该行开头的单词。目标是在这些单词之间创建边缘。例如:

My friend John met Beatrice and Lucio.
Run Code Online (Sandbox Code Playgroud)

我想要的结果应该是:

  • 约翰·比阿特丽斯
  • 约翰·卢西奥
  • 露西欧·比阿特丽斯

我设法通过正则表达式获得了所有以大写字母开头的单词,但不包括该行开头的单词。正则表达式为:

*cat gov.json | grep -oP "\b([A-Z][a-z']*)(\s[A-Z][a-z']*)*\b | ^(\s*.*?\s).*" > nodes.csv*
Run Code Online (Sandbox Code Playgroud)

节点设法在列中分别输入它们,即:

  • 约翰
  • 比阿特丽斯
  • 路西欧

现在的目标是在以大写字母开头的名称之间创建可能的组合,并将其放入文件中。有什么建议么?

regex linux awk

5
推荐指数
1
解决办法
117
查看次数

标签 统计

awk ×1

linux ×1

regex ×1