我正在使用 pdfinfo 来显示 pdf 文件的标题名称和作者。但是对于某些 pdf 文件,它不起作用。它显示了所有其他信息,如创建日期、修改日期、页面大小等,但论文标题和作者姓名除外。有没有其他方法可以检索这些信息?我用过了:
pdfinfo filename
Run Code Online (Sandbox Code Playgroud) 假设我曾经awk
获取过两个不同列的值:
说输出是:
美国广播公司
定义
现在,我想使用abc
和def
作为模式grep
,使用带有上一个命令的管道。有没有办法做到这一点?
如需更多说明:
我有一个 pdf 文件,我正在使用该文件搜索关键字:
pdftotext 'filename.pdf' - | grep 'pattern'
Run Code Online (Sandbox Code Playgroud)
现在,如果找到任何匹配项,我想将结果的第一列和第二列用作管道中 grep 的参数,并使用上一个命令。我可以使用获得前两列
pdftotext 'filename.pdf' - | grep 'pattern' | awk '{ print $1, "\t"$2 }'
Run Code Online (Sandbox Code Playgroud)
现在我将如何在 grep 命令之后再次(第二次)将这两个值作为模式传递给管道中的上述一个?
假设我有一行文本如下:
I have a nice car
Run Code Online (Sandbox Code Playgroud)
有没有什么方法可以在不将行保存到任何文件的情况下分别在不同位置获取行的不同单词(例如,我想获得“有”和“不错”的部分)。我的意思是,我想应用这样一种方法,它会直接在给定行的所需位置给我单词。有什么办法吗?