正确的LaTeX文档的字数

And*_*ech 69 latex word-count

我正在搜索为LaTeX文档执行正确字数的应用程序或脚本.

到目前为止,我只遇到过只能处理单个文件的脚本,但我想要的是一个可以安全地忽略LaTeX关键字并遍历链接文件的脚本...即关注\include\input链接以生成正确的字数整个文件.

使用vim,我目前使用ggVGg CTRL+G但显然显示当前文件的计数,并且不会忽略LaTeX关键字.

有谁知道任何可以完成这项工作的脚本(或应用程序)?

Geo*_*off 70

我用texcount.该网页有一个可下载的Perl脚本(和手册).

它将包括tex文档中包含(\input\include)的文件(请参阅-inc参考资料),支持宏,并具有许多其他不错的功能.

当关注包含的文件时,您将获得有关每个单独文件以及总计的详细信息.例如,这是我的12页文档的总输出:

TOTAL COUNT
Files: 20
Words in text: 4188
Words in headers: 26
Words in float captions: 404
Number of headers: 12
Number of floats: 7
Number of math inlines: 85
Number of math displayed: 19
Run Code Online (Sandbox Code Playgroud)

如果您只对总数感兴趣,请使用-total参数.

  • 是的,这就是`-inc`参数的作用(我将编辑我的回复). (2认同)

And*_*ech 12

我选择了icio的评论并通过将输出管道输出pdftotext到pdf本身进行了字数统计wc:

pdftotext file.pdf - | wc - w 
Run Code Online (Sandbox Code Playgroud)

  • 小心这个.我相信一个用两行连字的单词将显示为2个单词,而不是一个单词.页眉和页脚也将被计算在内.查看`pdftotext`的输出,看看它是否合适.如果你想要一个精确的计数,我不会使用这个解决方案. (2认同)

aio*_*obe 7

latex file.tex
dvips -o - file.dvi | ps2ascii | wc -w
Run Code Online (Sandbox Code Playgroud)

应该给你一个相当准确的字数.


fia*_*lli 5

要添加到@aioobe,

如果您使用 pdflatex,只需执行

pdftops file.pdf
ps2ascii file.ps|wc -w
Run Code Online (Sandbox Code Playgroud)

我将此计数与 Microsoft Word 中 1599 字文档(根据 Word)中的计数进行了比较。pdftotext生成了 1700 多个单词的文本。texcount不包括参考文献并产生了 1088 个单词。ps2ascii返回 1603 个单词。比 Word 多 4 个。

我说这是一个很好的计数。不过,我不确定这 4 个词的区别在哪里。:)


Fra*_*urt 5

在Texmaker界面中,您可以通过右键单击PDF预览来获得字数统计:

在此处输入图片说明

在此处输入图片说明

  • 每次运行它时都会给出不同的数字:D 令人着迷。 (2认同)