如何获取 PDF 文件的字数?我认为我想要获得总字数的大多数 pdf 文件都嵌入了文本层,所以我不需要 OCR。
该任务来自于搜索一些已知大小的科学论文,例如 15000 字。大多数现代论文以pdf格式发表
pdf word-count
pdf ×1
word-count ×1