如何从LaTeX文档中提取重要的文本内容

odi*_*oot 5 latex plagiarism-detection

我需要从我在LaTeX中编写的论文文档中提取纯文本内容,以进行自动反抄袭检查.我只知道"草案"选项,但这还不够.

我应该省略:

  • 图片,
  • 桌子和其他数字,
  • 方程,
  • 标题和脚注.

删除所有引用也很好.输出应该是普通(UTF-8编码)文本文件.

有没有直接的方法来做到这一点?我并不真的想要逐页手动复制它.