如何将LaTeX转换为纯文本(ASCII)?

chu*_*ckg 65 latex ascii

场景:
我有一个我使用LaTeX创建的文档(在这种情况下是我的简历),它pdflatex正确编译并输出我想要的内容.现在我需要将相同的文档转换为普通的旧ASCII.

例如:
我已经看到这种情况(至少一次)在这里,在这里笔者有一个PDF版本ASCII版本,在几乎每一个方式,包括利润,间距和要点相匹配的PDF版本.

由于ASCII格式的限制,我意识到这种类型的转换不能准确,但根据我迄今为止发现的内容,似乎可以进行非常接近的近似.这样做的过程是什么?

小智 43

Opendetex适用于Windows和Linux(在Mac上也能很好地编译).它可以从https://github.com/pkubowicz/opendetex下载

用法:

detex project

打开project.tex,读取使用\ include或\ includeonly命令包含的所有文件,将结果文本输出到标准输出.

detex -n project > out.txt

打开project.tex,不跟随\ include或\ includeonly命令,将结果文本输出到out.txt

detex --help

显示完整的帮助

将其解压缩到您选择的任何目录.假设您将其解压缩到下载目录.

在其中创建任何名称的另一个目录(这是可选的,但建议使用).假设目录名是"my_paper".将您的论文放在"my_paper"目录中.假设您的论文名称是project.tex.

导航到路径

    cd ~/Downloads/opendetex
Run Code Online (Sandbox Code Playgroud)

运行命令

    detex my_paper/project.tex  > out.txt
Run Code Online (Sandbox Code Playgroud)

通用形式

    detex -n full_path_to_tex_file.tex > output_text_file.txt
Run Code Online (Sandbox Code Playgroud)

  • 这是最好的答案,除了你可能不应该默认使用`-n`标志. (3认同)
  • 这给了我一个空文本文件作为输出.(Mac OSX,opendetex通过Homebrew安装; .tex文件被Pandoc消化得很好). (2认同)

Bea*_*rdo 16

CatDVI可以将DVI转换为文本并尝试保留格式.


Die*_*lla 14

您可以尝试这里提出的一些程序:

TeX到ASCII


Lit*_*eet 9

您也可以尝试Pandoc,它可以将乳胶转换为许多其他格式.我建议阅读它的文档,因为可能有一些棘手的情况需要传递一些参数来处理.


blu*_*her 8

另一种选择是使用htlatex从LaTeX源创建网页,然后使用链接转换为纯文本.我用了命令行

links -dump -no-numbering -no-references input.html > output.txt

在过去,这给了一个相当不错的结果.这当然会与呈现的HTML视图相匹配,而不是原始PDF,因此可能不是您想要的.


ahc*_*cox 6

如果您正在使用pdflatex,您可能不希望乱用您的包选项切换latex到生成DVI.

而是,取你的pdf文件并转换它.这适用于我使用Curve包制作的简历/简历:

pdftotext  -layout MyResume.pdf
Run Code Online (Sandbox Code Playgroud)

注意-layout标志.