我正在尝试使用带有 pandoc 的 markdown 将单个文档转换为 html、pdf 和 docx。这是一个非常简单的文档,只包含无数学运算的文本和一些图像。图像为 PNG 格式。我在降价源中包含了一个使用此图像的图像:
<div style="float:center" markdown="1">

</div>
Run Code Online (Sandbox Code Playgroud)
并将其编译为:
# html
pandoc myarticle.md -c mystyle.css -o myarticle.html
# pdf
pandoc myarticle.md -V geometry:margin=1in -o myarticle.pdf
# docx
pandoc myarticle.md -o myarticle.docx
Run Code Online (Sandbox Code Playgroud)
我注意到一些具有相同尺寸的PNG 图像在 HTML 和 PDF 格式中的大小不同。一个 250x256 像素、低分辨率 (72 像素/英寸) 的 PNG 将在 PDF 中大致显示为页面上的正确尺寸,并在 html 中以合理的尺寸显示,但具有相同尺寸 (250x256 像素) 但高分辨率(300 像素/英寸)在 PDF 输出的页面上被调整为很小。我想保留一组我指定大小的 PNG 图像,并让它们以 HTML/PDF/DOCX 格式显示在该大小。
我愿意放弃自动 docx 支持(或之后处理大量手动格式)只是为了拥有 PDF/HTML。
如何告诉 pandoc 不要为 PDF 或图像调整 PNG 的大小,并让它们出现在正确的图像中?谢谢。
%Title
%Author
#Header 1
Lots of words.
#Header 2
More words.
##Level 2 header
Run Code Online (Sandbox Code Playgroud)
上面的文字可以转成EPUB文件给电子阅读器pandoc -o output.epub input.mkd
,可以转成PDF pandoc -o output.pdf input.mkd
。后者需要安装乳胶引擎,这可能与回答问题有关。
使用 EPUB,每个 1 级标题都会自动设置在新页面的顶部(较小的标题不是)。对于 PDF,情况并非如此——我不希望它是默认的,因为这与降价的主要目标背道而驰。但是,我无法找到启用此行为的 pandoc 选项。
有谁知道使用 pandoc 启用此行为的方法?编辑配置文件将是一个可以接受的解决方案,但如果语法是基于乳胶的,我会很感激它的解释(配置文件中的含义,而不是对乳胶的全面解释!)。
pandoc 的--chapters
选项似乎应该做我想做的……但它
Chapter x
在实际标题之前插入,这会导致一些荒谬的东西,例如:第1章
序幕
如果可以驯服该--chapters
选项,那将是一个合适的答案。
我知道我可以使用-H
or--include-in-header
命令在生成的输出中包含自定义序言。现在的问题是Pandoc包含了我的序言,但在它前面放了另一个序言:
\documentclass{article}
\usepackage{amssymb,amsmath}
\usepackage{ifxetex,ifluatex}
\ifxetex
\usepackage{fontspec,xltxtra,xunicode}
\defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
\else
\ifluatex
\usepackage{fontspec}
\defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
\else
\usepackage[utf8]{inputenc}
\fi
\fi
\ifxetex
\usepackage[setpagesize=false, % page size defined by xetex
unicode=false, % unicode breaks when used with xetex
xetex]{hyperref}
\else
\usepackage[unicode=true]{hyperref}
\fi
\hypersetup{breaklinks=true, pdfborder={0 0 0}}
\setlength{\parindent}{0pt}
\setlength{\parskip}{6pt plus 2pt minus 1pt}
\setlength{\emergencystretch}{3em} % prevent overfull lines
\setcounter{secnumdepth}{0}
[... my preamble ...]
Run Code Online (Sandbox Code Playgroud)
我知道这是default.latex
Pandoc 从其templates
文件夹加载的默认 LaTeX 序言 ( ) 。当我使用--include-after-body
with时也会发生同样的事情\end{document}
。
这是我正在使用的命令:
pandoc -o output.tex …
Run Code Online (Sandbox Code Playgroud) 有没有办法通过命令行在 Markdown(或者更好,Pandoc Markdown)中获取自然语言单词的字数?可能只是wc
用来得到一个非常粗略的估计,但wc
很幼稚,并将任何被空白包围的东西都算作一个词。这包括诸如标题格式、项目符号和链接中的 URL 之类的内容。
理想的做法是删除所有降价格式(如果可能,包括 Pandoc 引用),然后将其传递给wc
,但我找不到这样做的方法,因为pandoc
纯文本输出格式仍然包含大量降价造型。
我想转换降价文本,如:
This is a smile
Run Code Online (Sandbox Code Playgroud)
到带有表情符号的 PDF。需要明确的是,我希望能够在源文本中插入表情符号字符本身,而不是像:smile:
.
我怎样才能用 Pandoc 做到这一点?
我正在试验Pandoc,特别是降价到 RTF 功能。当我运行转换器时,生成的 RTF 在 Word 和 OpenOffice 中以纯文本形式打开(文本看起来像 RTF,但不被视为 RTF)。转换为 HTML 工作正常。
这是我使用的命令:
pandoc -f markdown -t rtf -o sample.rtf sample.txt
Run Code Online (Sandbox Code Playgroud)
这是我使用的简短示例降价:
# markdown example
- uli1
_em_
__strong__
Run Code Online (Sandbox Code Playgroud)
创建的文件内容的片段:
{\pard \ql \f0 \sa180 \li0 \fi0 \b \fs36 markdown example\par}
Run Code Online (Sandbox Code Playgroud)
在 Vista 32 位上运行,使用 Pandoc 1.6(来自http://code.google.com/p/pandoc/downloads/list)。
有谁知道问题可能是什么?
我想编写一个带有参考文献@ref
(和 BibTeX 数据库)的 Markdown 文件。发送文件时,应将其转换为包含渲染引用的独立 Markdown 文件。呈现的参考键不应是数字,而应是字母数字。
最小的例子:
最小.md:
@PTDL2008
Run Code Online (Sandbox Code Playgroud)
最小围兜:
@article{PTDL2008,
title = {{Service-Oriented Computing: State of the Art and Research Challenges}},
author = {Michael P. Papazoglou and Paolo Traverso and Schahram Dustdar and Frank Leymann},
journal = {International Journal of Cooperative Information Systems (IJCIS)},
year = {2008},
month = {June},
number = {2},
pages = {233--255},
volume = {17},
doi = {10.1109/MC.2007.400}
}
Run Code Online (Sandbox Code Playgroud)
获取DIN 1505-2(字母数字,德语)并将其存储在同一目录中。
命令行调用:
pandoc minimal.md -o minimal-new.md --atx-headers --bibliography="minimal.bib" --csl=din-1505-2-alphanumeric.csl
Run Code Online (Sandbox Code Playgroud)
结果输出为 …
我有一个这样的文件夹结构,根据主题在目录中包含配方 .md 文件:
Recipes
|- Mains
| |- recipe1.md
| |- recipe2.md
|- Desserts
|- recipe3.md
|- recipe4.md
Run Code Online (Sandbox Code Playgroud)
如何将所有这些 Markdown 文件编译成一本 PDF 书?
我需要每个食谱占据一个单独的页面,标题部分(章节)由找到食谱的文件夹定义。我还想要一个包含每个食谱名称的目录,它在哪个页面上以及它在哪个章节中。
我可以使用 pandoc 和 LaTeX 来做到这一点吗?或者也许是一个命令行程序来构建维基?
我正在尝试使用 Pandoc 将 HTML 文件转换为 Markdown,但我很难找到正确的选项。
我想将整个 HTML 文件转换为最简单的 Markdown。也就是说,<div>
大括号中没有标签和 CSS 样式。但是,当我通过调用将以下 HTML 输入到 pandoc 时pandoc -f html -t markdown reduced.html -o res.md
:
<div class="section-content">
<div class="section-inner sectionLayout--insetColumn">
<h3 name="2ee9" id="2ee9" class="graf graf--h3 graf--leading graf--title">Post Title</h3>
<p name="021f" id="021f" class="graf graf--p graf-after--h3">Preamble <a href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" data-href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" class="markup--anchor markup--p-anchor" rel="noopener" target="_blank">link</a> and conclusion.</p>
</div>
Run Code Online (Sandbox Code Playgroud)
我得到以下 Markdown 输出,其中包含我想忽略的所有内容:
<div class="section-content">
<div class="section-inner sectionLayout--insetColumn">
### Post Title {#2ee9 .graf .graf--h3 .graf--leading .graf--title name="2ee9"}
Preamble
[link](https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions){.markup--anchor
.markup--p-anchor} and conclusion.
</div>
</div> …
Run Code Online (Sandbox Code Playgroud)