标签: pandoc

使用 pandoc for html/pdf/docx 在 markdown 中正确调整 PNG 图像的大小

我正在尝试使用带有 pandoc 的 markdown 将单个文档转换为 html、pdf 和 docx。这是一个非常简单的文档，只包含无数学运算的文本和一些图像。图像为 PNG 格式。我在降价源中包含了一个使用此图像的图像：

<div style="float:center" markdown="1">

![my caption](./figures/myimage.png)

</div>

Run Code Online (Sandbox Code Playgroud)

并将其编译为：

# html
pandoc myarticle.md -c mystyle.css -o myarticle.html
# pdf
pandoc myarticle.md -V geometry:margin=1in -o myarticle.pdf
# docx
pandoc myarticle.md -o myarticle.docx

Run Code Online (Sandbox Code Playgroud)

我注意到一些具有相同尺寸的PNG 图像在 HTML 和 PDF 格式中的大小不同。一个 250x256 像素、低分辨率 (72 像素/英寸) 的 PNG 将在 PDF 中大致显示为页面上的正确尺寸，并在 html 中以合理的尺寸显示，但具有相同尺寸 (250x256 像素) 但高分辨率（300 像素/英寸）在 PDF 输出的页面上被调整为很小。我想保留一组我指定大小的 PNG 图像，并让它们以 HTML/PDF/DOCX 格式显示在该大小。

我愿意放弃自动 docx 支持（或之后处理大量手动格式）只是为了拥有 PDF/HTML。

如何告诉 pandoc 不要为 PDF 或图像调整 PNG 的大小，并让它们出现在正确的图像中？谢谢。

html png pdf markdown pandoc

37
推荐指数

1
解决办法

3万
查看次数

在 pandoc 生成的 PDF 中让章节从新页面开始

%Title
%Author

#Header 1

Lots of words.

#Header 2

More words.

##Level 2 header

Run Code Online (Sandbox Code Playgroud)

上面的文字可以转成EPUB文件给电子阅读器pandoc -o output.epub input.mkd，可以转成PDF pandoc -o output.pdf input.mkd。后者需要安装乳胶引擎，这可能与回答问题有关。

使用 EPUB，每个 1 级标题都会自动设置在新页面的顶部（较小的标题不是）。对于 PDF，情况并非如此——我不希望它是默认的，因为这与降价的主要目标背道而驰。但是，我无法找到启用此行为的 pandoc 选项。

有谁知道使用 pandoc 启用此行为的方法？编辑配置文件将是一个可以接受的解决方案，但如果语法是基于乳胶的，我会很感激它的解释（配置文件中的含义，而不是对乳胶的全面解释！）。

pandoc 的--chapters选项似乎应该做我想做的……但它

使章节只出现在奇数页上，根据需要插入空白页（有趣，但不是我想要的——我想把它打印在 A4 纸上，它不会以书本的方式布局，所以这里的任何美学积极因素都被浪费的纸张所抵消）
Chapter x在实际标题之前插入，这会导致一些荒谬的东西，例如：

第1章

序幕

如果可以驯服该--chapters选项，那将是一个合适的答案。

pdf latex epub pandoc

20
推荐指数

2
解决办法

2万
查看次数

使用 Pandoc 使用自定义序言将 Markdown 转换为 LaTeX

我知道我可以使用-Hor--include-in-header命令在生成的输出中包含自定义序言。现在的问题是Pandoc包含了我的序言，但在它前面放了另一个序言：

\documentclass{article}
\usepackage{amssymb,amsmath}
\usepackage{ifxetex,ifluatex}
\ifxetex
  \usepackage{fontspec,xltxtra,xunicode}
  \defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
\else
  \ifluatex
    \usepackage{fontspec}
    \defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
  \else
    \usepackage[utf8]{inputenc}
  \fi
\fi
\ifxetex
  \usepackage[setpagesize=false, % page size defined by xetex
              unicode=false, % unicode breaks when used with xetex
              xetex]{hyperref}
\else
  \usepackage[unicode=true]{hyperref}
\fi
\hypersetup{breaklinks=true, pdfborder={0 0 0}}
\setlength{\parindent}{0pt}
\setlength{\parskip}{6pt plus 2pt minus 1pt}
\setlength{\emergencystretch}{3em}  % prevent overfull lines
\setcounter{secnumdepth}{0}

[... my preamble ...]

Run Code Online (Sandbox Code Playgroud)

我知道这是default.latexPandoc 从其templates文件夹加载的默认 LaTeX 序言 ( ) 。当我使用--include-after-bodywith时也会发生同样的事情\end{document}。

这是我正在使用的命令：

pandoc -o output.tex …

Run Code Online (Sandbox Code Playgroud)

latex conversion pandoc

16
推荐指数

1
解决办法

2万
查看次数

降价的字数统计？

有没有办法通过命令行在 Markdown（或者更好，Pandoc Markdown）中获取自然语言单词的字数？可能只是wc用来得到一个非常粗略的估计，但wc很幼稚，并将任何被空白包围的东西都算作一个词。这包括诸如标题格式、项目符号和链接中的 URL 之类的内容。

理想的做法是删除所有降价格式（如果可能，包括 Pandoc 引用），然后将其传递给wc，但我找不到这样做的方法，因为pandoc纯文本输出格式仍然包含大量降价造型。

linux markdown word-count pandoc

7
推荐指数

1
解决办法

3559
查看次数

使用 Pandoc 从带有文字表情符号字符的 Markdown 文件渲染 PDF

我想转换降价文本，如：

This is a smile

Run Code Online (Sandbox Code Playgroud)

到带有表情符号的 PDF。需要明确的是，我希望能够在源文本中插入表情符号字符本身，而不是像:smile:.

我怎样才能用 Pandoc 做到这一点？

markdown pandoc

7
推荐指数

2
解决办法

2355
查看次数

为什么用 Pandoc 创建的 RTF 文件会以纯文本形式打开？

我正在试验Pandoc，特别是降价到 RTF 功能。当我运行转换器时，生成的 RTF 在 Word 和 OpenOffice 中以纯文本形式打开（文本看起来像 RTF，但不被视为 RTF）。转换为 HTML 工作正常。

这是我使用的命令：

pandoc -f markdown -t rtf -o sample.rtf sample.txt

Run Code Online (Sandbox Code Playgroud)

这是我使用的简短示例降价：

# markdown example

- uli1

_em_

__strong__

Run Code Online (Sandbox Code Playgroud)

创建的文件内容的片段：

{\pard \ql \f0 \sa180 \li0 \fi0 \b \fs36 markdown example\par}

Run Code Online (Sandbox Code Playgroud)

在 Vista 32 位上运行，使用 Pandoc 1.6（来自http://code.google.com/p/pandoc/downloads/list）。

有谁知道问题可能是什么？

word-processing markdown rtf text-formatting pandoc

6
推荐指数

1
解决办法

3052
查看次数

使用 pandoc 生成带有 GitHub 降价链接的目录

如何使用pandoc生成带有 GitHub 降价链接的目录？

我试过pandoc -f markdown_github --toc -s -S README.md -o new.md 它确实创建了一个目录，但它没有指向部分的链接。

我正在尝试生成一个目录，例如：

在此处输入图片说明

在 Windows 机器上。

windows table-of-contents github pandoc

6
推荐指数

1
解决办法

2472
查看次数

使用 Pandoc 从 Markdown 转换为带引用的 Markdown / “无打印形式的引用”是什么意思？

我想编写一个带有参考文献@ref（和 BibTeX 数据库）的 Markdown 文件。发送文件时，应将其转换为包含渲染引用的独立 Markdown 文件。呈现的参考键不应是数字，而应是字母数字。

最小的例子：

最小.md:

@PTDL2008

Run Code Online (Sandbox Code Playgroud)

最小围兜：

@article{PTDL2008,
  title                    = {{Service-Oriented Computing: State of the Art and Research Challenges}},
  author                   = {Michael P. Papazoglou and Paolo Traverso and Schahram Dustdar and Frank Leymann},
  journal                  = {International Journal of Cooperative Information Systems (IJCIS)},
  year                     = {2008},
  month                    = {June},
  number                   = {2},
  pages                    = {233--255},
  volume                   = {17},
  doi                      = {10.1109/MC.2007.400}
}

Run Code Online (Sandbox Code Playgroud)

获取DIN 1505-2（字母数字，德语）并将其存储在同一目录中。

命令行调用：

pandoc minimal.md -o minimal-new.md --atx-headers --bibliography="minimal.bib" --csl=din-1505-2-alphanumeric.csl

Run Code Online (Sandbox Code Playgroud)

结果输出为 …

6
推荐指数

2
解决办法

2144
查看次数

从多个 Markdown 文件编译 PDF 书

我有一个这样的文件夹结构，根据主题在目录中包含配方 .md 文件：

Recipes
    |- Mains
    |   |- recipe1.md
    |   |- recipe2.md
    |- Desserts
        |- recipe3.md
        |- recipe4.md

Run Code Online (Sandbox Code Playgroud)

如何将所有这些 Markdown 文件编译成一本 PDF 书？

我需要每个食谱占据一个单独的页面，标题部分（章节）由找到食谱的文件夹定义。我还想要一个包含每个食谱名称的目录，它在哪个页面上以及它在哪个章节中。

我可以使用 pandoc 和 LaTeX 来做到这一点吗？或者也许是一个命令行程序来构建维基？

pdf bash markdown pandoc

6
推荐指数

1
解决办法

3389
查看次数

使 pandoc 忽略 css 样式类

我正在尝试使用 Pandoc 将 HTML 文件转换为 Markdown，但我很难找到正确的选项。

我想将整个 HTML 文件转换为最简单的 Markdown。也就是说，<div>大括号中没有标签和 CSS 样式。但是，当我通过调用将以下 HTML 输入到 pandoc 时pandoc -f html -t markdown reduced.html -o res.md：

<div class="section-content">
<div class="section-inner sectionLayout--insetColumn">
    <h3 name="2ee9" id="2ee9" class="graf graf--h3 graf--leading graf--title">Post Title</h3>
    <p name="021f" id="021f" class="graf graf--p graf-after--h3">Preamble <a href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" data-href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" class="markup--anchor markup--p-anchor" rel="noopener" target="_blank">link</a> and conclusion.</p>
</div>

Run Code Online (Sandbox Code Playgroud)

我得到以下 Markdown 输出，其中包含我想忽略的所有内容：

<div class="section-content">

<div class="section-inner sectionLayout--insetColumn">

### Post Title {#2ee9 .graf .graf--h3 .graf--leading .graf--title name="2ee9"}

Preamble
[link](https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions){.markup--anchor
.markup--p-anchor} and conclusion.

</div>

</div> …

Run Code Online (Sandbox Code Playgroud)

html markdown css pandoc

5
推荐指数

1
解决办法

1583
查看次数

标签统计

pdf ×3

html ×2

bash ×1

css ×1

epub ×1

png ×1

rtf ×1

table-of-contents ×1

text-formatting ×1

word-processing ×1

«
1
2
»