标签: pandoc

使用 pandoc for html/pdf/docx 在 markdown 中正确调整 PNG 图像的大小

我正在尝试使用带有 pandoc 的 markdown 将单个文档转换为 html、pdf 和 docx。这是一个非常简单的文档,只包含无数学运算的文本和一些图像。图像为 PNG 格式。我在降价源中包含了一个使用此图像的图像:

<div style="float:center" markdown="1">

![my caption](./figures/myimage.png)

</div>
Run Code Online (Sandbox Code Playgroud)

并将其编译为:

# html
pandoc myarticle.md -c mystyle.css -o myarticle.html
# pdf
pandoc myarticle.md -V geometry:margin=1in -o myarticle.pdf
# docx
pandoc myarticle.md -o myarticle.docx
Run Code Online (Sandbox Code Playgroud)

我注意到一些具有相同尺寸的PNG 图像在 HTML 和 PDF 格式中的大小不同。一个 250x256 像素、低分辨率 (72 像素/英寸) 的 PNG 将在 PDF 中大致显示为页面上的正确尺寸,并在 html 中以合理的尺寸显示,但具有相同尺寸 (250x256 像素) 但高分辨率(300 像素/英寸)在 PDF 输出的页面上被调整为很小。我想保留一组我指定大小的 PNG 图像,并让它们以 HTML/PDF/DOCX 格式显示在该大小。

我愿意放弃自动 docx 支持(或之后处理大量手动格式)只是为了拥有 PDF/HTML。

如何告诉 pandoc 不要为 PDF 或图像调整 PNG 的大小,并让它们出现在正确的图像中?谢谢。

html png pdf markdown pandoc

37
推荐指数
1
解决办法
3万
查看次数

在 pandoc 生成的 PDF 中让章节从新页面开始

%Title
%Author

#Header 1

Lots of words.

#Header 2

More words.

##Level 2 header
Run Code Online (Sandbox Code Playgroud)

上面的文字可以转成EPUB文件给电子阅读器pandoc -o output.epub input.mkd,可以转成PDF pandoc -o output.pdf input.mkd。后者需要安装乳胶引擎,这可能与回答问题有关。

使用 EPUB,每个 1 级标题都会自动设置在新页面的顶部(较小的标题不是)。对于 PDF,情况并非如此——我不希望它是默认的,因为这与降价的主要目标背道而驰。但是,我无法找到启用此行为的 pandoc 选项。

有谁知道使用 pandoc 启用此行为的方法?编辑配置文件将是一个可以接受的解决方案,但如果语法是基于乳胶的,我会很感激它的解释(配置文件中的含义,而不是对乳胶的全面解释!)。

pandoc 的--chapters选项似乎应该做我想做的……但它

  • 使章节只出现在奇数页上,根据需要插入空白页(有趣,但不是我想要的——我想把它打印在 A4 纸上,它不会以书本的方式布局,所以这里的任何美学积极因素都被浪费的纸张所抵消)
  • Chapter x在实际标题之前插入,这会导致一些荒谬的东西,例如:

第1章

序幕

如果可以驯服该--chapters选项,那将是一个合适的答案。

pdf latex epub pandoc

20
推荐指数
2
解决办法
2万
查看次数

使用 Pandoc 使用自定义序言将 Markdown 转换为 LaTeX

我知道我可以使用-Hor--include-in-header命令在生成的输出中包含自定义序言。现在的问题是Pandoc包含了我的序言,但在它前面放了另一个序言:

\documentclass{article}
\usepackage{amssymb,amsmath}
\usepackage{ifxetex,ifluatex}
\ifxetex
  \usepackage{fontspec,xltxtra,xunicode}
  \defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
\else
  \ifluatex
    \usepackage{fontspec}
    \defaultfontfeatures{Mapping=tex-text,Scale=MatchLowercase}
  \else
    \usepackage[utf8]{inputenc}
  \fi
\fi
\ifxetex
  \usepackage[setpagesize=false, % page size defined by xetex
              unicode=false, % unicode breaks when used with xetex
              xetex]{hyperref}
\else
  \usepackage[unicode=true]{hyperref}
\fi
\hypersetup{breaklinks=true, pdfborder={0 0 0}}
\setlength{\parindent}{0pt}
\setlength{\parskip}{6pt plus 2pt minus 1pt}
\setlength{\emergencystretch}{3em}  % prevent overfull lines
\setcounter{secnumdepth}{0}

[... my preamble ...]
Run Code Online (Sandbox Code Playgroud)

我知道这是default.latexPandoc 从其templates文件夹加载的默认 LaTeX 序言 ( ) 。当我使用--include-after-bodywith时也会发生同样的事情\end{document}

这是我正在使用的命令:

pandoc -o output.tex …
Run Code Online (Sandbox Code Playgroud)

latex conversion pandoc

16
推荐指数
1
解决办法
2万
查看次数

降价的字数统计?

有没有办法通过命令行在 Markdown(或者更好,Pandoc Markdown)中获取自然语言单词的字数?可能只是wc用来得到一个非常粗略的估计,但wc很幼稚,并将任何被空白包围的东西都算作一个词。这包括诸如标题格式、项目符号和链接中的 URL 之类的内容。

理想的做法是删除所有降价格式(如果可能,包括 Pandoc 引用),然后将其传递给wc,但我找不到这样做的方法,因为pandoc纯文本输出格式仍然包含大量降价造型。

linux markdown word-count pandoc

7
推荐指数
1
解决办法
3559
查看次数

使用 Pandoc 从带有文字表情符号字符的 Markdown 文件渲染 PDF

我想转换降价文本,如:

This is a smile 
Run Code Online (Sandbox Code Playgroud)

到带有表情符号的 PDF。需要明确的是,我希望能够在源文本中插入表情符号字符本身,而不是像:smile:.

我怎样才能用 Pandoc 做到这一点?

markdown pandoc

7
推荐指数
2
解决办法
2355
查看次数

为什么用 Pandoc 创建的 RTF 文件会以纯文本形式打开?

我正在试验Pandoc,特别是降价到 RTF 功能。当我运行转换器时,生成的 RTF 在 Word 和 OpenOffice 中以纯文本形式打开(文本看起来像 RTF,但不被视为 RTF)。转换为 HTML 工作正常。

这是我使用的命令:

pandoc -f markdown -t rtf -o sample.rtf sample.txt
Run Code Online (Sandbox Code Playgroud)

这是我使用的简短示例降价:

# markdown example

- uli1

_em_

__strong__
Run Code Online (Sandbox Code Playgroud)

创建的文件内容的片段:

{\pard \ql \f0 \sa180 \li0 \fi0 \b \fs36 markdown example\par}
Run Code Online (Sandbox Code Playgroud)

在 Vista 32 位上运行,使用 Pandoc 1.6(来自http://code.google.com/p/pandoc/downloads/list)。

有谁知道问题可能是什么?

word-processing markdown rtf text-formatting pandoc

6
推荐指数
1
解决办法
3052
查看次数

使用 pandoc 生成带有 GitHub 降价链接的目录

如何使用pandoc生成带有 GitHub 降价链接的目录

我试过pandoc -f markdown_github --toc -s -S README.md -o new.md 它确实创建了一个目录,但它没有指向部分的链接。

我正在尝试生成一个目录,例如

在此处输入图片说明

在 Windows 机器上。

windows table-of-contents github pandoc

6
推荐指数
1
解决办法
2472
查看次数

使用 Pandoc 从 Markdown 转换为带引用的 Markdown / “无打印形式的引用”是什么意思?

我想编写一个带有参考文献@ref(和 BibTeX 数据库)的 Markdown 文件。发送文件时,应将其转换为包含渲染引用的独立 Markdown 文件。呈现的参考键不应是数字,而应是字母数字。

最小的例子:

最小.md:

@PTDL2008
Run Code Online (Sandbox Code Playgroud)

最小围兜:

@article{PTDL2008,
  title                    = {{Service-Oriented Computing: State of the Art and Research Challenges}},
  author                   = {Michael P. Papazoglou and Paolo Traverso and Schahram Dustdar and Frank Leymann},
  journal                  = {International Journal of Cooperative Information Systems (IJCIS)},
  year                     = {2008},
  month                    = {June},
  number                   = {2},
  pages                    = {233--255},
  volume                   = {17},
  doi                      = {10.1109/MC.2007.400}
}
Run Code Online (Sandbox Code Playgroud)

获取DIN 1505-2(字母数字,德语)并将其存储在同一目录中。

命令行调用:

pandoc minimal.md -o minimal-new.md --atx-headers --bibliography="minimal.bib" --csl=din-1505-2-alphanumeric.csl
Run Code Online (Sandbox Code Playgroud)

结果输出为 …

pandoc

6
推荐指数
2
解决办法
2144
查看次数

从多个 Markdown 文件编译 PDF 书

我有一个这样的文件夹结构,根据主题在目录中包含配方 .md 文件:

Recipes
    |- Mains
    |   |- recipe1.md
    |   |- recipe2.md
    |- Desserts
        |- recipe3.md
        |- recipe4.md
Run Code Online (Sandbox Code Playgroud)

如何将所有这些 Markdown 文件编译成一本 PDF 书?

我需要每个食谱占据一个单独的页面,标题部分(章节)由找到食谱的文件夹定义。我还想要一个包含每个食谱名称的目录,它在哪个页面上以及它在哪个章节中。

我可以使用 pandoc 和 LaTeX 来做到这一点吗?或者也许是一个命令行程序来构建维基?

pdf bash markdown pandoc

6
推荐指数
1
解决办法
3389
查看次数

使 pandoc 忽略 css 样式类

我正在尝试使用 Pandoc 将 HTML 文件转换为 Markdown,但我很难找到正确的选项。

我想将整个 HTML 文件转换为最简单的 Markdown。也就是说,<div>大括号中没有标签和 CSS 样式。但是,当我通过调用将以下 HTML 输入到 pandoc 时pandoc -f html -t markdown reduced.html -o res.md

<div class="section-content">
<div class="section-inner sectionLayout--insetColumn">
    <h3 name="2ee9" id="2ee9" class="graf graf--h3 graf--leading graf--title">Post Title</h3>
    <p name="021f" id="021f" class="graf graf--p graf-after--h3">Preamble <a href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" data-href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" class="markup--anchor markup--p-anchor" rel="noopener" target="_blank">link</a> and conclusion.</p>
</div>
Run Code Online (Sandbox Code Playgroud)

我得到以下 Markdown 输出,其中包含我想忽略的所有内容:

<div class="section-content">

<div class="section-inner sectionLayout--insetColumn">

### Post Title {#2ee9 .graf .graf--h3 .graf--leading .graf--title name="2ee9"}

Preamble
[link](https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions){.markup--anchor
.markup--p-anchor} and conclusion.

</div>

</div> …
Run Code Online (Sandbox Code Playgroud)

html markdown css pandoc

5
推荐指数
1
解决办法
1583
查看次数