Sea*_*123 5 html markdown css pandoc
我正在尝试使用 Pandoc 将 HTML 文件转换为 Markdown,但我很难找到正确的选项。
我想将整个 HTML 文件转换为最简单的 Markdown。也就是说,<div>大括号中没有标签和 CSS 样式。但是,当我通过调用将以下 HTML 输入到 pandoc 时pandoc -f html -t markdown reduced.html -o res.md:
<div class="section-content">
<div class="section-inner sectionLayout--insetColumn">
<h3 name="2ee9" id="2ee9" class="graf graf--h3 graf--leading graf--title">Post Title</h3>
<p name="021f" id="021f" class="graf graf--p graf-after--h3">Preamble <a href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" data-href="https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions" class="markup--anchor markup--p-anchor" rel="noopener" target="_blank">link</a> and conclusion.</p>
</div>
Run Code Online (Sandbox Code Playgroud)
我得到以下 Markdown 输出,其中包含我想忽略的所有内容:
<div class="section-content">
<div class="section-inner sectionLayout--insetColumn">
### Post Title {#2ee9 .graf .graf--h3 .graf--leading .graf--title name="2ee9"}
Preamble
[link](https://cogsci.stackexchange.com/users/4397/seanny123?tab=questions){.markup--anchor
.markup--p-anchor} and conclusion.
</div>
</div>
Run Code Online (Sandbox Code Playgroud)
我尝试阅读 Pandoc Markdown 文档,但找不到任何关于我应该使用哪些参数的指示。
Sea*_*123 10
如果你使用pandoc -f html -t markdown_github-raw_html reduced.html -o res.md它可以解决问题。
markdown_github 减少输出集以忽略 CSS
-raw_html删除raw_html扩展,修复链接
| 归档时间: |
|
| 查看次数: |
1583 次 |
| 最近记录: |