我希望能够获取现有的HTML代码段并将其转换为markdown.为此我试过pandoc:
pandoc test.html -o test.md
Run Code Online (Sandbox Code Playgroud)
test.html看起来像这样:
Hello
<!-- more -->
and some more text
<h2>some heading</h2>
Run Code Online (Sandbox Code Playgroud)
结果如下:
Hello and some more text
some heading
------------
Run Code Online (Sandbox Code Playgroud)
因此,它不仅可以转换在降价时具有直接含义的标签.它还删除了我想要保留为HTML的iframe
标签(例如,HTML注释, 标签等).
特别是,我对命令行程序选项感兴趣.例如,也许有可以提供给pandoc的选项.
Jer*_*lim 20
经过一些搜索,我在表解析--parse-raw
的线程中读到了关于该选项的选项.
添加--parse-raw
选项似乎不会剥离非降价等效的HTML标记.
pandoc test.html -o test.md --parse-raw
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
7510 次 |
最近记录: |