将SO数据转储从HTML转换回Markdown的最简单方法是什么?

Nor*_*sey 6 c markdown lua data-dump

我刚接触到Stackoverflow 数据转储,我很失望地看到帖子的Body字段是HTML而不是Markdown.我怀疑原始数据库中有Markdown,因为如果我尝试编辑答案,那就是我所看到的.

我想从一大堆答案中恢复Markdown.我将使用命令行工具或某种Lua或C库以批处理模式处理数百个条目,因此像wmd Markdown编辑器这样的交互式工具不适合.人们可以说有 哪些工具可以帮助我从Stackoverflow数据转储中恢复Markdown吗?


(相关问题,不是重复:将HTML转换回wmd中的Markdown.)

Sam*_*son 5

Markdownify将HTML转换为Markdown.

另请参阅:从SO数据转储中恢复 MetaSO/Can Markdown?