相关疑难解决方法(0)

如何使用Nokogiri精美打印HTML?

我在Ruby中编写了一个Web爬虫,我正在使用它Nokogiri::HTML来解析页面.我需要打印页面,在IRB中乱搞时我注意到了一种pretty_print方法.然而,它需要一个参数,我无法弄清楚它想要什么.

我的抓取工具正在缓存网页的HTML并将其写入本地计算机上的文件.我想"漂亮地打印"HTML,以便它在我这样做时看起来很好并且格式正确.

html ruby pretty-print nokogiri

23
推荐指数
3
解决办法
3万
查看次数

用Nokogiri清理HTML(而不是Tidy)

tidy宝石不再维护,并有多个内存泄漏问题.

有人建议使用Nokogiri.

我目前正在使用以下方法清理HTML:

Nokogiri::HTML::DocumentFragment.parse(html).to_html

我有两个问题:

  • Nokogiri删除了 DOCTYPE

  • 有没有一种简单的方法可以强制清理的HTML有一个htmlbody标签?

ruby tidy nokogiri

8
推荐指数
1
解决办法
4029
查看次数

Markdown to Markdown的模板语言

我正在寻找一个简单的模板引擎,它将YAML剪切为上下文,并且非常适合阅读Markdown以及一些标记来生成Markdown.我尝试过Jekyll的液体,它起作用,除了在Markdown中非常重要的空白.

例如,使用此输入...

---
samples:
- name: one
  samplecode: |
    function sample() {
      return 1;
    }
- name: two
  samplecode: |
    function sample() {
      return 2;
    }
---

{% for s in page.samples %}
- {{s.name}}

        {{s.samplecode}}

{% endfor %}
Run Code Online (Sandbox Code Playgroud)

输出是:

- one

        function sample() {
  return 1;
}

- two

        function sample() {
  return 2;
}
Run Code Online (Sandbox Code Playgroud)

而不是以下实际上与Pandoc一起使用的:

- one

        function sample() {
          return 1;
        }

- two

        function sample() {
          return 2;
        }
Run Code Online (Sandbox Code Playgroud)

这实际上已经为Jekyll讨论过.

所以我的问题是:有没有适合我需求的简单模板引擎?

markdown yaml template-engine pandoc

1
推荐指数
1
解决办法
1417
查看次数

标签 统计

nokogiri ×2

ruby ×2

html ×1

markdown ×1

pandoc ×1

pretty-print ×1

template-engine ×1

tidy ×1

yaml ×1