在 Ruby 中使用正则表达式提取两个标签之间的文本

Question

在 Ruby 中使用正则表达式提取两个标签之间的文本

假设我有这个包含 html 标签的字符串：

\n\n

<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-K\xc3\xb6penick</a>\n

Run Code Online (Sandbox Code Playgroud)\n\n

如何在 ruby 中使用正则表达式提取“ Berlin-Treptow-K\xc3\xb6penick ”的文本？

\n\n

谢谢！:)

\n

Answer 1

spi*_*ann 5

您可以使用：

\n

html = \'<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-K\xc3\xb6penick</a>\'\n\nhtml[/>(.*)</, 1]\n#=> "Berlin-Treptow-K\xc3\xb6penick"\n

Run Code Online (Sandbox Code Playgroud)\n

当您的 HTML 部分更复杂时，我建议使用像Nokogiri这样的库：

\n

html = \'<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-K\xc3\xb6penick</a>\'\n\nrequire \'nokogiri\'\n\nNokogiri::HTML(html).text\n#=> "Berlin-Treptow-K\xc3\xb6penick"\n         \n

Run Code Online (Sandbox Code Playgroud)\n

归档时间：	10 年，2 月前
查看次数：	2897 次
最近记录：	3 年，10 月前