在 Ruby 中使用正则表达式提取两个标签之间的文本

Ryz*_*off 2 ruby regex

假设我有这个包含 html 标签的字符串:

\n\n
<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-K\xc3\xb6penick</a>\n
Run Code Online (Sandbox Code Playgroud)\n\n

如何在 ruby​​ 中使用正则表达式提取“ Berlin-Treptow-K\xc3\xb6penick ”的文本?

\n\n

谢谢!:)

\n

spi*_*ann 5

您可以使用:

\n
html = \'<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-K\xc3\xb6penick</a>\'\n\nhtml[/>(.*)</, 1]\n#=> "Berlin-Treptow-K\xc3\xb6penick"\n
Run Code Online (Sandbox Code Playgroud)\n

当您的 HTML 部分更复杂时,我建议使用像Nokogiri这样的库:

\n
html = \'<a href="abgeordnete-1128-0----w8397.html" class="small_link">Berlin-Treptow-K\xc3\xb6penick</a>\'\n\nrequire \'nokogiri\'\n\nNokogiri::HTML(html).text\n#=> "Berlin-Treptow-K\xc3\xb6penick"\n         \n
Run Code Online (Sandbox Code Playgroud)\n