当我遇到 html 中的注释时,如何停止使用 Beautifulsoup 提取 href 标签?

Shu*_*wal -7 html python beautifulsoup

    03420&nbsp;&nbsp;<a href="/kegg-bin/show_pathway?ban03420">Nucleotide excision repair</a><br>
    03430&nbsp;&nbsp;<a href="/kegg-bin/show_pathway?ban03430">Mismatch repair</a><br>
    03440&nbsp;&nbsp;<a href="/kegg-bin/show_pathway?ban03440">Homologous recombination</a><br>
      </ul>
    </ul>
    <!-- -->
    <b>Environmental Information Processing</b>
    <ul>
     Membrane transport
      <ul>
    02010&nbsp;&nbsp;<a href="/kegg-bin/show_pathway?ban02010">ABC transporters</a><br>
Run Code Online (Sandbox Code Playgroud)

我需要使用 python 从网页中提取路径代码(例如 03420、03430 等),这是我使用 Beautifulsoup 完成的。我想在环境信息处理之前停止,所以我正在寻找一些可以使用的不同标签。<!-- -->处于完美的位置,但我不知道如何在此时停止。有人可以告诉我是否/如何使用它来停止提取评论之前的代码。(我对 python 和 html 很陌生,直接跳到网络解析,所以请耐心等待。)

Fel*_*ani 5

HTMLXHTML、中XML<!--开始一个注释范围并-->结束它。它是一个注释,它不会影响浏览器上的结果,但会在响应上添加一些字节。

<!-- comment some text 
     and you can break lines.
     It is compatible for html, xhtml and xml.
-->
Run Code Online (Sandbox Code Playgroud)

在其他语言上,您还有其他注释语法,例如:

/* this is a comment for C, C++, C#, Java, Javascript, CSS, etc.
   you can break lines */

// this is a single line comment for C, C++, C#, Java, Javascript.. you can't break lines here
Run Code Online (Sandbox Code Playgroud)

如果您想在此链接上查看更多有关评论的信息。