小编Bře*_*eťa的帖子

从 Google 表格中的 HTML 文本中提取 href 属性

我的 Google 电子表格中有大约 3000 行,每一行都包含有关我们网站上一篇文章的数据。在一列(例如 A:A)中存储了 HTML 格式的文本。我需要href=""从此列中提取属性内的所有 URL ,然后再使用它们。(它可以是数组或文本字符串,在 B 列中用逗号或空格分隔)

我尝试使用REGEXTRACT公式,但它只给了我第一个结果。然后我尝试使用,REGEXREPLACE但我无法编写正确的表达式来仅获取 URL 链接。

我知道使用正则表达式从 HTML 获取任何内容并不是正确的方法。还有另一种方法可以从一个单元格中的 HTML 文本中提取这些值吗?

示例数据链接:Google 电子表格

提前谢谢你!我是这里的新手,也是脚本、解析等方面的新手。

html html-parsing google-sheets google-apps-script

4
推荐指数
1
解决办法
1862
查看次数