<div> 中的 <div> 标签使用 importXML Xpath 查询,在 Google 电子表格中

Zah*_*Hnn 0 html xpath spreadsheet google-docs

我在 Google 文档中使用 Xpath 来获取里面的文本<div>。我想将其中的文本保存在<div id="job_description">Google 文档电子表格的一个单元格中,但每个<div>单元格都显示在单独的单元格中。

<div id="job_description">
    <div>
        <strong>
            Basic Purpose:
        </strong>
        <br></br>
    </div>
    <div>
        Work closely with developers, product owners and Q…
        <br></br>
    </div>
    <div>
        The Test Analyst is accountable for the developmen…
        <br></br>
    </div>
    <div>
        <strong>
            Duties and Responsibilities:
        </strong>
    </div>
    <ul>
        <li></li>
        <li></li>
    </ul>
    <div>
        <strong>
            Requirements:
        </strong>
        <br></br>
    </div>
    <ul>
        <li></li>
        <li></li>
    </ul>
</div>
Run Code Online (Sandbox Code Playgroud)

图片:http : //i.stack.imgur.com/K0mAY.png

这是我写的代码:

=IMPORTXML(E4,"//div[@id='job_description']")
Run Code Online (Sandbox Code Playgroud)

你能帮我把所有的文本(包括<div> <ul>......)放在<div id="job_description">一个单元格中吗?

Mat*_*ler 5

使用 JOIN 是一个好的开始,但您可以将其设为单个操作。

你没有显示你正在导入的页面的 URL,所以我只能给你一个另一个页面的例子。例如,如果您要导入 www.w3.org 并查找divwhere @class='event closed expand_block',请使用

=JOIN(CHAR(10),IMPORTXML("http://www.w3.org/","//div[@class='event closed expand_block']//text()"))
Run Code Online (Sandbox Code Playgroud)

请注意,我还修改了 XPath 表达式://text()确保仅检索后代文本节点,即所有文本。


编辑:回应您的评论:

我可以知道 CHAR(10) 指的是什么吗?

是的当然。CHAR返回一个字符并接受一个数字作为输入。在 的情况下CHAR(10),返回一个换行符(我假设是因为&#10;)。

在公式中,CHAR(10)用作 的第一个参数JOIN,它是要连接的对象的分隔符