Zah*_*Hnn 0 html xpath spreadsheet google-docs
我在 Google 文档中使用 Xpath 来获取里面的文本<div>
。我想将其中的文本保存在<div id="job_description">
Google 文档电子表格的一个单元格中,但每个<div>
单元格都显示在单独的单元格中。
<div id="job_description">
<div>
<strong>
Basic Purpose:
</strong>
<br></br>
</div>
<div>
Work closely with developers, product owners and Q…
<br></br>
</div>
<div>
The Test Analyst is accountable for the developmen…
<br></br>
</div>
<div>
<strong>
Duties and Responsibilities:
</strong>
</div>
<ul>
<li></li>
<li></li>
</ul>
<div>
<strong>
Requirements:
</strong>
<br></br>
</div>
<ul>
<li></li>
<li></li>
</ul>
</div>
Run Code Online (Sandbox Code Playgroud)
图片:http : //i.stack.imgur.com/K0mAY.png
这是我写的代码:
=IMPORTXML(E4,"//div[@id='job_description']")
Run Code Online (Sandbox Code Playgroud)
你能帮我把所有的文本(包括<div>
<ul>
......)放在<div id="job_description">
一个单元格中吗?
使用 JOIN 是一个好的开始,但您可以将其设为单个操作。
你没有显示你正在导入的页面的 URL,所以我只能给你一个另一个页面的例子。例如,如果您要导入 www.w3.org 并查找div
where @class='event closed expand_block'
,请使用
=JOIN(CHAR(10),IMPORTXML("http://www.w3.org/","//div[@class='event closed expand_block']//text()"))
Run Code Online (Sandbox Code Playgroud)
请注意,我还修改了 XPath 表达式://text()
确保仅检索后代文本节点,即所有文本。
编辑:回应您的评论:
我可以知道 CHAR(10) 指的是什么吗?
是的当然。CHAR
返回一个字符并接受一个数字作为输入。在 的情况下CHAR(10)
,返回一个换行符(我假设是因为
)。
在公式中,CHAR(10)
用作 的第一个参数JOIN
,它是要连接的对象的分隔符。