我想只从我汤中最顶层的元素中提取文字; 但是,soup.text也提供了所有子元素的文本:
我有
import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>yes<b>no</b></html>')
print soup.text
Run Code Online (Sandbox Code Playgroud)
输出到此是yesno.我只想'是'.
实现这一目标的最佳方法是什么?
编辑:我也想yes在解析' <html><b>no</b>yes</html>' 时输出.
Ruby允许您为哈希定义默认值:
h=Hash.new(['alright'])
h['meh'] # => ["alright"]
Run Code Online (Sandbox Code Playgroud)
显示散列时会显示值的赋值,但修改后的默认值不会.在哪里'bad'?
h['good']=['fine','dandy']
h['bad'].push('unhappy')
h # => {"good"=>["fine", "dandy"]}
Run Code Online (Sandbox Code Playgroud)
'bad' 如果我们明确要求出现.
h['bad'] # => ["alright", "unhappy"]
Run Code Online (Sandbox Code Playgroud)
为什么在显示哈希时不会显示修改后的默认值?
我在Google Refine中有一些JSON - 完整版的http://mapit.mysociety.org/point/4326/0.1293497,51.5464828,但缩写为:
{1234: {'name': 'Barking', 'type': 'WMC'},
5678: {'name': 'England', 'type': 'EUR'} }
Run Code Online (Sandbox Code Playgroud)
我只想用(假定的唯一)类型提取对象的名称WMC.
在Google Refine中解析JSON没有帮助,这与数组有关,而不是说.
有什么建议我应该考虑解决这个问题吗?
编辑:我不知道初始密钥是什么:我相信它们是我无法提前预测的唯一标识符.