小编Cpt*_*emo的帖子

使用lxml解析大型XML

我想让我的脚本正常工作.到目前为止,它没有设法输出任何东西.

这是我的test.xml

<mediawiki xmlns="http://www.mediawiki.org/xml/export-0.8/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.mediawiki.org/xml/export-0.8/ http://www.mediawiki.org/xml/export-0.8.xsd" version="0.8" xml:lang="it">
<page>
    <title>MediaWiki:Category</title>
    <ns>0</ns>
    <id>2</id>
    <revision>
      <id>11248</id>
      <timestamp>2003-12-31T13:47:54Z</timestamp>
      <contributor>
        <username>Frieda</username>
        <id>0</id>
      </contributor>
      <minor />
      <text xml:space="preserve">categoria</text>
      <sha1>0acykl71lto9v65yve23lmjgia1h6sz</sha1>
      <model>wikitext</model>
      <format>text/x-wiki</format>
    </revision>
  </page>
</mediawiki>
Run Code Online (Sandbox Code Playgroud)

这是我的代码

from lxml import etree

def fast_iter(context, func):
    # fast_iter is useful if you need to free memory while iterating through a
    # very large XML file.
    #
    # http://www.ibm.com/developerworks/xml/library/x-hiperfparse/
    # Author: Liza Daly
    for event, elem in context:
        func(elem)
        elem.clear()
        while elem.getprevious() is not None:
            del elem.getparent()[0]
    del context …
Run Code Online (Sandbox Code Playgroud)

python xml lxml

1
推荐指数
1
解决办法
1116
查看次数

SPARQL:选择所有类别资源主题的属性

我有这个SPARQL查询来选择所有属于维基百科类别的资源National_parks_in_California:

PREFIX dcterms: <http://purl.org/dc/terms/>

SELECT * WHERE {
  ?park dcterms:subject dbc:National_parks_in_California .
}
Run Code Online (Sandbox Code Playgroud)

返回

park
http://dbpedia.org/resource/Death_Valley_National_Park
http://dbpedia.org/resource/Yosemite_National_Park
http://dbpedia.org/resource/Channel_Islands_National_Park
http://dbpedia.org/resource/Kings_Canyon_National_Park
http://dbpedia.org/resource/Lassen_Volcanic_National_Park
http://dbpedia.org/resource/Redwood_National_and_State_Parks
http://dbpedia.org/resource/Joshua_Tree_National_Park
http://dbpedia.org/resource/Pinnacles_National_Park
http://dbpedia.org/resource/Sequoia_National_Park
Run Code Online (Sandbox Code Playgroud)

是否可以构建一个查询以及dbpedia资源页面foaf:homepage以及每个资源的返回?

我写

PREFIX dcterms: <http://purl.org/dc/terms/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>

SELECT * WHERE {
  ?park dcterms:subject dbc:National_parks_in_California .
  ?webpage foaf:homepage ?park .
}
Run Code Online (Sandbox Code Playgroud)

但它返回零结果.

sparql dbpedia

1
推荐指数
1
解决办法
404
查看次数

生成无循环的随机数

我试图尽可能多地减少一个函数的执行时间,该函数对伯努利序列序列的输出求和.

这是我工作但速度慢的方法:

set.seed(28100)
sim <- data.frame(result = rep(NA, 10))
for (i in 1:nrow(sim)) {
  sim$result[i] <- sum(rbinom(1200, size = 1, prob = 0.2))
}
sim
# result
# 1     268
# 2     230
# 3     223
# 4     242
# 5     224
# 6     218
# 7     237
# 8     254
# 9     227
# 10    247
Run Code Online (Sandbox Code Playgroud)

如果没有for循环,我怎么能得到相同的结果?

我试过这个......

set.seed(28100)
sim <- data.frame(result = rep(sum(rbinom(1200, size = 1, prob = 0.2)), 10))
sim
# result
# 1     269
# 2 …
Run Code Online (Sandbox Code Playgroud)

random performance loops r

1
推荐指数
1
解决办法
112
查看次数

如何用CSS隐藏<dl>项?

我有一个由Wordpress插件生成的列表.我想简单地删除列表的第一行,即元素和CSS.

这是我的HTML:

<dl>
 <dt class="coffee">Coffee</dt>
  <dd>Black hot drink</dd>
 <dt class="milk">Milk</dt>
  <dd>White cold drink</dd>
</dl> 
Run Code Online (Sandbox Code Playgroud)

我试过display:none但它只适用于<dd>.

html css

0
推荐指数
1
解决办法
1906
查看次数

R:从循环内设置循环索引

我想设置一个从 1 到 10 运行的循环。然后,我想在循环内更改索引,以便跳过迭代 6 和 7,并通过迭代 8、9 和 10 完成循环。

for (i in 1:10) {
  print(i) 
  if (i == 5) {
    i <- 8
    print(i)
  }
}
[1] 1
[1] 2
[1] 3
[1] 4
[1] 5
[1] 5
[1] 8
[1] 6
[1] 7
[1] 8
[1] 9
[1] 10
Run Code Online (Sandbox Code Playgroud)

显然,i在我的行1 <- 8被函数设置for为 6 之后。有什么办法可以防止这种情况吗?

loops r

0
推荐指数
1
解决办法
2136
查看次数

标签 统计

loops ×2

r ×2

css ×1

dbpedia ×1

html ×1

lxml ×1

performance ×1

python ×1

random ×1

sparql ×1

xml ×1