我在Python中使用我的代码处理了以下文本:
<td>
<a href="http://www.linktosomewhere.net" title="title here">some link</a>
<br />
some data 1<br />
some data 2<br />
some data 3</td>
Run Code Online (Sandbox Code Playgroud)
你能建议我如何从内部提取数据<td>吗?我的想法是将其放在CSV文件中,格式如下:some link, some data 1, some data 2, some data 3.
我希望如果没有正则表达式,它可能很难,但我真的仍然在努力对抗正则表达式.
我以下列方式或多或少地使用了我的代码:
tabulka = subpage.find("table")
for row in tabulka.findAll('tr'):
col = row.findAll('td')
print col[0]
Run Code Online (Sandbox Code Playgroud)
理想的情况是让每个td在一些数组中竞争.上面的Html是python的结果.
在 linux 下编译时,我使用标志 -j16,因为我有 16 个内核。我只是想知道使用诸如 -j32 之类的东西是否有意义。实际上,这是一个关于处理器时间调度的问题,以及是否可以通过这种方式对特定进程施加比其他任何方法更大的压力(假设我想用 -j16 并行编译每个进程,如果一个是 -j32 呢?) . 我认为这没有多大意义,但我不确定,因为不知道内核如何解决这些问题。
亲切的问候,
你能否就如何在Electron中使用FORMs或任何其他有效方式实现CRUD或DB(PouchDB)修改给我一些建议?
关键是我希望整个应用程序表现为桌面工具,它似乎可以在Electron中使用.但是我无法确定最好的方法,特别是如果我想添加一些不错的眼睛糖果技巧,以使UX尽可能顺利.
我尝试使用Python从Jira获取链接的问题.这似乎是棘手的,因为我得到的特定问题中的链接问题的数量是正确的,但链接的问题不是我期望的(与Jira Web界面非常相似).它们似乎是一些其他问题,甚至来自不同的项目.
我的目的是为每个有问题的问题获取所有相关问题,并检查链接问题是否具有特定状态.
这是我做的:
results = jira.search_issues('here query')
for issueId in results:
issue = jira.issue(issueId)
if (issue.fields.issuelinks):
for issueLinked in issue.fields.issuelinks:
if(jira.issue(issueLinked).fields.status != "Done" and jira.issue(issueLinked).fields.status != "Closed"):
print("id: ", jira.issue(issueLinked).id)
print("key: ", jira.issue(issueLinked).key)
print("status: ", jira.issue(issueLinked).fields.status)
print("summary: ", jira.issue(issueLinked).fields.summary)
Run Code Online (Sandbox Code Playgroud)
你是否遇到过类似的问题?
我正在寻找一条建议,因为我是python的新手.
让我们假设我有多个类似于以下数据块的数据块:
<td>
<a href="address.com" title=title">some title</a>
<br />
aaa<br />
bbb<br />
ccc</td>
有时br的数量不同,并且对于所有块都不是恒定的.
我的目的是从td块内部提取数据到文件,但我卡在这里.
这是正则表达式最好的方法吗?
先感谢您.