小编Stu*_*Cat的帖子

递归Python的超时

我有一个脚本,可以递归地分析链接中的javascript,所以如果它找到了javascript,那么它会分析javascript,如果它正在分析的javascript包含更多的javascript,那么它会继续运行,等等.但是,我遇到过这种递归永远不会停止的问题,有没有办法为这个递归添加超时？

python recursion timeout

Stu*_*Cat

lucky-day

1
推荐指数

1
解决办法

792
查看次数

正则表达式Python,用于在所有空格中进行拆分

可能重复:
在python中的空白处拆分字符串

我有一个像这样的字符串:

['.text      0x1000       0xb51b       0xb600       6.259216    ']

Run Code Online (Sandbox Code Playgroud)

我想把它分成这个:

[.text, 0x1000, 0xb51b... etc]

Run Code Online (Sandbox Code Playgroud)

到目前为止,我已经尝试过:re.split("()",b)和re.split("[\ t ]",b)

但无济于事.我得到的东西是:

.['.text', ' ', '0x1000', ' ', '0xb51b', ' ', '0xb600', ' ', '6.259216', ' ', '']

Run Code Online (Sandbox Code Playgroud)

或者其他一些有更多空格的人.我知道我可以从字符串中删除空格,但我宁愿直接使用RE来首先拆分它们.

python regex

Stu*_*Cat

2017 05-23

1
推荐指数

1
解决办法

279
查看次数

用于存储所有已定义字符串的Java约定

什么是Java存储预定义字符串集的主要约定？现在我有一个包含我使用的所有字符串的类,但感觉就像有一个更好的方法来做到这一点.

这就是我在my_strings.java类中所做的事情

public final static String s1 = "test";
public final static String s2 = "test2";
...

Run Code Online (Sandbox Code Playgroud)

java convention

Stu*_*Cat

lucky-day

1
推荐指数

1
解决办法

291
查看次数

是否有更简洁的方法来查找字典中最高的5个值？

现在,我循环遍历整个字典五次并在每次迭代后保持最高值并删除条目.但这似乎是一种非常讨厌的方式来做我想做的事情.基本上我想获得我的字典的前5个最大值,并返回密钥,有没有更好的方法来做到这一点,而不是迭代它五次？

python dictionary

Stu*_*Cat

2014 02-26

1
推荐指数

1
解决办法

123
查看次数

如何从文本文档中查找常用短语

我有一个包含大量评论/句子的文本文件，我想以某种方式找到文档本身中重复的最常见短语。我试着用 NLTK 稍微摆弄一下，我发现了这个线程：如何从一系列文本条目中提取常见/重要的短语

然而，在尝试之后，我得到了如下奇怪的结果：

>>> finder.apply_freq_filter(3)
>>> finder.nbest(bigram_measures.pmi, 10)
[('m', 'e'), ('t', 's')]

Run Code Online (Sandbox Code Playgroud)

在另一个“这很有趣”这个短语很常见的文件中，我得到一个空列表 []。

我该怎么做呢？

这是我的完整代码：

import nltk
from nltk.collocations import *
bigram_measures = nltk.collocations.BigramAssocMeasures()
trigram_measures = nltk.collocations.TrigramAssocMeasures()

# change this to read in your data
finder = BigramCollocationFinder.from_words('MkXVM6ad9nI.txt')

# only bigrams that appear 3+ times
finder.apply_freq_filter(3)

# return the 10 n-grams with the highest PMI
print finder.nbest(bigram_measures.pmi, 10)

Run Code Online (Sandbox Code Playgroud)

python nltk

Stu*_*Cat

2017 05-23

1
推荐指数

1
解决办法

3066
查看次数

Selenium Python：如何根据“onclick”文本单击 <a> 标签

所以这个页面有几个

<a href="#" onclick="showpage('potato.php');">...
<a href="#" onclick="showpage('carrots.php');">...
<a href="#" onclick="showpage('chicken.php');">...
<a href="#" onclick="showpage('fish.php');">...

Run Code Online (Sandbox Code Playgroud)

这些标签。虽然我可以做一个 find_elements_by_xpath 然后选择我想要的那个，有没有办法具体说，我想点击土豆链接？

python selenium

Stu*_*Cat

lucky-day

1
推荐指数

1
解决办法

3345
查看次数

Python:如何为字符串传递一个参数而不是多个重复值？

而不是:

"my name is %s, and your name is %s" %(name, name)

Run Code Online (Sandbox Code Playgroud)

是否有可能

"my name is %s, and your name is %s" %(name)

Run Code Online (Sandbox Code Playgroud)

那将用名称变量填充%s？

python string

Stu*_*Cat

lucky-day

1
推荐指数

1
解决办法

50
查看次数

带有check_output的Python subprocess.call错误消息

所以我有:

result = subprocess.check_output(['wine',
                    os.getcwd()+'/static/sigcheck.exe',
                    '-a','-i','-q',
                    self.tmpfile.path()])

Run Code Online (Sandbox Code Playgroud)

但每当我运行这个我得到这个错误

CalledProcessError: Command '['wine', '/home/static/sigcheck.exe', '-a', '-i', '-q',     '/tmp/tmpxnsN5j']' returned non-zero exit status 1

Run Code Online (Sandbox Code Playgroud)

但如果我check_output改为call它工作正常:

Z:\tmp\tmpvOybcm:
    Verified:       Unsigned
    File date:      9:08 AM 10/24/2012
    Publisher:      Hardcore Computer
    Description:    Farthest Emitters Converter
    Product:        Farthest Emitters Converter
    Version:        3.2.0
    File version:   3.2.0
fixme:mscoree:StrongNameSignatureVerificationEx (L"Z:\\tmp\\tmpvOybcm", 1, 0x33ec13): stub
    Strong Name:    Unsigned
    Original Name:  n/a
    Internal Name:  Farthest Emitters Converter
    Copyright:      Hardcore Computer 2006
    Comments:       n/a

Run Code Online (Sandbox Code Playgroud)

有什么理由check_output不起作用？

python subprocess

Stu*_*Cat

2012 10-24

0
推荐指数

1
解决办法

5210
查看次数

导出font_path后Python word_cloud找不到font_path

我正在尝试使用：https : //github.com/amueller/word_cloud生成带有掩码的词云，但我在初始设置时遇到了一些问题。作者说，如果您不在 Ubuntu 中，则必须将 FONT_PATH 设置为字体的路径。我正在运行 Ubuntu，但我遇到了这个错误：

错误：

Traceback (most recent call last):
  File "test.py", line 11, in <module>
    wordcloud = WordCloud().generate(text)
  File "/usr/local/lib/python2.7/dist-packages/wordcloud/wordcloud.py", line 311, in generate
    self.fit_words(self.words_)
  File "/usr/local/lib/python2.7/dist-packages/wordcloud/wordcloud.py", line 179, in fit_words
    font = ImageFont.truetype(self.font_path, font_size)
  File "/usr/lib/python2.7/dist-packages/PIL/ImageFont.py", line 228, in truetype
    return FreeTypeFont(font, size, index, encoding)
  File "/usr/lib/python2.7/dist-packages/PIL/ImageFont.py", line 131, in __init__
    self.font = core.getfont(font, size, index, encoding)
IOError: cannot open resource

Run Code Online (Sandbox Code Playgroud)

所以我决定导出字体路径：

~/wordcloud$ echo $FONT_PATH
/usr/share/fonts/truetype/dejavu/DejaVuSans.ttf

Run Code Online (Sandbox Code Playgroud)

但我仍然遇到同样的错误。决定了，好吧，如果我将它添加到脚本中，那么：

from os import path
from …

Run Code Online (Sandbox Code Playgroud)

python word-cloud

Stu*_*Cat

lucky-day

0
推荐指数

1
解决办法

3522
查看次数

Python使用Selenium根据类型，值和类单击按钮

因此，这是html的样子：

<button type="submit" name="page" value="2" class="_btn _btng">Next ?</button>

<button type="submit" name="page" value="1" class="_btn">? Back</button>

Run Code Online (Sandbox Code Playgroud)

这就是我正在尝试的：

driver.find_element_by_xpath("//*[contains(text(), 'Next')]").click()

Run Code Online (Sandbox Code Playgroud)

无论出于何种原因，这实际上并不是单击按钮，只是向下移动到按钮所在的位置，而只是在那里等待。因此，也许在某个地方有另一个隐藏的按钮，我看不到代码在“单击”。不确定，所以我想我的问题真的出在哪里，有没有一种方法可以根据按钮的值，类型和类来搜索按钮？

python selenium

Stu*_*Cat

lucky-day

0
推荐指数

1
解决办法

2136
查看次数

标签统计

python ×9

selenium ×2

convention ×1

dictionary ×1

java ×1

nltk ×1

recursion ×1

regex ×1

string ×1

subprocess ×1

timeout ×1

word-cloud ×1

标签 统计

小编Stu_Cat的帖子

标签统计