小编Mik*_*ler的帖子

无法使用setup.py安装numpy

我正在使用Python 2.7并且我正在尝试使用NLTK语音标记器,因为我没有安装numpy,因此会生成此错误:

> Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Library/Python/2.7/site-packages/nltk/tag/__init__.py", line 99, in pos_tag
    tagger = load(_POS_TAGGER)
  File "/Library/Python/2.7/site-packages/nltk/data.py", line 605, in load
    resource_val = pickle.load(_open(resource_url))
ImportError: No module named numpy.core.multiarray

Run Code Online (Sandbox Code Playgroud)

所以我从这里下载numpy 1.7.0,在我的下载文件夹中做了一个cd并做了python setup.py install并得到了这个错误:

Running from numpy source directory.
non-existing path in 'numpy/distutils': 'site.cfg'
F2PY Version 2
blas_opt_info:
  FOUND:
    extra_link_args = ['-Wl,-framework', '-Wl,Accelerate']
    define_macros = [('NO_ATLAS_INFO', 3)]
    extra_compile_args = ['-msse3', '-I/System/Library/Frameworks/vecLib.framework/Headers']

lapack_opt_info:
  FOUND:
    extra_link_args = ['-Wl,-framework', '-Wl,Accelerate']
    define_macros = …

Run Code Online (Sandbox Code Playgroud)

python numpy nltk python-2.7

Mik*_*ler

2013 05-20

6
推荐指数

2
解决办法

1万
查看次数

将文件中的句子转换为列表中的单词标记

我正在使用 python 将文本文件中句子中的单词转换为列表中的单个标记，以计算单词频率。我无法将不同的句子转换为单个列表。这是我所做的：

f = open('music.txt', 'r')
sent = [word.lower().split() for word in f]

Run Code Online (Sandbox Code Playgroud)

这给了我以下列表：

[['party', 'rock', 'is', 'in', 'the', 'house', 'tonight'],
 ['everybody', 'just', 'have', 'a', 'good', 'time'],...]

Run Code Online (Sandbox Code Playgroud)

由于文件中的句子在单独的行中，因此它返回此列表列表，并且 defaultdict 无法识别要计数的单个标记。

它尝试了以下列表理解来隔离不同列表中的标记并将它们返回到单个列表，但它返回一个空列表：

sent2 = [[w for w in word] for word in sent]

Run Code Online (Sandbox Code Playgroud)

有没有办法使用列表理解来做到这一点？或者也许是另一种更简单的方法？

python list-comprehension file

Mik*_*ler

2011 11-29

3
推荐指数

1
解决办法

3664
查看次数

如何使用Beautiful Soup拉没有属性的<p>标签？

说一个网页包含以下内容：

<p style="display: none;"><input id="ak_js" name="ak_js" type="hidden" value="68"/></p>

<p><b>Lack of sales.. ANY sales.</b></p>

Run Code Online (Sandbox Code Playgroud)

我正在尝试编写仅拉第二个标签的代码。基本上所有不包含属性的段落标签。我在下面尝试了以下两段代码，但它们没有给我想要的结果。

text = BeautifulSoup(requests.get(url).text)

for tag in text.find_all("p", attrs = False):
    .....

for tag in text.find_all(re.compile("^<p>$")):
    ....

Run Code Online (Sandbox Code Playgroud)

解决此问题的最佳方法是什么？

python beautifulsoup

Mik*_*ler

lucky-day

1
推荐指数

1
解决办法

448
查看次数

如何缩进文本文件中的整个文本字符串？

我有一本字典：

page_info = {'LISTS':['string 1', 'string 2']}

Run Code Online (Sandbox Code Playgroud)

我想打印到一个文本文件，其中“LISTS”一词作为标题，键的值出现在其下方，并向右缩进一个空格。

with codecs.open(stats_file, 'a', encoding="utf8") as file:
    file.write('LISTS:' + '\n')
    for tag in page_info['LISTS']:
        file.write('\t' + tag + '\n\n')

Run Code Online (Sandbox Code Playgroud)

这是文件的输出：