小编the*_*dee的帖子

Windows 上的 Python 中的词云

我正在尝试在 Windows 上运行的 Python 中创建词云。我已经尝试过以下软件包,但它们似乎对我不起作用:

  • A Mueller 的 Wordcloud - Windows 安装程序似乎已损坏,我无法安装它。似乎在 Linux 和 Mac 操作系统上运行良好。我的要求是专门针对 Windows 的。
  • 我参考了这篇文章How to create a word cloud from a corpus in Python? 但同样的问题仍然存在,因为他们都使用 Wordcloud 包,而且它似乎没有安装在 Windows 上。
  • pywordcloud - 不知道如何工作。似乎找不到任何有关它的文档。任何帮助将不胜感激。
  • pytagcloud - 似乎挂起大量文本语料库。然而,我的感觉是我没有正确使用它。任何正确方向的帮助将不胜感激。

如果有人能指出我正确的方向,我将不胜感激。

python windows word-cloud pytagcloud

5
推荐指数
1
解决办法
2016
查看次数

Python中的re.sub()在替换字符串中的货币值时并不总是有效

我在Python中构建了一个"货币标记器",它标识所有货币表达式并用标记的字符串替换它们.

例如,
替换"I have $20 in my pocket"
"I have <Currency>$20</Currency> in my pocket"

其中一项任务要求我用标记字符串替换标识为Currency的字符串.我正在使用re.sub()这个.

除了"$ 4.4B"或"$ 4.4M"形式外,它适用于各种形式的字符串.

我尝试在我的python控制台中运行简单的示例,发现它re.sub()与具有混合美元模式的模式不一致.

例如,

>>> text = "I have #20 in my pocket"
>>> re.sub("#20", "$20", text)
'I have $20 in my pocket'
>>> text = "I have $20 in my pocket"
>>> re.sub("$20", "#20", text)
'I have $20 in my pocket'
Run Code Online (Sandbox Code Playgroud)

在上面的例子中,您会看到当我尝试将"$ 20"替换为"#20"时,它不起作用(在第二种情况下).

当然,任何帮助都将非常感激.由于这个原因,一个非常愚蠢的虫子出现了并且正在拖延主要工作.

python regex text-mining python-2.7

3
推荐指数
1
解决办法
576
查看次数