小编Mat*_*Mat的帖子

NLTK使用的实际例子

我正在玩自然语言工具包(NLTK).

它的文档(BookHOWTO)非常笨重,示例有时略有提升.

NLTK的使用/应用是否有任何好的但基本的例子?我正在考虑像Stream Hacker博客上的NTLK文章.

python nlp nltk

76
推荐指数
3
解决办法
5万
查看次数

如何以编程方式获取Django模型字段的max_length?

假设我有一个像这样的Django类:

class Person(models.Model):
    name = models.CharField(max_length=50)
    # ...
Run Code Online (Sandbox Code Playgroud)

我如何以编程方式获得max_lengthname字段的值?

python oop django django-models

62
推荐指数
2
解决办法
9989
查看次数

正则表达式:匹配开始或空格

正则表达式是否可以匹配空格字符串的开头?

我正在尝试用£符号替换货币缩写GBP.我可以匹配任何以英镑开头的东西,但我想要保守一点,并寻找周围的某些分隔符.

>>> import re
>>> text = u'GBP 5 Off when you spend GBP75.00'

>>> re.sub(ur'GBP([\W\d])', ur'£\g<1>', text) # matches GBP with any prefix
u'\xa3 5 Off when you spend \xa375.00'

>>> re.sub(ur'^GBP([\W\d])', ur'£\g<1>', text) # matches at start only
u'\xa3 5 Off when you spend GBP75.00'

>>> re.sub(ur'(\W)GBP([\W\d])', ur'\g<1>£\g<2>', text) # matches whitespace prefix only
u'GBP 5 Off when you spend \xa375.00'
Run Code Online (Sandbox Code Playgroud)

我可以同时做两个后面的例子吗?

python regex

50
推荐指数
4
解决办法
4万
查看次数

在pydev中打破异常

是否有可能让pydev调试器在异常中中断?

python eclipse debugging exception pydev

45
推荐指数
2
解决办法
1万
查看次数

Python有类原型(或前向声明)吗?

我在一个文件中有一系列Python类.有些类引用其他类.

我的代码是这样的:

class A():
    pass

class B():
    c = C()

class C():
    pass
Run Code Online (Sandbox Code Playgroud)

试着去试试那个,我明白了NameError: name 'C' is not defined.很公平,但有没有办法使它工作,或者我是否必须手动重新订购我的课程以适应?在C++中,我可以创建一个类原型.Python有相同的功能吗?

(我实际上正在使用Django模型,但我没有尝试使问题复杂化).

python oop prototype class

36
推荐指数
3
解决办法
3万
查看次数

防止屏幕刮擦

关于屏幕抓取合法性的问题,即使是非法的人仍然会尝试,所以:

可以采用哪些技术机制来防止或至少抑制屏幕抓取?

哦,只是为了咧嘴笑,让生活变得困难,保留搜索引擎的访问权限可能会很好.我很可能在这里扮演魔鬼的拥护者,但有一个严重的基础点.

screen-scraping

30
推荐指数
5
解决办法
2万
查看次数

可以旋转JPEG压缩图像而不会降低质量吗?

JPEG是一种有损压缩方案,因此解压缩 - 操作 - 重新压缩通常会进一步降低每一步的图像质量.是否可以旋转JPEG图像而不会造成进一步的损失?从我对JPEG算法的了解很少,它似乎可以通过一些努力避免进一步的损失.哪些常见的图像处理程序(例如GIMP,Paint Shop Pro,Windows照片库)和图形库在执行旋转时会导致质量损失,哪些不会?

compression graphics jpeg lossy-compression

23
推荐指数
4
解决办法
9374
查看次数

仅使用XPath选择第一个实例?

我正在解析一些像这样的XML:

<root>
    <some_gunk/>
    <dupe_node>
        ...
        stuff I want
        ...
    </dupe_node>
    <bits_and_pieces/>
    <other_gunk/>
    <dupe_node>
        ...
        stuff I don't want
        ...
    </dupe_node>
    <more_gunk/>
</root>
Run Code Online (Sandbox Code Playgroud)

一个XPath '//dupe_node'会给我两个dupe_node玩的例子.我只想穿越第一个.我可以用XPath做到这一点吗?

xml xpath

19
推荐指数
2
解决办法
3万
查看次数

清空自引用MySQL表的最佳方法是什么?

我有一个带有递归parent_id的自引用MySQL表:

CREATE TABLE `recursive` (
  `id` int(11) NOT NULL auto_increment,
  `parent_id` int(11) default NULL,
  `name` varchar(100) NOT NULL,
  PRIMARY KEY  (`id`),
  KEY `data_categorysource_parent_id` (`parent_id`),
  CONSTRAINT `parent_id_refs_id_627b4293`
    FOREIGN KEY (`parent_id`) REFERENCES `data_categorysource` (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
Run Code Online (Sandbox Code Playgroud)

在测试期间,我想清空它但TRUNCATE失败:

TRUNCATE `recursive` 
/* SQL Error: Cannot delete or update a parent row: a foreign key
constraint fails...
Run Code Online (Sandbox Code Playgroud)

我目前必须手动删除所有记录,从树的底部开始向上工作.即使是小树也会变得繁重.

有一个简单的方法吗?我不能DROP在表中重新创建它,因为其他表引用它(我已经截断了那些,所以那里应该没有数据完整性问题).

mysql sql truncate self-reference

17
推荐指数
2
解决办法
5013
查看次数

使用Python类有什么好处吗?

我有一个充满静态方法的Python类.将这些包装在一个类而不是原始函数中有哪些优点和缺点?

python static-methods class

16
推荐指数
3
解决办法
4747
查看次数