小编Non*_*-da的帖子

是否有解析器/方式可用于使用Python解析Wikipedia转储文件?

我有一个项目,我收集属于特定类别的所有维基百科文章,从维基百科中取出转储,并将其放入我们的数据库中.

所以我应该解析Wikipedia转储文件来完成这些工作.我们有一个有效的解析器来完成这项工作吗?我是一名python开发人员.所以我更喜欢python中的任何解析器.如果不建议一个,我将尝试在python中编写一个端口并将其贡献给Web,因此其他人可以使用它或者至少尝试一下.

所以我想要的是一个解析维基百科转储文件的python解析器.我开始编写一个手动解析器,它解析每个节点并完成所有工作.

python xml wiki parsing wikipedia

6
推荐指数
1
解决办法
5705
查看次数

有没有一种简单的方法可以使用Django在开发服务器中测试受SSL保护的网页?

我在我的网站上使用Django,我想知道是否有一个解决方案来测试开发服务器中的安全页面.作为临时解决方法,我不会使用HTTP来检查开发服务器中的网页,我认为这不是正确的方法吗?你怎么看?

security testing django ssl

5
推荐指数
1
解决办法
1543
查看次数

即使存储库中没有更改声明存储库已损坏,Jenkins也会自动触发作业

我已配置Jenkins为Windows Server中的GIT存储库生成构建.我的Jenkins作业配置为连续轮询存储库,并在存储库中找到任何更改时触发构建.即使存储库中没有任何更改,问题仍然是Jenkins作业自动触发.当我检查轮询日志时,它打印了以下消息

Started on Oct 27, 2011 9:45:54 AM
Using strategy: Default
[poll] Last Build : #289
[poll] Last Built Revision: Revision 7fd9fb8139dd0c449a0382b505c7857c8634f33f     (origin/Prod_dev)
Workspace has a .git repository, but it appears to be corrupt.
No Git repository yet, an initial checkout is required
Done. Took 11 sec
Changes found
Run Code Online (Sandbox Code Playgroud)

jenkins

5
推荐指数
0
解决办法
1261
查看次数

将postfix邮件集成到我的(python)webapp中

我有一个postfix服务器监听和接收mywebsite.com收到的所有电子邮件现在我想在自定义界面中显示这些postfix电子邮件,对每个用户也是如此

为了清楚起见,mywebsite.com的所有用户都将获得一些邮件地址,例如someguy@mywebsite.com,他们在我的生产机器上收到电子邮件,但他在mywebsite.com的仪表板内置自己的控制台中看到了这些邮件.

因此,为了让用户看到他收到的邮件,我需要创建一个postfix邮件的电子邮件副本,以便mywebsite(在django-python上运行)将很容易地反映它们.我如何实现这一目标.确切地说,这是我的问题,如何将postfix邮件转换为python邮件对象(以便我的系统/网站)理解它?

为了清楚起见,我已经编写了伪代码来实现我想要的:

email_as_python_object = postfix_email_convertor(postfix_email)
attachments_list = email_as_python_object.attachments
body = email_as_python_object.body # be it html or whatever
Run Code Online (Sandbox Code Playgroud)

顺便说一下,我尝试了python附带的默认电子邮件模块,但对于所有情况都不方便.甚至我需要手动处理邮件附件(我讨厌).我只需要一个简单的方法来处理这些案例(我想知道postfix如何理解收到的电子邮件.即..它如何自动计算出不同的标题,附件等...).请帮我.

python email message postfix-mta

4
推荐指数
2
解决办法
2554
查看次数

打印python模数运算符,因为它超过了命令行

我想打印模数运算符,因为它在命令行上:例如,这是输出的样子:
1%2
2%4


30%
40%

我正在使用这样的print语句:

打印'计算%s%%s'%(num1,num2)

抛出默认错误:

TypeError:并非在字符串格式化期间转换所有参数

现在我正在使用:

打印'计算1'+'%'+'2'

打印:

计算1%2

但是告诉我如何使用第一种方法完成这项工作(:print'computing%s %% s'%(num1,num2))

python operators modulo

4
推荐指数
1
解决办法
3376
查看次数

我可以有选择地创建Postgres数据库的备份,只有certian表吗?

我可以以编程方式(或以任何方式工作正常)创建数据库的备份,只有我想要的表吗?我的数据库中有大约100个表,我只需要10个表备份(当然所有都是相互依赖的).我怎样才能做到这一点?顺便说一句,我有一个postgresql数据库.

database postgresql dump pg-dump

3
推荐指数
1
解决办法
2505
查看次数

列出内置函数和方法(Python)

我想出了这个:

[a for a in dir(__builtins__) if str(type(getattr(__builtins__,a))) == "<type 'builtin_function_or_method'>"]
Run Code Online (Sandbox Code Playgroud)

我知道它的丑陋.你能告诉我一个更好/更pythonic的方式吗?

python module introspection inspect

3
推荐指数
1
解决办法
373
查看次数

哪一个是表单验证的正确方法?Colander的Schema验证或Deform的表单验证?

我刚刚开始在我的一个项目中使用Pyramid,我有一个案例,我需要验证表单字段输入,通过获取表单字段值并进行Web服务调用来断言值的正确性.例如,有一个名为银行CUSTOMER-ID的字段.我需要将(单独)作为输入并通过进行Web服务调用(如http://someotherdomain/validate_customer_id/?customer_id=<input_value>)来在服务器级别进行验证.

我正在使用Colander进行表单模式管理,并使用Deform进行所有表单验证逻辑.我很困惑我需要在CUSTOMER-ID案例中放置验证逻辑.它是MySchema().bind(customer_id=<input_value>)(它有一个查询web服务的延迟验证器)或form.validate(request.POST.items())?如果我采用延迟验证器的路径,则会因错误的CUSTOMER-ID MySchema().bind而引发colander.Invalid错误.没关系.但是,该错误不是在表单级别,而是在模式级别.那么我该如何以理智的方式告诉用户这个呢?

我对Django表单有很好的经验,所以我期待像clean方法一样.像form ['customer_id']这样的表单错误.错误是我在模板级别所期望的.Pyramid的Deform还是Colander有可能吗?

forms validation pyramid deform colander

2
推荐指数
1
解决办法
1984
查看次数

在python中执行字符串作为命令

我在python中开发我的东西.在这个过程中我遇到了一个情况,我有一个名为"import django"的字符串.我想验证这个字符串.这意味着,我想检查所提到的模块(在这种情况下是'django')是否在python-path中.我该怎么做?

python django path

1
推荐指数
1
解决办法
1758
查看次数

在Django中进行站点更新后手动注销用户

我有一个网站,会经常更新.有时,用户特定模型会发生更改并链接到会话.

在我更新我的网站后,我希望用户注销并重新登录.所以我会立即注销用户.如果他重新登录,他将看到该网站的最新更新.

我该怎么做?

python authentication django logout

1
推荐指数
1
解决办法
945
查看次数