小编Tri*_*daz的帖子

bash:pip:找不到命令

我下载了pip并运行python setup.py install,一切正常.本教程的下一步是运行,pip install <lib you want>但在它甚至尝试在线查找任何内容之前,我收到错误"bash:pip:command not found".

这是在Mac OS X上,我也是新手,所以我假设我在运行setup.py时没有正确设置某种路径设置.我该如何进一步调查?我需要检查什么才能更好地了解问题的确切原因?

编辑:我也尝试安装Python 2.7 for Mac,希望友好的安装过程可以做任何管理,如编辑PATH和其他任何需要高兴的一切按照教程工作,但这不起作用.安装运行后'python'仍然运行Python 2.6并且PATH没有更新.

python macos pip python-2.6

351
推荐指数
19
解决办法
85万
查看次数

如何管理PhantomJS实例的"池"

我正在计划内部使用的webservice,它接受一个参数,一个URL,并返回表示该URL中已解析 DOM的html .通过解决,我的意思是webservice将首先获取该URL的页面,然后使用PhantomJS"渲染"页面,然后在执行所有DHTML,AJAX调用等之后返回结果源.但是发动对每个请求的基础(这是我现在做)幽灵的方式过于缓慢.我宁愿拥有一个PhantomJS实例池,其中一个实例可用于为我的webservice提供最新的调用.

以前有没有做过这方面的工作?我宁愿将这个web服务基于其他人的工作,而不是从头开始为我自己编写一个池管理器/ http代理服务器.

更多上下文:我列出了迄今为止我见过的两个类似的项目,以及为什么我避免了每个项目,这导致了关于管理PhantomJS实例池的问题.

jsdom - 从我所看到它在页面上执行脚本具有很强的功能,但它不会尝试复制浏览器行为,因此如果我将它用作通用的"DOM解析器",那么它最终会成为很多额外的编码来处理各种边缘情况,事件调用等.我看到的第一个例子是必须为我使用node设置的测试应用程序手动调用body标签的onload()函数.这似乎是一个深深的兔子洞的开始.

Selenium - 它只有很多移动部件,因此设置一个池来管理长期存在的浏览器实例将比使用PhantomJS更复杂.我不需要它的任何宏录制/脚本功能.我只想要一个能够获得网页并解析它的DOM的web服务,就好像我用浏览器浏览到那个URL一样(如果我可以让它忽略图像等,甚至更快)

node.js web-scraping jsdom phantomjs

66
推荐指数
4
解决办法
2万
查看次数

Django脚本无需使用manage.py shell即可访问模型对象

我正在编写一个脚本,将一些模型对象导入我的django应用程序使用的数据库中.在过去,我通过运行./manage.py shell然后解决了这个问题import myscript.我相信有更好的方法.我希望能够从我的HD上的任何地方调用脚本python scriptname.py,并且在该脚本的前几行中它将执行任何必要的导入/其他操作,以便它可以访问模型对象并且表现得好像它已经运行使用manage.py shell.

我需要添加到脚本中才能实现此目的?

编辑:

基于@Melug的回答,添加了动态设置的Python路径来解决问题中的"我的HD上的任何地方"部分:

import sys
sys.path.append('c:\\my_projec_src_folder')
from myproject import settings
from django.core.management import setup_environ
setup_environ(settings)
Run Code Online (Sandbox Code Playgroud)

python django django-models

65
推荐指数
6
解决办法
5万
查看次数

无监督的情绪分析

我一直在阅读很多文章,这些文章解释了在情感分析系统真正起作用之前需要一组初始文本,这些文本被归类为"正面"或"负面".

我的问题是:是否有人试图对"正面"形容词与"否定"形容词进行初步检查,同时考虑到任何简单的否定词以避免将"不快乐"归类为正面?如果是这样,是否有任何文章讨论为什么这种策略不现实?

nlp machine-learning sentiment-analysis

45
推荐指数
3
解决办法
3万
查看次数

如何使用curl与Django,csrf令牌和POST请求

我正在使用curl测试我的一个Django表单.我尝试过的调用(每个调用都有错误,多行可读):

(1):

curl
-d "{\"email\":\"test@test.com\"}"
--header "X-CSRFToken: [triple checked value from the source code of a page I already loaded from my Django app]"
--cookie "csrftoken=[same csrf value as above]"
http://127.0.0.1:8083/registrations/register/
Run Code Online (Sandbox Code Playgroud)

(使用http标头和csrftokencookie)导致400错误,没有返回数据.

(2):

curl
-d "{a:1}"
--header "X-CSRFToken:[as above]"
--cookie "csrftoken=[as above];sessionid=[from header inspection in Chrome]"
http://127.0.0.1:8083/registrations/register/
Run Code Online (Sandbox Code Playgroud)

(如在(1)中但在头属性声明中没有空格,并且sessionid在cookie中也没有空格)导致相同的400错误而没有返回数据.

(3):

curl
-d "{a:1}"
--header "X-CSRFToken:[as above]"
http://127.0.0.1:8083/registrations/register/
Run Code Online (Sandbox Code Playgroud)

(只有http标头X-CSRFToken,没有cookie)会导致错误代码403,并显示消息:未设置CSRF cookie.

如何用卷曲测试我的表单?除了cookie值和http标头之外,我还没有考虑哪些因素?

django curl csrf django-forms django-csrf

44
推荐指数
4
解决办法
5万
查看次数

发现MySQL列的排序规则

我之前创建了一个MySQL表,现在我想找出一些字段正在使用的排序规则.我可以使用哪些SQL或MySQL命令来发现它?

mysql collation

39
推荐指数
2
解决办法
2万
查看次数

MALLET与NLTK中的主题建模

我刚刚阅读了一篇关于MALLET如何用于主题建模的精彩文章,但我在网上找不到MALLET和NLTK之间的任何内容,我已经有过一些经验.

它们之间的主要区别是什么?MALLET是一个更"完整"的资源(例如,有更多的工具和算法)?或者回答前两个问题的一些好文章在哪里?

nltk mallet

28
推荐指数
1
解决办法
8445
查看次数

在Django管理站点中,如何更改时间字段的显示格式?

我最近增加了一个新的模式,我的网站,我使用的是admin.py文件来指定正是我希望它会显示在管理网站.它工作得很好,但我无法弄清楚如何让我的一个日期字段包含其显示格式的秒数.我只看到"2011年8月27日,下午12点12分"这样的价值,我想看的是"2011年8月27日,12:12*:37*pm"

python django date-formatting

27
推荐指数
4
解决办法
2万
查看次数

django静态注释

我想使用django为数据库查询的结果添加一个静态值(所以不使用'raw'SQL)

例如,如果我有一个带有字段make,model和color的对象Car,那么我希望我的结果集具有额外的静态值,如下所示:

make     model     color    sales
----     -----     -----    -----
nissan   bluebird  black    0
ford     fiesta    red      0
toyota   camry     green    0
Run Code Online (Sandbox Code Playgroud)

我试过像代码一样

cars= Car.objects.all().annotate(sales=0)
Run Code Online (Sandbox Code Playgroud)

但是有错误.我能做什么?

干杯,戴夫

--Tindind在Fedang #django上

python django

26
推荐指数
2
解决办法
8194
查看次数

Javascript:如何在RegEx .exec结果中获得多个匹配项

我跑的时候

/(a)/g.exec('a a a ').length
Run Code Online (Sandbox Code Playgroud)

我明白了

2
Run Code Online (Sandbox Code Playgroud)

但我认为它应该回归

3
Run Code Online (Sandbox Code Playgroud)

因为a字符串中有3个,而不是2个!

这是为什么?

我希望能够在RegEx中搜索字符串的所有出现并迭代它们.

FWIW:我正在使用node.js

javascript regex v8 node.js

25
推荐指数
4
解决办法
3万
查看次数