我最近一直在阅读关于Stackless Python的内容,与vanilla cPython相比,它似乎有很多优点.它具有所有这些很酷的功能,如无限递归,微线程,延续等,同时比cPython更快(大约10%,如果相信Python维基)并与之兼容(至少版本2.5,2.6 和3.0).
所有这些看起来好得令人难以置信.但是,TANSTAAFL,我对Python社区中的Stackless没有太大的热情,而PEP 219从未实现过.这是为什么?Stackless的缺点是什么?Stackless'壁橱里藏着什么骷髅?
(我知道Stackless不提供真正的并发性,只是一种更简单的并发编程方式.它并没有真正打扰我.)
我有一个程序的源代码(取自cvs/svn/git/...),我想为它构建一个Debian/Ubuntu包.包存在于存储库中,但是:
这样做最简单的方法是什么?我关心的是一些事情
有人知道一个好的Emacs模式来编辑JSON吗?我正在开发的一个应用程序使用基于JSON的通信协议,并且数据很好地缩进和语法突出显示将帮助我解决它的过程.
我在Common Lisp中完成了大部分的开发工作,但是有些时候我想切换到Scheme(在Small Pieces中读取Lisp,当我想要使用continuation时,或者当我想在Gauche中执行一些脚本编写时,例).在这种情况下,我不舒服的主要原因是我没有史莱姆(是的,你可以称我为瘾君子).
Scheme最接近史莱姆的是什么?具体来说,我最感兴趣的是:
let中定义的函数).(map |)(光标位置由|)表示),我想(map predicate . lists)在迷你缓冲区中看到我已经通过降低重要性来命令这些功能.
我的Scheme实现选择是:
如果它至少与它们一起工作会很棒.
我希望能够./manage.py shell在Emacs缓冲区中运行,包含你从ipython获得的所有好东西,比如魔术命令和自动完成.理想情况下,我还希望能够将缓冲区中的代码计算到django shell.
这可能吗?
我们有一个电影和连续剧数据库,由于数据来自不同可靠性的来源,我们希望能够对剧集的标题进行模糊字符串匹配.我们在我们的应用程序中使用Solr进行搜索,但是默认的匹配机制在单词级别上运行,这对于短字符串来说不够好,比如标题
我过去曾使用过n-gram近似匹配,我很高兴地发现Lucene(和Solr)支持开箱即用的东西.不幸的是,我无法正确配置它.
我假设我需要一个特殊的字段类型,所以我在schema.xml中添加了以下字段类型:
<fieldType
name="trigrams"
stored="true"
class="solr.StrField">
<analyzer type="index">
<tokenizer
class="solr.analysis.NGramTokenizerFactory"
minGramSize="3"
maxGramSize="5"
/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
Run Code Online (Sandbox Code Playgroud)
并将架构中的相应字段更改为:
<field name="title" type="trigrams"
indexed="true" stored="true" multiValued="false" />
Run Code Online (Sandbox Code Playgroud)
但是,这并不像我预期的那样有效.查询分析看起来正确,但我没有得到任何结果,这使我相信在索引时发生了某些事情(即标题被索引为默认字符串字段而不是trigram字段).
我正在尝试的查询是类似的
title:"guy walks into a psychiatrist office"
Run Code Online (Sandbox Code Playgroud)
(有一两个错字)它应该与"Guy Walks into a Psychiatrist Office"匹配.
(我不确定查询是否正确.)
而且,我希望能够做更多事情.我想降低字符串,删除所有标点符号和空格,删除英语停用词,然后将字符串更改为三字符串.但是,只有在字符串被标记化后才应用过滤器...
提前感谢您的回答.
我正在使用Facebook Connect进行用户登录/创建的网站上工作.我有一个用于QA的开发服务器,我希望它受密码保护.我们想使用HTTP基本身份验证,但这似乎打破了Facebook Connect(它处于循环中).有人知道为什么会这样吗?
我相信基本身份验证是在浏览器的基础上完成的,Facebook和我们网站之间的所有通信都是在用户的浏览器中完成的.可能是什么问题呢?
在GKE中,我有一个带有两个容器的容器.他们使用相同的图像,唯一的区别是我传递了略微不同的标志.一个运行正常,另一个运行崩溃循环.如何调试失败的原因?
我的pod定义是
apiVersion: v1
kind: ReplicationController
metadata:
name: doorman-client
spec:
replicas: 10
selector:
app: doorman-client
template:
metadata:
name: doorman-client
labels:
app: doorman-client
spec:
containers:
- name: doorman-client-proportional
resources:
limits:
cpu: 10m
image: gcr.io/google.com/doorman/doorman-client:v0.1.1
command:
- client
- -port=80
- -count=50
- -initial_capacity=15
- -min_capacity=5
- -max_capacity=2000
- -increase_chance=0.1
- -decrease_chance=0.05
- -step=5
- -resource=proportional
- -addr=$(DOORMAN_SERVICE_HOST):$(DOORMAN_SERVICE_PORT_GRPC)
- -vmodule=doorman_client=2
- --logtostderr
ports:
- containerPort: 80
name: http
- name: doorman-client-fair
resources:
limits:
cpu: 10m
image: gcr.io/google.com/doorman/doorman-client:v0.1.1
command:
- client
- -port=80 …Run Code Online (Sandbox Code Playgroud) 我正在尝试从源代码编译Bigloo Scheme,我无法弄清楚如何Bigloo在OS X 10.5(Leopard)中启用本机线程支持(我还没有读过线程不应该在这个平台上工作的任何地方).
我跑./configure,但然后在配置摘要中,我总是得到
Release features:
release number........................ 3.2a
supported backends.................... native:yes JVM:no .NET:no
default backend....................... native
additional APIs....................... fthreads pthreads ssl web sqlite ssl sqlite web multimedia mail calendar pkgcomp pkglib
native threads support................ no
openssl support....................... yes (dtls no)
sqlite support........................ sqltiny + sqlite
dynamic libraries support............. yes
bee support........................... partial
Run Code Online (Sandbox Code Playgroud)
我想Bigloo以便使用Hop,当我尝试使用如此创建的二进制文件运行它时,我总是得到警告
*** WARNING:bigloo:hop
Threads disabled, forcing "nothread" scheduler.
Run Code Online (Sandbox Code Playgroud)
任何帮助都感激不尽.
我想为用Django编写的网站实现一个搜索解决方案.从可用选项(我研究过Solr,Sphinx,Xapian,PostgreSQL/Tsearch3,MySQL)看,Sphinx看起来是最好的.但是,它不支持波兰语的词干,这是我想要搜索的数据的语言.
在Sphinx中处理不受支持的语言的最佳方法是什么?我有一种直觉,我可以从Ispell字典创建一个词干语料库.我怎样才能与Sphinx合作?
我有一个相当小的(每天大约4.5k的综合浏览量)网站在Django上运行,PostgreSQL 8.3作为数据库.
我使用数据库作为缓存和sesssion后端.为了这个目的,我听说过很多关于使用Memcached的好东西,我肯定想尝试一下.但是,我想确切地知道这种改变会带来什么好处:我想我的网站可能不够大,无法让更好的缓存后端有所作为.关键是:我不会安装和配置memcached,我不想浪费任何时间或非常少的时间.
如何衡量使用db作为缓存后端引入的开销?我看过django-debug-toolbar,但如果我理解正确,那么你不想把它放在生产网站上(你必须设置DEBUG=True它才能工作).不幸的是,我无法在我的笔记本电脑上重现生产设置(我有不同的操作系统,CPU和更多的RAM).
有没有人对不同的Django缓存/会话后端进行基准测试?有人知道如果我正在做什么会有什么性能差异,例如,每次请求都有一次会话写入?
我写的Django项目的一个功能是发送简报.我有一个模型,Newsletter以及一个功能,send_newsletter,我已经注册收听Newsletter的post_save信号.通过管理界面保存新闻稿对象时,send_newsletter检查是否created为True,如果是,则实际发送邮件.
但是,由于显而易见的原因,编辑已发送的简报并没有多大意义.有没有一种方法Newsletter可以在保存对象后使其成为只读对象?
我知道我可以覆盖save对象的方法来引发错误,或者如果对象存在则不要.但是,我没有看到这样做的意义.至于前者,我不知道在哪里捕获该错误以及如何向用户传达该对象未被保存的事实.至于后者,给用户提供错误的反馈(管理界面说保存成功)似乎不是一件好事.
我真正想要的是允许用户使用Admin界面编写新闻稿并发送它,然后浏览已经发送的新闻稿.我希望管理界面在不可编辑的输入框中显示已发送简报的数据,而不使用"保存"按钮.或者,我希望"保存"按钮不活动.
python ×4
django ×3
emacs ×3
scheme ×2
search ×2
approximate ×1
bigloo ×1
caching ×1
common-lisp ×1
debian ×1
django-admin ×1
facebook ×1
ipython ×1
json ×1
kubernetes ×1
lisp ×1
lucene ×1
memcached ×1
packaging ×1
polish ×1
postgresql ×1
slime ×1
solr ×1
sphinx ×1
stemming ×1
ubuntu ×1
unicode ×1