小编Con*_*ion的帖子

全文搜索引擎的比较 - Lucene,Sphinx,Postgresql,MySQL?

我正在建立一个Django网站,我正在寻找一个搜索引擎.

一些候选人:

  • Lucene/Lucene与Compass/Solr

  • 狮身人面像

  • Postgresql内置全文搜索

  • MySQl内置全文搜索

选择标准:

  • 结果相关性和排名
  • 搜索和索引速度
  • 易于使用,易于与Django集成
  • 资源需求 - 站点将托管在VPS上,因此理想情况下搜索引擎不需要大量的RAM和CPU
  • 可扩展性
  • 额外的功能,如"你的意思是?",相关的搜索等

任何有上述搜索引擎经验的人,或者不在列表中的其他引擎 - 我很想听听你的意见.

编辑:至于索引需求,当用户不断将数据输入网站时,这些数据需要连续编入索引.它不一定是实时的,但理想情况下,新数据会出现在索引中,延迟时间不超过15-30分钟

mysql lucene postgresql full-text-search sphinx

308
推荐指数
7
解决办法
14万
查看次数

如何为crontab设置virtualenv?

我想设置一个crontab来运行Python脚本.

说脚本是这样的:

#!/usr/bin/python
print "hello world"
Run Code Online (Sandbox Code Playgroud)

有没有办法为这个Python脚本指定一个virtualenv来运行?在shell中,我只是这样做:

~$ workon myenv
Run Code Online (Sandbox Code Playgroud)

我可以在crontab中做些什么来激活virtualenv吗?

python cron virtualenv virtualenvwrapper

69
推荐指数
3
解决办法
4万
查看次数

电子邮件地址是否允许包含非字母数字字符?

我正在使用`Django建立一个网站.该网站可能拥有来自非英语国家的重要用户.

我只是想知道电子​​邮件地址可能包含哪些类型的字符是否存在任何技术限制.

电子邮件地址是否只允许包含英文字母,数字,"_","@"和"."?

是否允许包含"é"或"ü"等非英文字母?

它们是否允许包含中文或日文或其他Unicode字符?

email unicode domain-name internationalization

61
推荐指数
5
解决办法
5万
查看次数

事件驱动和异步之间有什么区别?在epoll和AIO之间?

事件驱动和异步通常用作同义词.这两者有什么不同吗?

另外,epoll和之间有什么区别aio?它们如何结合在一起?

最后,我多次读过Linux中的AIO被严重破坏.究竟是怎么破碎的?

谢谢.

linux asynchronous epoll aio event-driven

40
推荐指数
2
解决办法
1万
查看次数

如何从Python生成唯一的64位整数?

我需要从Python生成唯一的64位整数.我已经检查了UUID模块.但它生成的UUID是128位整数.所以那不行.

你知道在Python中生成64位唯一整数的方法吗?谢谢.

python random uuid guid uniqueidentifier

32
推荐指数
3
解决办法
3万
查看次数

Python/Erlang:Twisted,Stackless,Greenlet,Eventlet和Coroutines有什么区别?它们与Erlang进程类似吗?

我的不完全理解是Twisted,Stackless,Greenlet,Eventlet,Coroutines都使用非常轻量级和快速切换的异步网络IO和用户态线程.但我不确定它们之间有什么区别.

它们听起来与Erlang进程非常相似.它们几乎是一回事吗?

任何能够帮助我更多地理解这个主题的人都将不胜感激.

python erlang asynchronous nonblocking python-stackless

30
推荐指数
3
解决办法
6966
查看次数

GitHub如何在不重新加载页面的情况下更改URL?

转到任何GitHub 页面并单击任何目录/文件,观察URL的更改方式,但只更新页面的一部分.没有整页重装.

如何使用jQuery做类似的事情?

这适用于大多数浏览器(我使用的是Chrome)吗?

html ajax jquery github

28
推荐指数
1
解决办法
9947
查看次数

Google App Engine与网络托管计划相比如何?

Google App Engine每天提供1 GB的出站流量和6.5 CPU小时(基于1.2 GHz Intel x86处理器)的免费配额.

这些免费配额与网络托管计划相比如何?例如,免费配额支持的流量 - 通常高于或低于典型的5美元/月共享主机帐户支持的流量?

在免费配额之上,Google收取每GB输出流量0.12美元,每GB输入流量0.10美元,每CPU小时0.10美元,每月每GB存储0.15美元.

这些数字如何转化为正常的网络托管计划?例如,40美元/月VPS计划和200美元/月专用服务器计划可以支持的流量,它们在Google App Engine上的成本是多少?

我知道这取决于很多因素,但如果有人有任何球场估计或经验,他们愿意分享,我真的很感激.

我正在尝试在App引擎和标准Web托管之间为数据库支持的Python站点做出决定.该网站将从小规模开始,但如果流量增长,我想看看哪个是长期更好的选择.

hosting google-app-engine web-hosting shared-hosting

26
推荐指数
2
解决办法
1万
查看次数

Python/Django:如何从字符串中删除多余的空格和制表符?

我正在使用Python/Django构建一个网站.用户提交标签.每个标签可以包含多个单词.每个标签都有一个ID号.我想确保格式略有不同的标签仍然被识别为相同的标签.

例如,如果一个用户提交了标签"电吉他"而另一个用户提交了"电吉他"(两个单词之间有2个白色空格),我希望能够识别它们是相同的标签.

在这种情况下,如何删除所有额外的空格和制表符?谢谢.

python string django

25
推荐指数
3
解决办法
3万
查看次数

如何动态组合和访问Python中的类属性?

我有一个Python类,其属性名为:date1,date2,date3等.

在运行时,我有一个变量i,它是一个整数.

我想要做的是根据i的值在运行时访问适当的日期属性.

例如,

如果我== 1,我想访问myobject.date1

如果我== 2,我想访问myobject.date2

我想为类而不是属性做类似的事情.

例如,我有一堆类:MyClass1,MyClass2,MyClass3等.我有一个变量k.

如果k == 1,我想实例化一个新的MyClass1实例

如果k == 2,我想实例化一个新的MyClass2实例

我怎样才能做到这一点?

编辑

我希望避免使用巨大的if-then-else语句来选择合适的属性/类.

有没有办法在Python中使用变量的值动态编写类名?

python

22
推荐指数
2
解决办法
1万
查看次数