我想知道像谷歌阅读器,Blogline,techronati这样的网络应用程序是如何运作的,以及他们使用什么技术来同时使用cron作业解析数百万个RSS源?
我想使用命名实体识别(NER)来为数据库中的文本找到足够的标签.我没有使用像NLTK或Lingpipe这样的工具,而是想构建自己的工具.
所以我的问题是:
我应该使用哪种算法?
构建这个工具有多难?
当我打电话或打电话时,我想安装Hookbox但没有成功easy_install
python setup.py install
Run Code Online (Sandbox Code Playgroud)
它给了我 [Errno 13] Permission denied: '/usr/local/lib/python2.6/site-packages/test-easy-install-68779.write-test'
当我尝试向这个derectory授予写权限时,它给出了
chmod: /usr/local/lib/python2.6/site-packages/: Operation not permitted
Run Code Online (Sandbox Code Playgroud)
有没有办法解决这个概率或安装钩子没有easy_install?
请有人能告诉我如何2n = O(3n)计算?
以下是其他一些例子:
2^4 = O(1)
10n = O(n)
n log2(n) = O(n log n)