我正在寻找免费的易于实施和无广告的Google CSE替代品.
我发现了indextank,它看起来像一种简单的索引内容的方式,但它不会抓取你的网站.我想我设想能够将它传递给Google CSE.
因此,有一种简单的方法可以设置PHP脚本来执行爬网部分吗?即传递一个URL并让它索引该域上的所有网页.
最终结果是我可以在我的网站上进行网站搜索.
我正在使用herxt的indextank.哪个是更好的宝石使用,indextank或思考库?我查看了文档和两者的教程,看起来thinktank更容易使用.一个相关/后续问题:每个问题的优点/缺点是什么?
他**llo,给定一个Indextank索引,如下所示:class Threads <ActiveRecord :: Base has_many:permissions
包括Tanker
tankit 'rails_3_demo' do
indexes :content
end
after_save :update_tank_indexes
after_destroy :delete_tank_indexes
end
Run Code Online (Sandbox Code Playgroud)
该索引存在于我的Thread模型中.问题是线程有权限.目前,如果我允许用户搜索索引,他们将搜索所有用户的线程.处理权限的智能方法是什么,因此用户只能搜索用户有权访问的线程.谢谢**
架构:
USER (id)
PROJECT (id)
PERMISSION (user_id, project_id)
Thread (project_id)
Run Code Online (Sandbox Code Playgroud)
只要用户拥有项目的权限记录,他们就可以查看该项目的所有线程.