我想在我的应用程序上实现类似twitter的hashtag.
假设我有一个文本区域的用户输入"我要从#paris转到#london"然后我想构建标签云的标签云.
我正在考虑使用act-as-taggable-on.所以我从后端的文本中找到了所有的hashtags,然后将其保存到tag字段.
任何人都有这方面的经验,他们想分享?谢谢.
我正在尝试使用多标签过滤实现分面搜索或标记.在分面导航中,仅显示非空类别,并且在括号中显示类别中也匹配已应用标准的项目数.
我可以有使用内部连接分配类的所有项目,并得到使用COUNT和GROUP BY在所有类别的项目数,但我不知道怎么会扩展到数百万的标签对象和数千个.特别是计数.
我知道有一些非关系解决方案,如Lucene + SOLR,但我发现一些基于闭源RDBMS的实现,据说是像FacetMap.com或Endeca软件这样的企业实力,所以必须有一个在关系数据库中执行分面搜索的有效方法.
有没有人有分面搜索的经验,可以提供一些提示?
缓存每个类别集的计数?也许使用一些智能增量技术来更新计数器?
编辑:
可以在此处找到分面导航的示例:弗拉门戈.
目前我有标准的3表方案(项目,标签和items_tags,如下所述:http://www.pui.ch/phred/archives/2005/04/tags-database-schemas.html#toxi )加上一个表对于方面.每个标签都分配了一个方面.
我希望我能够为任何文件设置(并获取)自定义元数据属性.
做这个的最好方式是什么?
谢谢
我忘了使用发布标记标记我的文件的旧版本.旧版本是r13,最新版本是r65.我将最新的存储库克隆到一个新目录,做了一个"hg update -r13"来获取我想要标记的旧代码,然后执行了tag命令,但收到了消息:
中止:不在分支头(使用-f强制)
在这种情况下使用-f选项是否安全?
我还没用过lucene.上次我问(几个月前,也许一年)人们建议lucene.如果我不应该使用lucene我应该使用什么?例如,有些标记的项目是这样的
如果一个用户搜索苹果我不在乎是否有1,2和4的任何偏好.但是我看到很多论坛这样做我讨厌当用户搜索苹果胡萝卜2和3有高结果而1很难找到甚至虽然它更贴近我的搜索.
此外,我希望有能力做搜索胡萝卜 - 苹果只会让我3.我不知道如果我搜索胡萝卜香蕉会发生什么,但无论如何,只要更多项目标记为2和3的结果排名较低然后1我搜索苹果胡萝卜,我会很高兴.
lucene可以这样做吗?我从哪里开始?我试着查找它,当我看到很多课程时,我会看到有关文档,网页的教程,但是当我喜欢标记某些内容时,没有人明白该做什么.如果不是lucene我应该用什么标记?
好像我只能在S3中使用桶级别的标签.这似乎在某种程度上是有道理的,因为你可能只会在那种宏观层面进行计费.但是,我可以看到一些用于标记的用例,以便不同的人为同一个桶中的不同对象收费.
你能标记单个S3对象吗?
我有一个城市表,看起来像这样.
|id| Name |
|1 | Paris |
|2 | London |
|3 | New York|
Run Code Online (Sandbox Code Playgroud)
我有一个看起来像这样的标签表.
|id| tag |
|1 | Europe |
|2 | North America |
|3 | River |
Run Code Online (Sandbox Code Playgroud)
和cities_tags表:
|id| city_id | tag_id |
|1 | 1 | 1 |
|2 | 1 | 3 |
|3 | 2 | 1 |
|4 | 2 | 3 |
|5 | 3 | 2 |
|6 | 3 | 3 |
Run Code Online (Sandbox Code Playgroud)
如何计算哪个是最密切相关的城市?例如.如果我正在看城市1(巴黎),结果应该是:伦敦(2),纽约(3)
我找到了Jaccard索引,但我不确定如何最好地实现它.
想知道我如何在php和mysql数据库中创建标记系统,我最初的想法是在表格中创建一个存储文章的行,命名标签,并列出用逗号分隔的标签,但我不知道如何我可以创建一个搜索匹配标签的查询,我不想每次有人点击标签时查询每篇文章.有人可以帮忙吗?
我用微工作,我想使用Schema.org的keywords进行CreativeWork.
模式指定它应该是文本,但我是否将每个关键字放在一个单独的元素中,itemprop="keywords"或者我将它们全部放在一个keywords元素中?如果我将它们全部放在一个元素中,我是否使用逗号作为分隔符?