标签: tagging

如何在Rails中为自动完成添加标记到现有模型?

我正在尝试Article在Rails 3应用程序中为模型添加"标签" .

我想知道是否有一个gem或插件添加了模型中的"标记"功能以及视图的自动完成帮助程序.

我发现acts_as_taggable但是我不确定这是不是我应该使用的.有更新的东西吗?我从2007年google acts_as_taggable获得了结果

jquery tagging autocomplete ruby-on-rails acts-as-taggable

28
推荐指数
2
解决办法
9526
查看次数

如何自动标记所需的内容,算法和建议

我正在使用一些非常庞大的报纸文章数据库,我将它们放在MySQL数据库中,我可以查询它们.

我现在正在寻找帮助我用一些描述性标签标记这些文章的方法.

所有这些文章都可以通过如下所示的URL访问:

http://web.site/CATEGORY/this-is-the-title-slug
Run Code Online (Sandbox Code Playgroud)

所以至少我可以使用该类别来确定我们正在使用的内容类型.但是,我也想基于文章文本进行标记.

我最初的做法是这样做:

  1. 获取所有文章
  2. 获取所有单词,删除所有标点符号,按空格分割,并按出现次数计算
  3. 分析它们,过滤常见的非描述性词语,如"他们","我","这个","这些","他们的"等.
  4. 当所有常用词被过滤掉时,唯一剩下的就是标记值得的词.

但事实证明这是一个相当手动的任务,而不是一个非常漂亮或有用的方法.

这也遭受了由空格分割的单词或名称的问题,例如,如果1.000篇文章包含名称"John Doe",并且1.000篇文章包含"John Hanson"的名称,我只会得到"John"这个词出于它,而不是他的名字和姓氏.

tags tagging nlp

28
推荐指数
4
解决办法
2万
查看次数

面部识别/检测用于照片和视频库的PHP或软件

我有一个非常大的照片库,里面有成千上万的相似的人物,物品,地点,东西.照片中的大多数人都有自己的用户帐户和头像照片来匹配.根据每张照片可用的附加数据,还有可能在照片中的人的逻辑短列表.我允许用户使用他们的朋友和他们认识的人标记照片,但自动化过程会更好.

我使用了face.com上的照片标记器/取景器与Facebook照片集成,而用于个人相册的Google Picasa照片标记器也做同样的事情,正是我想要做的.

是否有PHP脚本,用于Google Picasa的API,face.com或其他识别服务或任何其他开源项目,提供服务器端面部识别和/或按照相似性对照片进行分组?

示例:正如您所看到的,各种照片共享站点都提供了该功能,但有没有为我自己的服务器上存储的图像提供API或者足以链接到我自己的图库和标记系统的东西?

php tagging face-recognition face-detection photo-gallery

25
推荐指数
2
解决办法
4万
查看次数

Python NLTK:如何使用简化的词性标签集来标记句子?

Python NLTK书的第5章给出了在一个句子中标记单词的示例:

>>> text = nltk.word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]
Run Code Online (Sandbox Code Playgroud)

nltk.pos_tag调用默认标记器,它使用一整套标记.本章后面将介绍一组简化的标签.

如何使用这组简化的词性标签标记句子?

我也正确理解了标记器,即我可以更改标记器使用的标记集,或者我应该将它返回的标记映射到简化集,还是应该从新创建新的标记器,简单标记的语料库?

python tagging nltk

25
推荐指数
3
解决办法
2万
查看次数

有免费的Treebank吗?

我可以免费或低于100美元下载Treebank of English短语吗?我需要训练数据包含任何格式的英语句法分析句子(> 1000).基本上我所需要的只是这句话中的单词被词性所识别.

tagging nlp corpus

23
推荐指数
2
解决办法
2万
查看次数

无监督自动标记算法?

我想构建一个Web应用程序,让用户上传文档,视频,图像,音乐,然后让他们能够搜索它们.将其视为Dropbox +语义搜索.

当用户上传新文件(例如Document1.docx)时,如何根据文件内容自动生成标签?换句话说,不需要用户输入来确定文件的内容.如果假设Document1.docx是关于数据挖掘的研究论文,那么当用户搜索数据挖掘,研究论文document1时,该文件应该在搜索结果中返回,因为数据挖掘研究论文很可能是潜在的自动给定文档的生成标记.

1.您会针对此问题推荐哪种算法?

2.是否有一个自然语言库可以为我做这个?

3.我应该研究哪种机器学习技术来提高标签精度?

4.我如何将其扩展到视频和图像自动标记?

提前致谢!

algorithm tagging nlp machine-learning

22
推荐指数
2
解决办法
2万
查看次数

标记层次结构和处理

这是一个真正的问题,一般适用于标记项目(是的,这也适用于StackOverflow,不,这不是关于StackOverflow的问题).

整个标记问题有助于聚类类似的项目,无论它们是什么项目(笑话,博客帖子,所以问题等).但是,(通常但不严格)是标签的层次结构,这意味着某些标签也暗示其他标签.使用一个熟悉的例子,"c#"so标签也暗示".net"; 另一个例子,在笑话数据库中,"blondes"标签暗示"嘲弄"标签,类似于"爱尔兰"或"belge"或"加拿大"等,取决于笑话的国家来源.

你是如何在项目中处理这个问题的?我将提供一个答案,描述我在两个不同的情况下使用的两种不同的方法(实际上,相同的机制,但在两个不同的环境中实现),但我不仅对类似机制感兴趣,而且对您对层次结构问题的看法感兴趣.

tags tagging hierarchical-clustering

20
推荐指数
2
解决办法
3135
查看次数

是否有一个商定的标记理想模式

我有一个照片网站,我想支持标签,因为我的原始类别桶开始失败(一些图片是家庭和假期,或学校和朋友).是否有商定的标记数据库架构?

我仍然希望支持将照片作为专辑的一部分.

现在我有几张桌子:

相片

  • PHOTOID
  • PhotoAlbumID
  • 字幕
  • 日期

相片集

  • ALBUMID
  • ALBUMNAME
  • AlbumDate

sql schema tagging

20
推荐指数
2
解决办法
7397
查看次数

了解Gitlab CI标签

我已经阅读了文档,一些文章,你可能会称我为愚蠢,但这是我第一次使用这样的概念.

  • 我已经注册了带有"测试"标签的跑步者
  • 在gitlab中创建了标签"testing"
  • 这个跑步者,特别是项目
  • 我还在我的本地仓库中添加了相同的标签,例如"testing".

但是我的工作究竟是如何依赖这些标签的呢?所有这些操作都必要吗?如果我将新代码推送到repo,那么无论如何我都会执行*.yml文件.

那么,如果我只想在提交中定义版本时运行构建,该怎么办?

IDK ...

   git commit --tags "v. 2.0" -m "this is version 2.0" (probably not right)
Run Code Online (Sandbox Code Playgroud)

但当然它应该是通用的,所以我不必总是告诉使用哪个标签来触发转轮,但是例如让他识别数值.

正如你所看到的,我很困惑......如果你能详细说明标签是如何工作的,那么我就能理解这个概念,我将非常感激.

tagging yaml gitlab

19
推荐指数
2
解决办法
4万
查看次数

使用python的NLTK计算动词,名词和其他词性

我有多个文本,我想根据各种词性的使用来创建它们的配置文件,如名词和动词.基本上,我需要计算每个词性的使用次数.

我已经标记了文字,但我不确定如何进一步:

tokens = nltk.word_tokenize(text.lower())
text = nltk.Text(tokens)
tags = nltk.pos_tag(text)
Run Code Online (Sandbox Code Playgroud)

如何将每个词性的计数保存到变量中?

python tagging nlp nltk part-of-speech

18
推荐指数
1
解决办法
2万
查看次数