标签: information-extraction

基本清理:
- 小写标题,
- 剥去过多的空白
- 抛出明显的停顿词,如"买"和"点击"
为...构建一个数组 word => global occurence
- "Nivea" => 7
- "Deo" => 5
- "Deoroller" => 2
- …
- "VE" => 1
计算每个标题的"累积字值"
- "Nivea Deo" => 12
- "Nivea Deoroller VE" => 10 …

php nlp text-mining information-extraction

vzw*_*ick

2012 06-14

23
推荐指数

1
解决办法

746
查看次数

适用于Java的媒体信息提取器

我需要一个可以处理常见媒体格式的媒体信息提取库(纯Java或JNI包装器).我主要将它用于视频文件,我至少需要这些信息:

视频长度(运行时)
视频比特率
视频帧率
视频格式和编解码器
视频大小(宽X高)
音频频道
音频格式
音频比特率和采样率

有几个库和工具,但我找不到Java.

java media information-extraction

Emr*_*ici

2010 01-31

17
推荐指数

1
解决办法

3万
查看次数

当我说.......所以in是一个关键词并且之后的所有文本都是一个地方,直到我找到另一个关键词
在开始他或她确定性,得到..... 时,顺序不一致...无论后面是一组症状,我应该根据分隔符分开,可以是逗号,夸张或其他什么,但它是一致的同一条线
死了.....小时后也应该得到多少小时,有时患者仍然活着并且已经出院......等等
我说我们有很多约定,我想如果我能用关键字和模式对文本进行标记,我可以完成工作.所以,如果你知道一个有用的函数/模块/教程/工具,最好在python(如果不是python,所以一个gui工具会很好)

一些信息:

there are a lot of rules to express various …

Run Code Online (Sandbox Code Playgroud)

python parsing nlp machine-learning information-extraction

Nur*_*rse

2010 10-25

13
推荐指数

2
解决办法

3890
查看次数

如何将依赖路径编码为分类功能？

我试图在动词对之间实现关系提取.我想使用从一个动词到另一个动词的依赖路径作为我的分类器的一个特征(预测关系X是否存在).但我不确定如何将依赖路径编码为一个功能.以下是一些示例依赖路径,作为与StanfordCoreNLP Collapsed Dependencies的空格分隔关系注释:

nsubj acl nmod:from acl nmod:by conj:and
nsubj nmod:into
nsubj acl:relcl advmod nmod:of

Run Code Online (Sandbox Code Playgroud)

重要的是要记住,这些路径长度可变,并且可以不受任何限制地重新出现这种关系.

我想到的两种对这种功能进行编码的折衷方法是:

1)忽略序列,每个关系只有一个特征,其值是它在路径中出现的次数

2)具有长度为n的滑动窗口,并且对于每个可能的关系对具有一个特征,其值是这两个关系连续出现的次数.我想这是编码n-gram的方式.但是,可能关系的数量是50,这意味着我不能真正采用这种方法.

欢迎任何建议.

nlp machine-learning feature-extraction information-extraction stanford-nlp

Sye*_*tan

lucky-day

12
推荐指数

1
解决办法

786
查看次数

使用DBPedia的示例python脚本？

我正在编写一个python脚本,从几个国家和语言的数千篇新闻文章的集合中提取"实体名称".

我想利用令人惊叹的DBPedia结构化knwoledge,例如查找"埃及艺术家"的名字和"加拿大公司"的名称.

(如果这些信息是SQL形式的,我就没有问题了.)

我更愿意下载DBPedia内容并离线使用它.有什么需要这样做的想法以及如何从python本地查询？

python mysql sparql information-extraction dbpedia

jaz*_*jaz

lucky-day

11
推荐指数

2
解决办法

5587
查看次数

信息提取和文本挖掘有什么区别？

它看起来很容易.但我很困惑.

文本挖掘和信息提取有什么区别？

nlp information-retrieval text-mining information-extraction

Jay*_*raj

lucky-day

11
推荐指数

1
解决办法

6082
查看次数

NLP用于从文本中提取动作

我希望有人可以指出我正确的方向来学习从一堆文本中分离出行动.

假设我有这个文本

Drop off the dry cleaning, and go to the corner store and pick-up a jug of milk and get a pint of strawberries.
Then, go pick up the kids from school. First, get John who is in the daycare next to the library, and then get Sam who is two blocks away. 
By the time you've got the kids, you'll need to stop by the doctors office for the perscription. Tim's flight arrives at 4pm. 
It's American Airlines …

nlp machine-learning information-extraction pos-tagger sentence

ped*_*ete

2016 10-13

10
推荐指数

1
解决办法

2137
查看次数