小编use*_*704的帖子

如何使用TermVector Lucene 4.0

在索引方法中,我使用以下行:

Field contentsField = new Field("contents", new FileReader(f), Field.TermVector.YES);
Run Code Online (Sandbox Code Playgroud)

但是,在Lucene 4.0中,不推荐使用此构造函数,而new TextField应使用它来代替new Field.

但问题TextField是它TermVector在构造函数中不接受.

有没有办法在使用新构造函数的Lucene 4.0索引中包含Term Vector?

谢谢

java lucene search

11
推荐指数
2
解决办法
6696
查看次数

使用(NLP)GAM工具为命名实体

我可以在我的java程序中使用GATE http://gate.ac.uk/来提取命名实体.如果是的话,你能举一些例子或指导我参考吗?谢谢

nlp gate

5
推荐指数
1
解决办法
3873
查看次数

如何获取String中所有匹配的位置?

我有一个文本文档和一个查询(查询可能不止一个单词).我想在文档中找到所有出现的查询的位置.

我想到了documentText.indexOf(query)或使用正则表达式,但我无法使它工作.

我最终得到以下方法:

首先,我创建了一个名为的dataType QueryOccurrence

public class QueryOccurrence implements Serializable{
  public QueryOccurrence(){}
  private int start;
  private int end;      

  public QueryOccurrence(int nameStart,int nameEnd,String nameText){
    start=nameStart;
    end=nameEnd;        
  }

  public int getStart(){
    return start;
  }

  public int getEnd(){
    return end;
  }

  public void SetStart(int i){
    start=i;
  }

  public void SetEnd(int i){
     end=i;
  }
}
Run Code Online (Sandbox Code Playgroud)

然后,我在以下方法中使用了此数据类型:

    public static List<QueryOccurrence>FindQueryPositions(String documentText, String query){

    // Normalize do the following: lower case, trim, and remove punctuation
    String normalizedQuery = Normalize.Normalize(query);
    String normalizedDocument = Normalize.Normalize(documentText);

    String[] …
Run Code Online (Sandbox Code Playgroud)

java string match

5
推荐指数
1
解决办法
8022
查看次数

在Mac 10.9.2上安装WordNet

我正在尝试在Mac上安装WordNet(OS 10.9.2).我尝试了以下内容

  1. ./配置
  2. 使

但是在make我遇到一些错误的时候.然后我安装了XQuartz-2.7.5.我还是遇到了一些错误make.接下来,我已经安装了Xcode,但仍然没有解决问题.这个问题建议安装Tcl/TK,我尝试了但是我仍然遇到了以下错误make

/Applications/Xcode.app/Contents/Developer/usr/bin/make  all-recursive
Making all in doc
Making all in html
make[3]: Nothing to be done for `all'.
Making all in man
make[3]: Nothing to be done for `all'.
Making all in pdf
make[3]: Nothing to be done for `all'.
Making all in ps
make[3]: Nothing to be done for `all'.
make[3]: Nothing to be done for `all-am'.
Making all in dict
make[2]: Nothing to be done for `all'. …
Run Code Online (Sandbox Code Playgroud)

macos tk-toolkit tcl wordnet osx-mavericks

3
推荐指数
1
解决办法
1525
查看次数

如何删除R ggplot中的轴标记

我有一个用 ggplot 绘制的图。我不需要轴值,我使用axis.text.x = element_blank()和成功删除了该轴值axis.text.y = element_blank()。然而,我已经将轴标记为“x 和 y 行中每个值末尾的小线”,我将它们放在小红色圆圈中以进行澄清。如果有人知道如何摆脱这些,我受伤了。

这是我的代码:

library(ggplot2)
library(plyr)
weights1    <-read.csv ("./EN_ALPHA_WHIGHTS.csv")
ca          <- ddply(weights1, "comb", transform,  percent_weight = pers / sum(pers) *  100)
ggplot(ca, aes(x=comb, y=percent_weight, fill=alpha))+geom_bar(stat="identity")+xlab("")+ylab("")+theme(legend.position="none",axis.text.x = element_blank(),axis.text.y = element_blank())+theme(legend.title=element_blank(),legend.text = element_text(colour = 'gray', angle = 45, size = 3, hjust = 3, vjust = 3))
Run Code Online (Sandbox Code Playgroud)

非常感谢

在此输入图像描述

r ggplot2 axis-labels

1
推荐指数
1
解决办法
1357
查看次数

标签 统计

java ×2

axis-labels ×1

gate ×1

ggplot2 ×1

lucene ×1

macos ×1

match ×1

nlp ×1

osx-mavericks ×1

r ×1

search ×1

string ×1

tcl ×1

tk-toolkit ×1

wordnet ×1