标签: snowball

CREATE TEXT SEARCH DICTIONARY my_lang_ispell (
    TEMPLATE = ispell,
    DictFile = path_to_my_lang_dict_file,
    AffFile = path_to_my_lang_affixes_file,
    StopWords = path_to_my_lang_astop_words_file
);

Run Code Online (Sandbox Code Playgroud)

但如何找到最相关的DictFile、AffFile、和StopWords文件呢？例如，snowball源不包含此语言。

那么，有人可以帮助我找到获取ispell、aspell、snowball或其他乌克兰语词典的最佳方法吗？

谢谢！

postgresql dictionary full-text-search snowball ispell

Sas*_* B.

lucky-day

7
推荐指数

1
解决办法

555
查看次数

将多种词干语言与 ElasticSearch 结合使用

我正在为一个网站构建一个搜索引擎，其中用户可以来自许多不同的国家并发布文本内容。

我会考虑： - 法语生成法语和英语的内容 - 德语生成德语和英语的内容等...

我想知道是否可以同时使用不同的雪球词干语言进行搜索，以便我们同时获得适当的结果。

我们是否必须为每个雪球词干语言创建一个索引？

这种情况有已知的模式吗？

谢谢

lucene stemming snowball elasticsearch

Seb*_*ber

2012 06-15

5
推荐指数

1
解决办法

2767
查看次数

向pystemmer添加语言

我想用pystemmer用whoosh,但对于我的语言的支持.

我为我的语言(Snowball)找到了两个雪球文件,我按照这里的建议制作了*.c文件.

现在我想在pystemmer中包含*.c文件.我将它们添加到源代码,iI编辑了我找到的语言文件链接/列表的所有文件,但是在安装pystemmer(从源代码)之后我仍然无法使用我的语言 - 它不在列表中Stemmer.algorithms().

我究竟做错了什么？

python stemming snowball

use*_*555

2017 05-23

5
推荐指数

0
解决办法

668
查看次数

Snowball Stemmer用法

我想在这里使用词干分析器来合并字数.
http://snowball.tartarus.org/download.html
该页面有一个下载链接,但我不确定如何将文件集成到我的eclipse项目中
它不仅仅是一个放入我的lib文件夹的jar,它是一个文件系统.有没有人知道解释这个的一些文件,因为我在网站上没有看到任何文件.
(如,我要导入什么,如何调用它等...)

java stemming snowball

Lem*_*nio

2016 11-22

5
推荐指数

1
解决办法

9474
查看次数

德语扼杀Python NLTK中的情感分析

我最近开始研究关于德语文本的情绪分析项目,我计划使用词干分析器来改善结果.

NLTK配有德国Snowball Stemmer并且我已经尝试过使用它,但我不确定结果.也许它应该是这样的,但作为一个计算机科学家,而不是一个语言学家,我有一个问题,变形动词形式源于不同的词干.

取"suchen"(搜索)这个词,对于第一人称单数而言应该是"这样的",而对于第三人称单数则是"如此".

我知道还有词形还原,但据我所知,没有可用的德语引理器集成到NLTK中.有GermaNet,但他们的NLTK集成似乎已经中止.

重点:我想将变形动词形式归结为相同的词干,至少对于同一时态内的常规动词.如果这对我的目标不是一个有用的要求,请告诉我原因.如果是,您是否知道可以使用哪些其他资源来帮助我实现这一目标？

编辑:我忘了提及,任何软件都应该可以免费用于教育和研究目的.

python stemming snowball nltk sentiment-analysis

Flo*_*ian

2017 06-13

5
推荐指数

1
解决办法

3579
查看次数

SnowballStemmer为俄语单词列表

我知道如何在单个单词上执行SnowballStemmer(在我的情况下,在俄语单词上).做下一件事:

from nltk.stem.snowball import SnowballStemmer 

stemmer = SnowballStemmer("russian") 
stemmer.stem("???????")
'?????'

Run Code Online (Sandbox Code Playgroud)

如果我有一个像['Василий','Геннадий','Виталий']这样的单词列表,我该怎么办呢？

我使用for循环的方法似乎不起作用:(

l=[stemmer.stem(word) for word in l]

Run Code Online (Sandbox Code Playgroud)

python nlp stemming snowball nltk

Kei*_*thx

lucky-day

5
推荐指数

1
解决办法

4555
查看次数

R中的Snowball和SnowballC包是不同的？

我stemDocument用于使用tmR中的包来阻止文本文档.示例代码:

data("crude")
crude[[1]]
stemDocument(crude[[1]])

Run Code Online (Sandbox Code Playgroud)

我收到一条错误消息:

loadNamespace(name)出错:没有名为'Snowball'的包

我已经安装了SnowballC包,无法找到Snowball包.以下是我的sessionInfo():

R version 2.15.3 (2013-03-01)
Platform: x86_64-apple-darwin9.8.0/x86_64 (64-bit)

locale:
[1] en_CA.UTF-8/en_CA.UTF-8/en_CA.UTF-8/C/en_CA.UTF-8/en_CA.UTF-8

attached base packages:
[1] stats     graphics  grDevices utils     datasets  methods   base     

other attached packages:
[1] SnowballC_0.5 tm_0.5-8.3   

loaded via a namespace (and not attached):
[1] slam_0.1-31  tools_2.15.3

Run Code Online (Sandbox Code Playgroud)

它需要任何其他包裹还是雪球？

r stemming snowball tm

Ram*_*Ram

2016 07-09

3
推荐指数

2
解决办法

1万
查看次数

Snowball Stemmer : 糟糕的法语词干

我正在处理一些 nlp 任务。我的输入是法语文本，因此在我的上下文中只有 Snowball Stemmer 可用。但不幸的是，它不断给我可怜的茎，因为它甚至不会删除plural "s"或silent e。下面是一些例子：

from nltk.stem import SnowballStemmer
SnowballStemmer("french").stem("pommes, noisettes dorées & moelleuses, la boîte de 350g")
Output: 'pommes, noisettes dorées & moelleuses, la boîte de 350g'

Run Code Online (Sandbox Code Playgroud)

python stemming snowball nltk french

Ner*_*ksi

2018 07-01

1
推荐指数

1
解决办法

2248
查看次数