标签: lexicon

什么是"正交性"?

在谈论编程语言时,"正交性"意味着什么?

什么是正交性的例子?

language-agnostic terminology lexicon

120
推荐指数
6
解决办法
4万
查看次数

C++存储,加载和查找词典的最有效方法

我有一个字典,包括单词和他们的语音转录.这些单词都是小写的,因此不涉及区分大小写的搜索.

词典非常庞大,我需要在应用程序启动时快速加载它.我更喜欢阅读它而无需单独阅读每个条目.

我想我存储和加载它的方式也会影响我如何将词典保存在内存中

谢谢你的任何想法.

c++ dictionary lexicon

7
推荐指数
1
解决办法
1975
查看次数

俄语 - 英语平行词语料库?

我正在寻找一个简单的俄语到英语单词语料库.它可以像csv一样简单,在第一列中列出俄语单词,在第二列中列出相应的英语单词.我能找到这样的想法吗?NLTK工具包有这样的东西吗?

谢谢

python translation corpus lexicon

5
推荐指数
1
解决办法
707
查看次数

在 Python 中创建词典和扫描仪

我是编码世界的新手,我没有受到非常热烈的欢迎。我一直在尝试通过在线教程http://learnpythonthehardway.org/book/学习 python 。在练习 48 和 49 之前,我一直在努力地读完这本书。这就是他让学生们放松并说“你想通了”的地方。但我根本做不到。我知道我需要创建一个可能单词的词典,并且我需要扫描用户输入以查看它是否与词典中的任何内容匹配,但仅此而已!据我所知,我需要创建一个名为 lexicon 的列表:

lexicon = [
    ('directions', 'north'),
    ('directions', 'south'),
    ('directions', 'east'),
    ('directions', 'west'),
    ('verbs', 'go'),
    ('verbs', 'stop'),
    ('verbs', 'look'),
    ('verbs', 'give'),
    ('stops', 'the'),
    ('stops', 'in'),
    ('stops', 'of'),
    ('stops', 'from'),
    ('stops', 'at')
]
Run Code Online (Sandbox Code Playgroud)

那正确吗?我不知道接下来要做什么?我知道列表中的每一项都称为元组,但这对我来说并没有什么意义。如何获取原始输入并将其分配给元组?你知道我的意思?因此,在练习 49 中,他导入了词典,并在 python 内部打印 lexicon.scan("input") 并返回元组列表,例如:

from ex48 import lexicon
>>> print lexicon.scan("go north")
[('verb', 'go'), ('direction', 'north')]
Run Code Online (Sandbox Code Playgroud)

'scan()' 是一个预定义的函数还是他在 lexicon 模块中创建了这个函数?我知道,如果您使用“split()”,它会创建一个包含输入中所有单词的列表,但是它如何将“go”分配给元组(“verb”、“go”)?

我是不是很远?我知道我问了很多,但我到处搜索了几个小时,我无法自己解决这个问题。请帮忙!我会永远爱你!

python lexicon

5
推荐指数
1
解决办法
8425
查看次数

用于情感分析的 Python VADER 词典结构

我正在使用 Python nltk 库中的 VADER 情感词典来分析文本情感。这个词典不太适合我的领域,所以我想将我自己的情感分数添加到各种单词中。因此,我使用了词典文本文件 (vader_lexicon.txt) 来做到这一点。但是,我不太了解这个文件的架构。例如,像obliterate这样的单词将在文本文件中包含以下数据:obliterate -2.9 0.83066 [-3, -4, -3, -3, -3, -3, -2, -1, -4, - 3]

显然 -2.9 是列表中情绪分数的平均值。但 0.83066 代表什么?

谢谢!

python nltk lexicon vader

3
推荐指数
1
解决办法
1761
查看次数

NLTK的Vader评分文字示例

我希望有人能纠正我对VADER如何评分文字的理解。我在这里已阅读了此过程的说明,但是在重新创建它描述的过程时,我无法将测试句子的综合得分与Vader的输出相匹配。假设我们有这样的句子:

"I like using VADER, its a fun tool to use"
Run Code Online (Sandbox Code Playgroud)

VADER拿起的单词是“喜欢”(+1.5分)和“有趣”(+2.3分)。根据文档,将这些值相加(等于+3.8),然后使用以下函数将其标准化为0到1之间的范围:

(alpha = 15)
x / x2 + alpha 
Run Code Online (Sandbox Code Playgroud)

根据我们的数字,这应该变成:

3.8 / 14.44 + 15 = 0.1290
Run Code Online (Sandbox Code Playgroud)

但是,VADER输出的复合分数如下:

Scores: {'neg': 0.0, 'neu': 0.508, 'pos': 0.492, 'compound': 0.7003}
Run Code Online (Sandbox Code Playgroud)

我的推理哪里出错了?曾多次问过类似的问题,但是尚未提供VADER分类的实际示例。任何帮助,将不胜感激。

python nlp nltk lexicon vader

2
推荐指数
1
解决办法
532
查看次数

词典在MarkLogic中如何工作?

如何lexicons从不同indexesMarklogic

请举例说明。

indexing marklogic lexicon

1
推荐指数
1
解决办法
68
查看次数

Marklogic 值词典和词词典

根据文档:值词典是通过配置范围索引创建的。可以为整个数据库或特定元素或属性创建 Word 词典。

这是否意味着创建单词词典不需要范围索引?范围索引在创建唯一的单词/值列表中起什么作用?

marklogic lexicon

1
推荐指数
1
解决办法
116
查看次数