标签: phrase

我如何从mysql中获取月份

我希望能够使用如下语句从mysql中获取结果:

SELECT * 
  FROM table 
 WHERE amount > 1000 
Run Code Online (Sandbox Code Playgroud)

但是我想把结果限制在一个月和一年(根据用户的输入)......我试着这样:

SELECT * 
  FROM table 
 WHERE amount > 1000 
   AND dateStart = MONTH('$m')   
Run Code Online (Sandbox Code Playgroud)

... $m是一个月,但它给了错误.

在该表中,它实际上有两个日期: startDateendDate,但我注重startDate.输入值为月份和年份.如何根据当年的那个月来说明获得结果的SQL语句?

php mysql sql phrase

23
推荐指数
2
解决办法
7万
查看次数

具体到编程世界,"海龟一路走下去"是什么意思?

我经常听到这句话,并不完全理解它的含义.这是什么意思?如果可能的话,有一个例子吗?

谢谢!

idioms phrase

9
推荐指数
2
解决办法
3745
查看次数

使用Stanford Parser(CoreNLP)查找短语头

我将使用Stanford Corenlp 2013找到短语标题.我看到了这个帖子.

但是,答案对我来说并不清楚,我无法添加任何评论来继续该线程.所以,我很抱歉重复.

我现在所拥有的是一个句子的解析树(使用Stanford Corenlp)(我也尝试过由Stanford Corenlp创建的CONLL格式).而我所需要的只是名词短语的头部.

我不知道如何使用依赖关系和解析树来提取名词短语的头部.我所知道的是,如果我有nsubj (x, y),y是主题的头.如果我有dobj(x,y),y是直接对象的头部.我有iobj(x,y),y是间接对象的头.

但是,我不确定这种方式是否是查找所有词组头的正确方法.如果是,我应该添加哪些规则来获取所有名词短语?

也许,值得一提的是,我需要在java代码中使用名词短语的头部.

java nlp phrase stanford-nlp

8
推荐指数
2
解决办法
4683
查看次数

弹性搜索精确短语匹配

我是ES的新手.我无法找到确切的短语匹配.

假设我的索引有一个名为movie_name的字段.假设我有3个具有以下值的文档

  1. movie_name =疯狂的麦克斯
  2. movie_name = mad max
  3. movie_name = mad max 3d

如果我的搜索查询是Mad Max,我希望返回前2个文档而不是第3个.

如果我执行"not_analyzed"解决方案,我将只获得文档1而不是2.

我错过了什么?

search phrase elasticsearch

8
推荐指数
1
解决办法
4397
查看次数

Solr:使用EdgeNGramFilterFactory进行精确短语查询

在Solr(3.3)中,是否可以通过字母逐字母搜索EdgeNGramFilterFactory并且对短语查询敏感?

例如,我正在寻找一个字段,如果包含"contrat informatique",将在用户输入时找到:

  • contrat
  • INFORMATIQUE
  • 对照
  • Informa公司
  • "contrat informatique"
  • "contrat info"

目前,我做了这样的事情:

<fieldtype name="terms" class="solr.TextField">
    <analyzer type="index">
        <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <tokenizer class="solr.LowerCaseTokenizerFactory"/>
        <filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="15" side="front"/>
    </analyzer>
    <analyzer type="query">
        <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <tokenizer class="solr.LowerCaseTokenizerFactory"/>
    </analyzer>
</fieldtype>
Run Code Online (Sandbox Code Playgroud)

...但是短语查询失败了.

当我在solr admin中查看模式分析器时,我发现"contrat informatique"生成了以下标记:

[...] contr contra contrat in inf info infor inform [...]
Run Code Online (Sandbox Code Playgroud)

因此查询使用"contrat in"(连续令牌),但不使用"contrat inf"(因为这两个令牌是分开的).

我很确定任何类型的词干都可以用短语查询,但我找不到正确的过滤器标记器来使用之前EdgeNGramFilterFactory.

solr tokenize phrase

7
推荐指数
2
解决办法
1万
查看次数

在phrasequery上搜索text_general字段时出现Solr错误500

获取查询错误:

LNm:"PersonLastName III"

响应是:"field \"LNm \"被索引没有位置数据;无法运行PhraseQuery'

架构是:

<field name="LNm" type="text_general" indexed="true" stored="true"/>

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>

    <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
</fieldType>
Run Code Online (Sandbox Code Playgroud)

solr phrase

7
推荐指数
1
解决办法
3117
查看次数

在Python 3.3.2中计算短语频率

我一直在网上研究不同的来源,并尝试了各种方法,但只能找到如何计算独特单词的频率而不是唯一的短语.我到目前为止的代码如下:

import collections
import re
wanted = set(['inflation', 'gold', 'bank'])
cnt = collections.Counter()
words = re.findall('\w+', open('02.2003.BenBernanke.txt').read().lower())
for word in words:
    if word in wanted:
        cnt [word] += 1
print (cnt)
Run Code Online (Sandbox Code Playgroud)

如果可能的话,我还想计算本文中使用短语"中央银行"和"高通胀"的次数.我感谢您给出的任何建议或指导.

python frequency count phrase python-3.x

6
推荐指数
1
解决办法
3535
查看次数

如何在倒排索引结构中搜索短语查询?

如果我们想在反向索引结构中搜索像这样的查询“ t1 t2 t3”(t1,t2,t3必须排队),该怎么办?

1-首先,我们搜索“ t1”项,找到包含“ t1”的所有文档,然后对“ t2”然后是“ t3”进行此操作。然后找到位置“ t1”,“ t2”和“ t3”彼此相邻的文档。

2-首先,我们搜索“ t1”项并找到包含“ t1”的所有文档,然后在找到的所有文档中搜索“ t2”,然后在此结果中找到包含“ t3”的文档“。

我有一个完整的倒排索引。我想知道上面的哪些方法是优化的(1)或(2)?

非常感谢。

search phrase inverted-index

5
推荐指数
1
解决办法
2781
查看次数

如何防止在 NLTK 中拆分特定的单词或短语和数字?

当我对分割特定单词、日期和数字的文本进行标记化时,我在文本匹配方面遇到了问题。在 NLTK 中标记单词时,如何防止诸如“在我的家人中跑步”、“步行 30 分钟”或“每天 4 次”之类的短语分裂?

它们不应导致:

['runs','in','my','family','4x','a','day']
Run Code Online (Sandbox Code Playgroud)

例如:

是的,我每天骑自行车 20-30 分钟,效果很好!!

给出:

['yes','20-30','minutes','a','day','on','my','bike',',','it','works','great']
Run Code Online (Sandbox Code Playgroud)

我希望将“20-30 分钟”视为一个词。我怎样才能得到这种行为>?

python tokenize nltk phrase

5
推荐指数
2
解决办法
2394
查看次数

Elastic Search 匹配短语查询 -&gt; 输出不可预测

示例文档

{
  "id": 5,
  "title": "Quick Brown fox jumps over the lazy dog",
  "genre": [
    "fiction"
  ]
}
Run Code Online (Sandbox Code Playgroud)

映射

{
  "movies" : {
    "mappings" : {
      "properties" : {
        "genre" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "id" : {
          "type" : "long"
        },
        "title" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    } …
Run Code Online (Sandbox Code Playgroud)

phrase elasticsearch elasticsearch-query

5
推荐指数
1
解决办法
91
查看次数