标签: phrase

我如何从mysql中获取月份

我希望能够使用如下语句从mysql中获取结果:

SELECT * 
  FROM table 
 WHERE amount > 1000

Run Code Online (Sandbox Code Playgroud)

但是我想把结果限制在一个月和一年(根据用户的输入)......我试着这样:

SELECT * 
  FROM table 
 WHERE amount > 1000 
   AND dateStart = MONTH('$m')

Run Code Online (Sandbox Code Playgroud)

... $m是一个月,但它给了错误.

在该表中,它实际上有两个日期: startDate和endDate,但我注重startDate.输入值为月份和年份.如何根据当年的那个月来说明获得结果的SQL语句？

php mysql sql phrase

net*_*rox

2010 01-11

23
推荐指数

2
解决办法

7万
查看次数

具体到编程世界,"海龟一路走下去"是什么意思？

我经常听到这句话,并不完全理解它的含义.这是什么意思？如果可能的话,有一个例子吗？

谢谢!

idioms phrase

Mar*_*tto

lucky-day

9
推荐指数

2
解决办法

3745
查看次数

使用Stanford Parser(CoreNLP)查找短语头

我将使用Stanford Corenlp 2013找到短语标题.我看到了这个帖子.

但是,答案对我来说并不清楚,我无法添加任何评论来继续该线程.所以,我很抱歉重复.

我现在所拥有的是一个句子的解析树(使用Stanford Corenlp)(我也尝试过由Stanford Corenlp创建的CONLL格式).而我所需要的只是名词短语的头部.

我不知道如何使用依赖关系和解析树来提取名词短语的头部.我所知道的是,如果我有nsubj (x, y),y是主题的头.如果我有dobj(x,y),y是直接对象的头部.我有iobj(x,y),y是间接对象的头.

但是,我不确定这种方式是否是查找所有词组头的正确方法.如果是,我应该添加哪些规则来获取所有名词短语？

也许,值得一提的是,我需要在java代码中使用名词短语的头部.

java nlp phrase stanford-nlp

Ali*_*989

2017 05-23

8
推荐指数

2
解决办法

4683
查看次数

弹性搜索精确短语匹配

我是ES的新手.我无法找到确切的短语匹配.

假设我的索引有一个名为movie_name的字段.假设我有3个具有以下值的文档

movie_name =疯狂的麦克斯
movie_name = mad max
movie_name = mad max 3d

如果我的搜索查询是Mad Max,我希望返回前2个文档而不是第3个.

如果我执行"not_analyzed"解决方案,我将只获得文档1而不是2.

我错过了什么？

search phrase elasticsearch

use*_*345

lucky-day

8
推荐指数

1
解决办法

4397
查看次数

Solr:使用EdgeNGramFilterFactory进行精确短语查询

在Solr(3.3)中,是否可以通过字母逐字母搜索EdgeNGramFilterFactory并且对短语查询敏感？

例如,我正在寻找一个字段,如果包含"contrat informatique",将在用户输入时找到:

contrat
INFORMATIQUE
对照
Informa公司
"contrat informatique"
"contrat info"

目前,我做了这样的事情:

<fieldtype name="terms" class="solr.TextField">
    <analyzer type="index">
        <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <tokenizer class="solr.LowerCaseTokenizerFactory"/>
        <filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="15" side="front"/>
    </analyzer>
    <analyzer type="query">
        <charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt"/>
        <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="0" splitOnCaseChange="1"/>
        <tokenizer class="solr.LowerCaseTokenizerFactory"/>
    </analyzer>
</fieldtype>

Run Code Online (Sandbox Code Playgroud)

...但是短语查询失败了.

当我在solr admin中查看模式分析器时,我发现"contrat informatique"生成了以下标记:

[...] contr contra contrat in inf info infor inform [...]

Run Code Online (Sandbox Code Playgroud)

因此查询使用"contrat in"(连续令牌),但不使用"contrat inf"(因为这两个令牌是分开的).

我很确定任何类型的词干都可以用短语查询,但我找不到正确的过滤器标记器来使用之前EdgeNGramFilterFactory.

solr tokenize phrase

Xav*_*ois

2011 10-01

7
推荐指数

2
解决办法

1万
查看次数

在phrasequery上搜索text_general字段时出现Solr错误500

获取查询错误:

LNm:"PersonLastName III"

响应是:"field \"LNm \"被索引没有位置数据;无法运行PhraseQuery'

架构是:

<field name="LNm" type="text_general" indexed="true" stored="true"/>

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>

    <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
</fieldType>

Run Code Online (Sandbox Code Playgroud)

solr phrase

p1v*_*nde

2013 10-25

7
推荐指数

1
解决办法

3117
查看次数

在Python 3.3.2中计算短语频率

我一直在网上研究不同的来源,并尝试了各种方法,但只能找到如何计算独特单词的频率而不是唯一的短语.我到目前为止的代码如下:

import collections
import re
wanted = set(['inflation', 'gold', 'bank'])
cnt = collections.Counter()
words = re.findall('\w+', open('02.2003.BenBernanke.txt').read().lower())
for word in words:
    if word in wanted:
        cnt [word] += 1
print (cnt)

Run Code Online (Sandbox Code Playgroud)

如果可能的话,我还想计算本文中使用短语"中央银行"和"高通胀"的次数.我感谢您给出的任何建议或指导.

python frequency count phrase python-3.x

Rau*_*aul

2013 11-12

6
推荐指数

1
解决办法

3535
查看次数

如何在倒排索引结构中搜索短语查询？

如果我们想在反向索引结构中搜索像这样的查询“ t1 t2 t3”（t1，t2，t3必须排队），该怎么办？

1-首先，我们搜索“ t1”项，找到包含“ t1”的所有文档，然后对“ t2”然后是“ t3”进行此操作。然后找到位置“ t1”，“ t2”和“ t3”彼此相邻的文档。

2-首先，我们搜索“ t1”项并找到包含“ t1”的所有文档，然后在找到的所有文档中搜索“ t2”，然后在此结果中找到包含“ t3”的文档“。

我有一个完整的倒排索引。我想知道上面的哪些方法是优化的（1）或（2）？

非常感谢。

search phrase inverted-index

Meh*_*ahi

2010 04-18

5
推荐指数

1
解决办法

2781
查看次数

如何防止在 NLTK 中拆分特定的单词或短语和数字？

当我对分割特定单词、日期和数字的文本进行标记化时，我在文本匹配方面遇到了问题。在 NLTK 中标记单词时，如何防止诸如“在我的家人中跑步”、“步行 30 分钟”或“每天 4 次”之类的短语分裂？

它们不应导致：

['runs','in','my','family','4x','a','day']

Run Code Online (Sandbox Code Playgroud)

例如：

是的，我每天骑自行车 20-30 分钟，效果很好！！

给出：

['yes','20-30','minutes','a','day','on','my','bike',',','it','works','great']

Run Code Online (Sandbox Code Playgroud)

我希望将“20-30 分钟”视为一个词。我怎样才能得到这种行为>？

python tokenize nltk phrase

mm7*_*mm7

2019 04-11

5
推荐指数

2
解决办法

2394
查看次数

Elastic Search 匹配短语查询 -> 输出不可预测

示例文档

{
  "id": 5,
  "title": "Quick Brown fox jumps over the lazy dog",
  "genre": [
    "fiction"
  ]
}

Run Code Online (Sandbox Code Playgroud)

映射

{
  "movies" : {
    "mappings" : {
      "properties" : {
        "genre" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        },
        "id" : {
          "type" : "long"
        },
        "title" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    } …

Run Code Online (Sandbox Code Playgroud)

phrase elasticsearch elasticsearch-query

Sah*_*pta

2020 03-29

5
推荐指数

1
解决办法

91
查看次数