小编dim*_*mid的帖子

数据库用户"postgres"不是安装用户

我正在尝试将postgres从9.5升级到9.6. brew upgrade postgresql成功,但在跑步时

pg_upgrade -b /usr/local/Cellar/postgresql/9.5.3/bin/ -B /usr/local/Cellar/postgresql/9.6.1/bin/ -d /usr/local/var/postgres -D /usr/local/var/postgres9.6 -U postgres
Run Code Online (Sandbox Code Playgroud)

我收到一个错误

Performing Consistency Checks
-----------------------------
Checking cluster versions                                   ok
Checking database user is the install user
database user "postgres" is not the install user
Failure, exiting
Run Code Online (Sandbox Code Playgroud)

当没有-U postgres在最后尝试它甚至更奇怪

Performing Consistency Checks
-----------------------------
Checking cluster versions                                   ok
Checking database user is the install user                  ok
Checking database connection settings                       ok
Checking for prepared transactions                          ok
Checking for reg* system OID user data types …
Run Code Online (Sandbox Code Playgroud)

postgresql macos

5
推荐指数
2
解决办法
1966
查看次数

对类似 TEI 的文本进行标记

我正在尝试使用 spaCy 来标记文本文档,其中命名实体包装在 XML 标签中。例如TEI<personName>Harry</personName> goes to <orgName>Hogwarts</orgName>

import spacy

nlp = spacy.load('en')
txt = '<personName>Harry</personName> goes to <orgName>Hogwarts</orgName>. <personName>Sally</personName> lives in <locationName>London</locationName>.'
doc = nlp(txt)
sents = list(doc.sents)
for i, s in enumerate(doc.sents):
    print("{}: {}".format(i, s))
Run Code Online (Sandbox Code Playgroud)

然而,XML 标签会导致句子分裂:

0: <personName>
1: Harry</personName> goes to <orgName>
2: Hogwarts</orgName>.
3: <personName>
4: Sally</personName> lives in <
5: locationName>
6: London</locationName>.
Run Code Online (Sandbox Code Playgroud)

我怎样才能得到只有2句话?我知道 spaCy 支持自定义标记生成器,但由于文本的其余部分是标准的,我想继续使用内置标记生成器,或者可能在其之上构建以识别 XML 注释。

python nlp named-entity-recognition tokenize spacy

5
推荐指数
1
解决办法
421
查看次数

Vim键映射不匹配

我使用vim在ruby和python中编码,我vimrc有一个设置可以轻松输入断点:

au FileType python  map <silent> <leader>b oimport ipdb; ipdb.set_trace()<esc>
au FileType python  map <silent> <leader>B Oimport ipdb; ipdb.set_trace()<esc>
au FileType ruby    map <silent> <leader>b orequire 'pry'; binding.pry<esc>
au FileType ruby    map <silent> <leader>B Orequire 'pry'; binding.pry<esc>
Run Code Online (Sandbox Code Playgroud)

但是,偶尔我会得到错误的命令,例如ipdb在ruby文件中,我必须重新启动vim.可能是什么问题呢?

ruby python vim

4
推荐指数
1
解决办法
74
查看次数

跳过after_commit进行销毁

我想跳过一个对象after_commit时的回调destroy,而无需使用on语法明确指定方法列表。即类似:

after_commit :foo, except: [:destroy]
Run Code Online (Sandbox Code Playgroud)

ruby activerecord ruby-on-rails

4
推荐指数
3
解决办法
2570
查看次数

Lucene正则表达式中的单词边界

我想在Elastisearch中使用单词边界进行正则表达式查询,但是看起来Lucene正则表达式引擎不支持\b。我可以使用哪些解决方法?

regex lucene elasticsearch

4
推荐指数
1
解决办法
708
查看次数

为什么`git add -p`不暂存未跟踪的文件?

我创建了一个新文件foo.rb

$ git add -p foo.rb

$ No changes.

但是,添加没有用-p。这是错误还是功能?我希望它可以让我暂存文件的某些部分。

git

3
推荐指数
1
解决办法
378
查看次数

在haskell中将类型包含在其定义中的目的是什么?

我是haskell的初学者,我想知道定义新类型的正确方法.假设我想定义一个Point类型.在命令式语言中,它通常相当于:

data Point = Int Int
Run Code Online (Sandbox Code Playgroud)

但是在haskell中,我通常会看到如下定义:

data Point = Point Int Int
Run Code Online (Sandbox Code Playgroud)

有什么区别以及何时应该使用每种方法?

haskell

3
推荐指数
1
解决办法
108
查看次数

在 activerecord 中自动重命名外键

我正在进行 Rails 迁移以重命名表,并且我想自动重命名其外键。例如 aUser有很多posts,我重命名UserPerson

def change
  rename_table :users, :people
end
Run Code Online (Sandbox Code Playgroud)

我想创建自动迁移,例如

def change
  rename_column :posts, :user_id, :person_id
end
Run Code Online (Sandbox Code Playgroud)

我想过从迁移中获取模型并查看其has_many模型,例如,如本答案中所述。有没有更简单的方法?

ruby activerecord ruby-on-rails rails-migrations

3
推荐指数
1
解决办法
2569
查看次数

Monoid如何协助并行训练?

HLearn的自述文件指出Monoid类型类用于并行批处理训练.我已经trainMonoid在几个文件中看到了提到,但是我很难剖析这个庞大的代码库.有人可以用初学者友好的术语解释它是如何工作的?我想它与关联属性有某种关系.

parallel-processing haskell machine-learning monoids

3
推荐指数
1
解决办法
205
查看次数

仅从 jq 中的外部文件中过滤特定键

我有一个具有以下格式的 JSON 文件:

[
  {
    "id": "00001",
    "attr": {
      "a": "foo",
      "b": "bar",
      ...
    }
  },
  {
    "id": "00002",
    "attr": {
      ...
    },
    ...
  },
...
]
Run Code Online (Sandbox Code Playgroud)

和一个带有 id 列表的文本文件,每行一个。我想jq仅用于过滤文本文件中提及其 ID 的记录。即如果列表包含“00001”,则只应打印第一个。

请注意,我不能简单地grep因为每个记录可能具有任意数量的属性和子属性。

select json filtering identifier jq

3
推荐指数
1
解决办法
834
查看次数