小编dim*_*mid的帖子

数据库用户"postgres"不是安装用户

我正在尝试将postgres从9.5升级到9.6. brew upgrade postgresql成功,但在跑步时

pg_upgrade -b /usr/local/Cellar/postgresql/9.5.3/bin/ -B /usr/local/Cellar/postgresql/9.6.1/bin/ -d /usr/local/var/postgres -D /usr/local/var/postgres9.6 -U postgres

Run Code Online (Sandbox Code Playgroud)

我收到一个错误

Performing Consistency Checks
-----------------------------
Checking cluster versions                                   ok
Checking database user is the install user
database user "postgres" is not the install user
Failure, exiting

Run Code Online (Sandbox Code Playgroud)

当没有-U postgres在最后尝试它甚至更奇怪

Performing Consistency Checks
-----------------------------
Checking cluster versions                                   ok
Checking database user is the install user                  ok
Checking database connection settings                       ok
Checking for prepared transactions                          ok
Checking for reg* system OID user data types …

Run Code Online (Sandbox Code Playgroud)

postgresql macos

dim*_*mid

lucky-day

5
推荐指数

2
解决办法

1966
查看次数

对类似 TEI 的文本进行标记

我正在尝试使用 spaCy 来标记文本文档，其中命名实体包装在 XML 标签中。例如TEI类<personName>Harry</personName> goes to <orgName>Hogwarts</orgName>。

import spacy

nlp = spacy.load('en')
txt = '<personName>Harry</personName> goes to <orgName>Hogwarts</orgName>. <personName>Sally</personName> lives in <locationName>London</locationName>.'
doc = nlp(txt)
sents = list(doc.sents)
for i, s in enumerate(doc.sents):
    print("{}: {}".format(i, s))

Run Code Online (Sandbox Code Playgroud)

然而，XML 标签会导致句子分裂：

0: <personName>
1: Harry</personName> goes to <orgName>
2: Hogwarts</orgName>.
3: <personName>
4: Sally</personName> lives in <
5: locationName>
6: London</locationName>.

Run Code Online (Sandbox Code Playgroud)

我怎样才能得到只有2句话？我知道 spaCy 支持自定义标记生成器，但由于文本的其余部分是标准的，我想继续使用内置标记生成器，或者可能在其之上构建以识别 XML 注释。

python nlp named-entity-recognition tokenize spacy

dim*_*mid

2018 04-09

5
推荐指数

1
解决办法

421
查看次数

Vim键映射不匹配

我使用vim在ruby和python中编码,我vimrc有一个设置可以轻松输入断点:

au FileType python  map <silent> <leader>b oimport ipdb; ipdb.set_trace()<esc>
au FileType python  map <silent> <leader>B Oimport ipdb; ipdb.set_trace()<esc>
au FileType ruby    map <silent> <leader>b orequire 'pry'; binding.pry<esc>
au FileType ruby    map <silent> <leader>B Orequire 'pry'; binding.pry<esc>

Run Code Online (Sandbox Code Playgroud)

但是,偶尔我会得到错误的命令,例如ipdb在ruby文件中,我必须重新启动vim.可能是什么问题呢？

ruby python vim

dim*_*mid

lucky-day

4
推荐指数

1
解决办法

74
查看次数

跳过after_commit进行销毁

我想跳过一个对象after_commit时的回调destroy，而无需使用on语法明确指定方法列表。即类似：

after_commit :foo, except: [:destroy]

Run Code Online (Sandbox Code Playgroud)

ruby activerecord ruby-on-rails

dim*_*mid

2016 07-03

4
推荐指数

3
解决办法

2570
查看次数

Lucene正则表达式中的单词边界

我想在Elastisearch中使用单词边界进行正则表达式查询，但是看起来Lucene正则表达式引擎不支持\b。我可以使用哪些解决方法？

regex lucene elasticsearch

dim*_*mid

lucky-day

4
推荐指数

1
解决办法

708
查看次数

为什么`git add -p`不暂存未跟踪的文件？

我创建了一个新文件foo.rb。

$ git add -p foo.rb

$ No changes.

但是，添加没有用-p。这是错误还是功能？我希望它可以让我暂存文件的某些部分。

git

dim*_*mid

2015 07-21

3
推荐指数

1
解决办法

378
查看次数

在haskell中将类型包含在其定义中的目的是什么？

我是haskell的初学者,我想知道定义新类型的正确方法.假设我想定义一个Point类型.在命令式语言中,它通常相当于:

data Point = Int Int

Run Code Online (Sandbox Code Playgroud)

但是在haskell中,我通常会看到如下定义:

data Point = Point Int Int

Run Code Online (Sandbox Code Playgroud)

有什么区别以及何时应该使用每种方法？

haskell

dim*_*mid

lucky-day

3
推荐指数

1
解决办法

108
查看次数

在 activerecord 中自动重命名外键

我正在进行 Rails 迁移以重命名表，并且我想自动重命名其外键。例如 aUser有很多posts，我重命名User为Person

def change
  rename_table :users, :people
end

Run Code Online (Sandbox Code Playgroud)

我想创建自动迁移，例如

def change
  rename_column :posts, :user_id, :person_id
end

Run Code Online (Sandbox Code Playgroud)

我想过从迁移中获取模型并查看其has_many模型，例如，如本答案中所述。有没有更简单的方法？

ruby activerecord ruby-on-rails rails-migrations

dim*_*mid

2017 05-23

3
推荐指数

1
解决办法

2569
查看次数

Monoid如何协助并行训练？

HLearn的自述文件指出Monoid类型类用于并行批处理训练.我已经trainMonoid在几个文件中看到了提到,但是我很难剖析这个庞大的代码库.有人可以用初学者友好的术语解释它是如何工作的？我想它与关联属性有某种关系.

parallel-processing haskell machine-learning monoids

dim*_*mid

lucky-day

3
推荐指数

1
解决办法

205
查看次数

仅从 jq 中的外部文件中过滤特定键

我有一个具有以下格式的 JSON 文件：

[
  {
    "id": "00001",
    "attr": {
      "a": "foo",
      "b": "bar",
      ...
    }
  },
  {
    "id": "00002",
    "attr": {
      ...
    },
    ...
  },
...
]

Run Code Online (Sandbox Code Playgroud)

和一个带有 id 列表的文本文件，每行一个。我想jq仅用于过滤文本文件中提及其 ID 的记录。即如果列表包含“00001”，则只应打印第一个。

请注意，我不能简单地grep因为每个记录可能具有任意数量的属性和子属性。

select json filtering identifier jq

dim*_*mid

2016 11-01

3
推荐指数

1
解决办法

834
查看次数