小编Luc*_*ini的帖子

使用spacy西班牙语Tokenizer

我总是使用英语或德语的spacy库.

要加载库,我使用了以下代码:

import spacy
nlp = spacy.load('en')

Run Code Online (Sandbox Code Playgroud)

我想使用西班牙语tokeniser,但我不知道怎么做,因为spacy没有西班牙语模型.我试过这个

python -m spacy download es

Run Code Online (Sandbox Code Playgroud)

然后:

nlp = spacy.load('es')

Run Code Online (Sandbox Code Playgroud)

但显然没有任何成功.

有人知道如何以正确的方式用西班牙语标记西班牙语句子吗？

python nlp tokenize spacy

Luc*_*ini

lucky-day

5
推荐指数

1
解决办法

1223
查看次数

禁用Flowable/Observable Buffer

我遇到的问题始终是使用combineLatest运算符获得的组合中的最后一个值.

我有2个热流道(a,b)以高频率生成事件(每100毫秒一个事件):

Flowable<OrderBook> flowA = sourceA.getObservableOrderBook(value);
Flowable<OrderBook> flowB = sourceB.getObservableOrderBook(value);

Run Code Online (Sandbox Code Playgroud)

结合combineLatest,需要将近300毫秒才能完成它的工作.

Flowable<OrderBookCouple> combined = Flowable.combineLatest(flowA, flowB,        OrderBookCouple::new).observeOn(Schedulers.newThread());
combined.subscribe((bookCouple) -> {
                System.out.println("A timestamp: " + bookCouple.aOrderBook.getTimeStamp());
                System.out.println("B timestamp: " + bookCouple.bOrderBook.getTimeStamp());
                Thread.sleep(300);
            }

Run Code Online (Sandbox Code Playgroud)

在一次执行组合器之后,我想处理最后生成的事件组合,意思是(lastA,lastB).

组合流的默认行为是将所有事件组合缓存在其自己的缓冲区中,以便组合流可以接收非常旧的组合,并且此时间隙正在爆炸.

我应该如何更改我的代码以禁用此缓冲区并始终接收最后一个组合？

java reactive-programming java-8 rx-java rx-java2

Luc*_*ini

2017 07-11

4
推荐指数

1
解决办法

344
查看次数