我总是使用英语或德语的spacy库.
要加载库,我使用了以下代码:
import spacy
nlp = spacy.load('en')
Run Code Online (Sandbox Code Playgroud)
我想使用西班牙语tokeniser,但我不知道怎么做,因为spacy没有西班牙语模型.我试过这个
python -m spacy download es
Run Code Online (Sandbox Code Playgroud)
然后:
nlp = spacy.load('es')
Run Code Online (Sandbox Code Playgroud)
但显然没有任何成功.
有人知道如何以正确的方式用西班牙语标记西班牙语句子吗?
我遇到的问题始终是使用combineLatest运算符获得的组合中的最后一个值.
我有2个热流道(a,b)以高频率生成事件(每100毫秒一个事件):
Flowable<OrderBook> flowA = sourceA.getObservableOrderBook(value);
Flowable<OrderBook> flowB = sourceB.getObservableOrderBook(value);
Run Code Online (Sandbox Code Playgroud)
结合combineLatest,需要将近300毫秒才能完成它的工作.
Flowable<OrderBookCouple> combined = Flowable.combineLatest(flowA, flowB, OrderBookCouple::new).observeOn(Schedulers.newThread());
combined.subscribe((bookCouple) -> {
System.out.println("A timestamp: " + bookCouple.aOrderBook.getTimeStamp());
System.out.println("B timestamp: " + bookCouple.bOrderBook.getTimeStamp());
Thread.sleep(300);
}
Run Code Online (Sandbox Code Playgroud)
在一次执行组合器之后,我想处理最后生成的事件组合,意思是(lastA,lastB).
组合流的默认行为是将所有事件组合缓存在其自己的缓冲区中,以便组合流可以接收非常旧的组合,并且此时间隙正在爆炸.
我应该如何更改我的代码以禁用此缓冲区并始终接收最后一个组合?