解析“yyyy-MM-dd'T'HH:mm:ssX”字符串时非常意外的行为(ISO 8601)
> as_datetime("2017-03-22T15:48:00.000Z")
[1] "2017-03-21 23:00:00 UTC"
> packageDescription("lubridate")$Version
[1] "1.6.0"
Run Code Online (Sandbox Code Playgroud)
有人可以解释这样做的理由吗?
编辑:似乎是一个错误,请参阅问题 #536
我想使用spacy来标记句子以获得一系列整数令牌ID,我可以将它用于下游任务.我期望使用类似下面的东西.请填写???
import spacy
# Load English tokenizer, tagger, parser, NER and word vectors
nlp = spacy.load('en_core_web_lg')
# Process whole documents
text = (u"When Sebastian Thrun started working on self-driving cars at ")
doc = nlp(text)
idxs = ??????
print(idxs)
# Want output to be something like;
>> array([ 8045, 70727, 24304, 96127, 44091, 37596, 24524, 35224, 36253])
Run Code Online (Sandbox Code Playgroud)
优选地,整数指的是一些特殊的嵌入id en_core_web_lg.
spacy.io/usage/vectors-similarity没有给出提示要查找的doc中的哪个属性.
我在交叉验证时询问了这一点,但确定为OT.谷歌搜索/描述此问题的适当术语也很有帮助.