我正在尝试使用wordnet包获取单词的反义词.这适用于某些单词,同时返回错误,我不会真正得到其他人.该函数基本上只是封装在函数中的包文档中的用法示例.
# The function:
antonyms <- function(x){
filter <- getTermFilter("ExactMatchFilter", x, TRUE)
terms <- getIndexTerms("ADJECTIVE", 5, filter)
synsets <- getSynsets(terms[[1]])
related <- getRelatedSynsets(synsets[[1]], "!")
sapply(related, getWord)
}
# Some words work while others return an error:
> antonyms("happy")
[1] "unhappy"
> antonyms("great")
Error in .jcall(l, "Ljava/util/Iterator;", "iterator") :
RcallMethod: invalid object parameter
# The Error is caused by the "related" step.
Run Code Online (Sandbox Code Playgroud)
我的目标是拥有一个函数,我可以提供单词向量,以便将它们的反义词作为输出,就像包提供的同义词函数一样.
谢谢你的任何想法:)
编辑:我在:OSX 10.8.5,wordnet包(在R中)wordnet_0.1-9和wordnet 3.0_3(系统范围到macports),rJava 0.9-4,R版本3.0.1(2013-05-16 ).
我正在寻找一种方法将列表拆分为预定义的切片:
a = list(range(1, 1001)) # Added list()
b = [200, 500, 300]
Run Code Online (Sandbox Code Playgroud)
列表a应该被切成len(b)包含a的前200个元素,以下500个元素和最后300个元素的子列表sum(b) == len(a).可以安全地假设.
这有共同的功能吗?
我正在尝试使用 python,特别是 ElementTree,将一个包含约 15,000 个 xml 文件的文件夹导入到 mongo db。大约 5% 的文件中似乎存在无效字符,主要是 &。文件编码为“ISO-8859-1”,编码在 xml 文件中声明。
是否有内置方法可以省略字符或自动将其转换为有效的内容?
这是我目前使用的代码:
from pymongo import MongoClient
import xml.etree.ElementTree as ET
import os
import sys
def get_files(d):
return [os.path.join(d, f) for f in os.listdir(d) if os.path.isfile(os.path.join(d,f))]
files = get_files("/path/to/data")
xmls = []
for file in files:
tree = ET.parse(file)
root = tree.getroot()
xmls.append(root)
#Results in:
In [113]: xmls = []
...: for file in files:
...: tree = ET.parse(file)
...: root = tree.getroot()
...: xmls.append(root)
File "<string>", …Run Code Online (Sandbox Code Playgroud)