小编Mat*_*ias的帖子

使用R Wordnet包获取反义词

我正在尝试使用wordnet包获取单词的反义词.这适用于某些单词,同时返回错误,我不会真正得到其他人.该函数基本上只是封装在函数中的包文档中的用法示例.

# The function:

antonyms <- function(x){
  filter <- getTermFilter("ExactMatchFilter", x, TRUE)
  terms <- getIndexTerms("ADJECTIVE", 5, filter)
  synsets <- getSynsets(terms[[1]])
  related <- getRelatedSynsets(synsets[[1]], "!")
  sapply(related, getWord)
}

# Some words work while others return an error:

> antonyms("happy")
[1] "unhappy"
> antonyms("great")
Error in .jcall(l, "Ljava/util/Iterator;", "iterator") : 
  RcallMethod: invalid object parameter

# The Error is caused by the "related" step. 
Run Code Online (Sandbox Code Playgroud)

我的目标是拥有一个函数,我可以提供单词向量,以便将它们的反义词作为输出,就像包提供的同义词函数一样.

谢谢你的任何想法:)

编辑:我在:OSX 10.8.5,wordnet包(在R中)wordnet_0.1-9和wordnet 3.0_3(系统范围到macports),rJava 0.9-4,R版本3.0.1(2013-05-16 ).

r wordnet

5
推荐指数
1
解决办法
1894
查看次数

根据第二个列表将Python列表拆分为自定义块大小

我正在寻找一种方法将列表拆分为预定义的切片:

a = list(range(1, 1001)) # Added list() 
b = [200, 500, 300]
Run Code Online (Sandbox Code Playgroud)

列表a应该被切成len(b)包含a的前200个元素,以下500个元素和最后300个元素的子列表sum(b) == len(a).可以安全地假设.

这有共同的功能吗?

python list slice

4
推荐指数
1
解决办法
189
查看次数

使用ElementTree(python)解析xml时如何删除无效字符

我正在尝试使用 python,特别是 ElementTree,将一个包含约 15,000 个 xml 文件的文件夹导入到 mongo db。大约 5% 的文件中似乎存在无效字符,主要是 &。文件编码为“ISO-8859-1”,编码在 xml 文件中声明。

是否有内置方法可以省略字符或自动将其转换为有效的内容?

这是我目前使用的代码:

    from pymongo import MongoClient
    import xml.etree.ElementTree as ET
    import os
    import sys


    def get_files(d):
            return [os.path.join(d, f) for f in os.listdir(d) if os.path.isfile(os.path.join(d,f))]

    files = get_files("/path/to/data")

    xmls = []
    for file in files:
        tree = ET.parse(file)
                root = tree.getroot()
        xmls.append(root)


    #Results in:
    In [113]: xmls = []
         ...: for file in files:
         ...:     tree = ET.parse(file)
         ...:     root = tree.getroot()
         ...:     xmls.append(root)
      File "<string>", …
Run Code Online (Sandbox Code Playgroud)

python xml encoding elementtree

2
推荐指数
1
解决办法
3836
查看次数

标签 统计

python ×2

elementtree ×1

encoding ×1

list ×1

r ×1

slice ×1

wordnet ×1

xml ×1