小编Win*_*sch的帖子

如何对具有相同名称的列表元素求和?

我正在寻找这个问题的解决方案:我有一个这样的列表列表

sample = list("element1" = list("term1"=0.5, "term2"=1, "term3"= 4, "term1"= 0.5), "element2" = list("term23"=5, "term1"=2, "term23"=4))
Run Code Online (Sandbox Code Playgroud)

对于外部列表的每个列表,我想对具有相同名称的值求和.所以期望的输出是

desired_output = list("element1" = list("term1"=1, "term2"=1, "term3"= 4), "element2" = list("term23"=9, "term1"=2))
Run Code Online (Sandbox Code Playgroud)

实际上,我想过用这样的东西

result = lapply(sample, function(l) aggregate(l, by = list(names(l)), FUN = sum))
Run Code Online (Sandbox Code Playgroud)

但这给了我一个错误.有关于此的任何想法?提前致谢.

aggregate r sum list lapply

6
推荐指数
1
解决办法
465
查看次数

Python无法安装模块spaCy

我是python的新手,遇到了一个我无法解决的问题。我想在python中安装和使用spacy软件包。因此我打开了cmd并跑了

pip install spacy
Run Code Online (Sandbox Code Playgroud)

安装依赖项时,出现错误消息:

    ----------------------------------------
Run Code Online (Sandbox Code Playgroud)

命令““ c:\ users \ xxx \ appdata \ local \ programs \ python \ python37 \ python.exe” -u -c“导入设置工具,标记化;文件 ='C:\ Users \ xxx \ AppData \ Local \ Temp \ pip-install-6vcdnb_4 \ numpy \ setup.py'; f = getattr(tokenize,'open',open)(file); code = f.read ().replace('\ r \ n','\ n'); f.close(); exec(compile(code,file,'exec'))“ install --record C:\ Users \ xxx \ AppData \ Local \ Temp \ pip-record-jhmti8_8 \ install-record.txt-“单一版本-外部管理的--compile”失败,错误代码为1:C:\ Users \ xxx \ AppData …

python installation spacy

6
推荐指数
4
解决办法
9428
查看次数

根据元组的第一个条目从列表中删除重复的元组

我这里有一个像这样的元组列表:

test = [('ent1', 24), ('ent2',12), ('ent3',4.5), ('ent1', 4), ('ent2', 3.5)]
Run Code Online (Sandbox Code Playgroud)

我想从第一个元素已经出现的列表中删除那些元组。所以期望的输出是

[('ent1', 24), ('ent2',12), ('ent3',4.5)]
Run Code Online (Sandbox Code Playgroud)

我不知道该怎么做。通常,如果我想删除精确重复的元组,我会使用

list(set(test))
Run Code Online (Sandbox Code Playgroud)

但这在这种情况下不起作用。有人有解决这个问题的适当方法吗?

python tuples list duplicates

6
推荐指数
2
解决办法
3572
查看次数

R 如何安装包“graph”?

该软件包graph在 CRAN 上不再可用。我发现它已转移到 Bioconductor,请参阅

生物导体 - 图

但实际上,如果我尝试运行他们建议运行的命令

install.packages("BiocInstaller")
source("http://bioconductor.org/biocLite.R")
biocLite("graph")
Run Code Online (Sandbox Code Playgroud)

我收到错误,即使 BiocInstaller 也不适用于最新的 R 版本 3.4.2

我怎样才能安装这个包?

installation r graph package

5
推荐指数
1
解决办法
6448
查看次数

按句子分割文本,但不按特殊模式分割文本

这是我的示例文本:

text = "First sentence. This is a second sentence. I like pets e.g. cats or birds."
Run Code Online (Sandbox Code Playgroud)

我有一个按句子分割文本的功能

library(stringi)
split_by_sentence <- function (text) {

  # split based on periods, exclams or question marks
  result <- unlist(strsplit(text, "\\.\\s|\\?|!") )

  result <- stri_trim_both(result)
  result <- result [nchar (result) > 0]

  if (length (result) == 0)
    result <- ""

  return (result)
}
Run Code Online (Sandbox Code Playgroud)

它实际上是按标点符号分隔的。这是输出:

> split_by_sentence(text)
[1] "First sentence"            "This is a second sentence" "I like pets e.g"           "cats or birds." 
Run Code Online (Sandbox Code Playgroud)

是否有可能排除“eg”等特殊模式?

regex split r

5
推荐指数
1
解决办法
977
查看次数

标签 统计

r ×3

installation ×2

list ×2

python ×2

aggregate ×1

duplicates ×1

graph ×1

lapply ×1

package ×1

regex ×1

spacy ×1

split ×1

sum ×1

tuples ×1