小编mik*_*mik的帖子

pdf_pages = PdfPages('kde.pdf')
for i in range(1,114):
    for j in range(0,113):
        x=t1.iloc[:,i]
        y=t1.iloc[:,j]
        fig=sns.jointplot(x=x, y=y, kind="kde",dropna=True);
        pdf_pages.savefig(fig)

Run Code Online (Sandbox Code Playgroud)

python pdf pandas seaborn

mik*_*mik

2016 02-19

1
推荐指数

1
解决办法

3413
查看次数

R：从逗号分隔的字符串中删除连续的重复项

我在从以下数据中删除适量信息时遇到问题：

18,14,17,2,9,8
17,17,17,14
18,14,17,2,1,1,1,1,9,8,1,1,1

我正在应用 !duplicate 来删除重复项。

SplitFunction <- function(x) {
  b <- unlist(strsplit(x, '[,]'))
  c <- b[!duplicated(b)]
  return(paste(c, collapse=","))
}

Run Code Online (Sandbox Code Playgroud)

我在仅删除连续的重复项时遇到问题。下面的结果是我得到的。

18,14,17,2,9,8
17,14
18,14,17,2,1,9,8

下面的数据是我想要获得的。

18,14,17,2,9,8
17,14
18,14,17,2,1,9,8,1

你能建议一种方法来执行此操作吗？理想情况下是矢量化方法...
谢谢，
米格尔

csv r duplicates

mik*_*mik

lucky-day

1
推荐指数

1
解决办法

1444
查看次数

计算数组中的不同值-性能提示

我在优化路线图时遇到一些问题。
我想在一个字符串数组中生成一个频率表（计数不同的事件）。我的代码非常适合小型数组，但是当我开始使用100k +结构（具有许多不同的值）时，它的性能还不够。

现在，我的方法是生成具有不同值的数组，比较值并增加计数器变量（映射到字符串）。

    counter := make( map[string]int )    
    for _, distinct := range distinctStrArray{
        for _, row := range StrArray{
            if (row == distinct){
                counter[distinct]++
            }  
        } 
    }

Run Code Online (Sandbox Code Playgroud)

我尝试了另一种方法，其中先前对输入数组进行了排序（以最大程度地减少对地图的更改次数）。这有点快。

    count:=0
    for _, distinct := range distinctStrArray{
        for _, row := range StrArray{
            if (row == distinct){
                count++
            }  
        } 
    counter[distinct] += count
    count= 0
    }

Run Code Online (Sandbox Code Playgroud)

您对我可以如何优化简单的count（distinct）类型问题有任何建议吗？我对任何事情都开放。
谢谢！

maps count go

mik*_*mik

2019 02-13

0
推荐指数

1
解决办法

1786
查看次数