小编Boe*_*ern的帖子

dplyr:样本量大于种群大小

我有一个数据帧:

> class(dataset)
[1] "grouped_df" "tbl_df"     "tbl"        "data.frame"
> dim(dataset)
[1] 64480    39
Run Code Online (Sandbox Code Playgroud)

我想从中抽取50.000个样本

> dataset %>% dplyr::sample_n(50000)
Run Code Online (Sandbox Code Playgroud)

但一直给我错误

Error: Sample size (50000) greater than population size (1). Do you want replace = TRUE?
Run Code Online (Sandbox Code Playgroud)

但是,例如,这有效:

> dim(dataset[1] %>% dplyr::sample_n(50000))
[1] 50000     1
Run Code Online (Sandbox Code Playgroud)

那么为什么我的人口规模(1)- 这是否与分组有关?

r dplyr

1
推荐指数
1
解决办法
1591
查看次数

Python:从布尔数组中获取最后 n 个真值

我有一个布尔数组,并且想将它转换为一个数组,其中只有last_n_trues True值仍然是True. 一个简单的例子:

>>> boolean_array = [False, False, True, True, True, False, False]
>>> last_n_trues = 2
>>> desired_output = [False, False, False, True, True, False, False]
Run Code Online (Sandbox Code Playgroud)

我的做法:

>>> import numpy as np
>>> idxs_of_trues = np.where(boolean_array)[0] 
array([2, 3, 4], dtype=int64)

>>> idxs_of_trues_last_n = idxs_of_trues[-last_n_trues:] 
array([3, 4], dtype=int64)

>>> [x in idxs_of_trues_last_n for x in range(0, len(boolean_array))]
[False, False, False, True, True, False, False]
Run Code Online (Sandbox Code Playgroud)

有没有更快的方法呢?特别是列表理解对我来说似乎很复杂......

python numpy

1
推荐指数
1
解决办法
212
查看次数

在两个类之间共享 C# (WPF) 中的依赖属性

我想要两个共享一个DepedencyProperty类使用AddOwner(欢迎任何其他方法),例如

class ClassA : DependencyObject
{
    public int Number
    {
        get { return (int)GetValue(NumberProperty); }
        set { SetValue(NumberProperty, value); }
    }

    public static readonly DependencyProperty NumberProperty =
        DependencyProperty.Register("Number", typeof(int), typeof(ClassA),
             new FrameworkPropertyMetadata(0,
                 FrameworkPropertyMetadataOptions.Inherits));
}
Run Code Online (Sandbox Code Playgroud)

class ClassB : DependencyObject
{
    public int Number
    {
        get { return (int)GetValue(NumberProperty); }
        set { SetValue(NumberProperty, value); }
    }

        public static readonly DependencyProperty NumberProperty =
        ClassA.NumberProperty.AddOwner(typeof(ClassB),
        new FrameworkPropertyMetadata(0,
            FrameworkPropertyMetadataOptions.Inherits));
}
Run Code Online (Sandbox Code Playgroud)

就像这里描述的那样。正如您可能猜到的那样:当然它不起作用。这是完全有道理的,因为不可能创建同一个类的多个实例,而这些实例都具有“自己的”依赖属性。

我如何确保所有类(特别是所有实例)的ClassA, …

c# wpf dependency-properties

0
推荐指数
1
解决办法
2128
查看次数

R dyplr:按名称获取列的索引

我需要从一个data.tabletbl_df它的名字中获取一列的索引,

有没有比以下更简单的方法:

getColIndex <- function(df, colnameTarget = "myColumnName") {
    colnames <- names(traindata_subset)
    colIndex <- 1
    found <- FALSE
    for(colname in colnames) {
        if (colname == colnameTarget) {
            found <- TRUE
            break
        }
        colIndex <- colIndex + 1
    }

    if (found) {
        return (colIndex)
    }
    else {
        return (-1)
    }
}
Run Code Online (Sandbox Code Playgroud)

特别是使用哈德利的dplyr

r dplyr

0
推荐指数
1
解决办法
2385
查看次数

标签 统计

dplyr ×2

r ×2

c# ×1

dependency-properties ×1

numpy ×1

python ×1

wpf ×1