小编Sto*_*ssa的帖子

如何从DataFrame中的每个组中采样不同数量的行

我有一个带有类别列的数据框。Df 对每个类别有不同的行数。

category number_of_rows
cat1     19189
cat2     13193
cat3     4500
cat4     1914
cat5     568
cat6     473
cat7     216
cat8     206
cat9     197
cat10    147
cat11    130
cat12    49
cat13    38
cat14    35
cat15    35
cat16    30
cat17    29
cat18    9
cat19    4
cat20    4
cat21    1
cat22    1
cat23    1
Run Code Online (Sandbox Code Playgroud)

我想从每个类别中选择不同数量的行。(而不是每个类别的 n 个固定行数)

Example input:
size_1 : {"cat1": 40, "cat2": 20, "cat3": 15, "cat4": 11, ...}
Example input: 
size_2 : {"cat1": 51, "cat2": 42, "cat3": 18, "cat4": 21, ...}
Run Code Online (Sandbox Code Playgroud)

我想要做的实际上是一个分层抽样,给定数量的实例对应于每个类别。 …

python random dataframe python-3.x pandas-groupby

5
推荐指数
1
解决办法
1215
查看次数

VSCode无法导入外部库

我目前正在尝试学习 VSCode。我现在使用 VSCode 在 Java 11 中进行编程。在下面的示例代码中,有 4 行导入。其中前两个正在工作。但接下来的两个给出了以下错误。

package app;

import java.util.*;
import java.awt.*;
import com.google.common.primitives.Ints;
import org.apache.commons.collections.iterators.ArrayIterator;

/**
 * Board_Space
 */
public class Board_Space {


}
Run Code Online (Sandbox Code Playgroud)
"The import com.google cannot be resolved. Java(268435846) [5,8]"
"The import org.apache.commons.collections cannot be resolved. Java(268435846) [6,8]"
Run Code Online (Sandbox Code Playgroud)

我该如何解决这个错误以及如何使用任何类型的外部库?

Related Environment Info:

 - OS: Windows 10
 - JDK 11 is installed. JAVA_HOME and PATH environment variables are set.
 - apache-maven-3.6.1 is installed. MAVEN_HOME and M2_HOME environment variables are set.
 - VSCode Version: 1.36.1 (user …
Run Code Online (Sandbox Code Playgroud)

java importerror visual-studio-code java-11

4
推荐指数
1
解决办法
1万
查看次数