我有一个带有类别列的数据框。Df 对每个类别有不同的行数。
category number_of_rows
cat1 19189
cat2 13193
cat3 4500
cat4 1914
cat5 568
cat6 473
cat7 216
cat8 206
cat9 197
cat10 147
cat11 130
cat12 49
cat13 38
cat14 35
cat15 35
cat16 30
cat17 29
cat18 9
cat19 4
cat20 4
cat21 1
cat22 1
cat23 1
Run Code Online (Sandbox Code Playgroud)
我想从每个类别中选择不同数量的行。(而不是每个类别的 n 个固定行数)
Example input:
size_1 : {"cat1": 40, "cat2": 20, "cat3": 15, "cat4": 11, ...}
Example input:
size_2 : {"cat1": 51, "cat2": 42, "cat3": 18, "cat4": 21, ...}
Run Code Online (Sandbox Code Playgroud)
我想要做的实际上是一个分层抽样,给定数量的实例对应于每个类别。 …
我目前正在尝试学习 VSCode。我现在使用 VSCode 在 Java 11 中进行编程。在下面的示例代码中,有 4 行导入。其中前两个正在工作。但接下来的两个给出了以下错误。
package app;
import java.util.*;
import java.awt.*;
import com.google.common.primitives.Ints;
import org.apache.commons.collections.iterators.ArrayIterator;
/**
* Board_Space
*/
public class Board_Space {
}
Run Code Online (Sandbox Code Playgroud)
"The import com.google cannot be resolved. Java(268435846) [5,8]"
"The import org.apache.commons.collections cannot be resolved. Java(268435846) [6,8]"
Run Code Online (Sandbox Code Playgroud)
我该如何解决这个错误以及如何使用任何类型的外部库?
Related Environment Info:
- OS: Windows 10
- JDK 11 is installed. JAVA_HOME and PATH environment variables are set.
- apache-maven-3.6.1 is installed. MAVEN_HOME and M2_HOME environment variables are set.
- VSCode Version: 1.36.1 (user …Run Code Online (Sandbox Code Playgroud)