小编WGP*_*WGP的帖子

随机抽样Pandas中数据帧的子集

假设我有一个包含100,000个条目的数据框,并希望将其拆分为1000个条目的100个部分.

我如何采取100个部分中只有一部分的50个随机样本.数据集已经被排序,前1000个结果是下一个部分的第一个部分,依此类推.

非常感谢

python sample random-sample pandas

24
推荐指数
3
解决办法
5万
查看次数

Python Pandas:获取多行的索引,该列与特定值匹配

给定一个DataFrame与列xkyk,我们要查找的索引DataFrame中的值xkyk ==0

我只对其中一栏工作得很好,但是我不能对两栏都工作

b = (df[df['xk'] ==0]).index.tolist()
Run Code Online (Sandbox Code Playgroud)

我会怎么做它xk,并yk在同一时间。

python indexing pandas

5
推荐指数
1
解决办法
2593
查看次数

使用 pymongo 查询空字段

我想使用 python 在 mongo 中查询空字段,但是它很难处理 null 或 false 这两个词。它要么给我一个错误,即它们在 python 中未定义,要么在 mongo 中搜索字符串 null 和 false,我不想发生这两种情况。

collection = pymongo.MongoClient('mongodb://localhost:27017/')['historical'].highjump
1) data = pd.DataFrame(list(collection.find({"min":"null"})))
2) data = pd.DataFrame(list(collection.find({"min":null})))
3) data = pd.DataFrame(list(collection.find({"min":{"$exists":"false"}})))
4) data = pd.DataFrame(list(collection.find({"min":{"$exists":false}})))
Run Code Online (Sandbox Code Playgroud)
  • 1&3) 错误,因为在字段中搜索字符串 null/false 而不是在字段不存在时搜索。
  • 2&4) 错误,因为在 python 中没有定义 null/false。

任何帮助将不胜感激,我可以在 mongo 中运行查询 2 和 4 并返回正确的文档,但我需要从 python shell 运行它。

python null mongodb pymongo

2
推荐指数
1
解决办法
2919
查看次数

标签 统计

python ×3

pandas ×2

indexing ×1

mongodb ×1

null ×1

pymongo ×1

random-sample ×1

sample ×1