小编Dun*_*eal的帖子

漂亮印刷整个熊猫系列/数据框架

我在终端上使用Series和DataFrames很多.__repr__Series 的默认值返回一个简化的样本,带有一些head和tail值,但其余的则丢失.

是否有内置的方式来打印整个Series/DataFrame?理想情况下,它将支持正确的对齐,可能支持列之间的边界,甚至可能支持不同列的颜色编码.

python dataframe pandas

531
推荐指数
12
解决办法
50万
查看次数

在Python/numpy/pandas中有效地检查任意对象是否为NaN?

我的numpy数组用于np.nan指定缺失值.当我遍历数据集时,我需要检测这些缺失值并以特殊方式处理它们.

天真的我用过numpy.isnan(val),除非val不是支持的类型子集,否则效果很好numpy.isnan().例如,丢失的数据可能出现在字符串字段中,在这种情况下,我得到:

>>> np.isnan('some_string')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
Run Code Online (Sandbox Code Playgroud)

除了编写一个捕获异常并返回的昂贵包装器之外False,有没有办法优雅高效地处理这个问题?

python numpy pandas

90
推荐指数
3
解决办法
14万
查看次数

获取满足条件的Pandas DataFrame行的整数索引?

我有以下DataFrame:

   a  b  c
b
2  1  2  3
5  4  5  6
Run Code Online (Sandbox Code Playgroud)

如您所见,列b用作索引.我希望得到行的序数,('b' == 5)这种情况就是这样1.

正在测试的列可以是索引列(b在本例中也是如此)或常规列,例如,我可能想要找到满足行的索引('c' == 6).

python numpy pandas

32
推荐指数
3
解决办法
6万
查看次数

Pandas文档中的术语"广播"是什么意思?

我正在阅读Pandas文档,"广播"一词被广泛使用,但从未真正定义或解释过.

这是什么意思?

python numpy pandas

32
推荐指数
1
解决办法
1万
查看次数

具有4个字节的"填充类'测试器'警告意味着什么?

对于这个简化的测试用例:

#include <map>

class Tester {
    int foo;
    std::map<int, int> smap;
};

int main() {
    Tester test; 
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

我得到以下编译器警告:

$ clang++ -std=c++98 -Weverything test.cc 
test.cc:5:24: warning: padding class 'Tester' with 4 bytes to align 'smap' [-Wpadded]
    std::map<int, int> smap;
                       ^
Run Code Online (Sandbox Code Playgroud)

任何人都可以解释这个警告意味着什么,以及我应该如何解决它?

c++ compiler-warnings clang++

30
推荐指数
2
解决办法
2万
查看次数

使用Python函数高效处理DataFrame行?

在我们使用Pandas的代码中的许多地方,我们都有一些Python函数process(row).该函数被使用DataFrame.iterrows(),接受每个函数row,并进行一些处理,并返回一个值,我们最终收集到一个新的值Series.

我意识到这种使用模式绕过了numpy/Pandas堆栈的大部分性能优势.

  1. 什么是使这种使用模式尽可能高效的最佳方法?
  2. 我们可以在不重写大部分代码的情况下完成吗?

这个问题的另一个方面是:所有这些功能都可以转换为高效率的表示吗?我非常了解numpy/scipy/Pandas堆栈,但似乎对于真正任意的逻辑,你有时可能需要使用像上面那样的慢速纯Python架构.是这样的吗?

python numpy pandas

12
推荐指数
1
解决办法
1万
查看次数

Python中跨平台获取用户配置主目录的方法?

我的程序需要存储一些配置文件。主要的操作系统似乎都有一个指定的位置来放置它们;例如,在 Freedesktop.org 兼容系统上,它将是存储在$XDG_CONFIG_HOME环境变量中的路径。

是否有方法(或库)可以跨主要操作系统获取此配置主目录:Windows、OS X、Linux?

python cross-platform configuration-files

9
推荐指数
2
解决办法
2367
查看次数

比较pandas系列在包含nan时是否相等?

我的应用程序需要比较有时包含nans的Series实例.这导致普通比较使用==失败,因为nan != nan:

import numpy as np
from pandas import Series
s1 = Series([1,np.nan])
s2 = Series([1,np.nan])

>>> (Series([1, nan]) == Series([1, nan])).all()
False
Run Code Online (Sandbox Code Playgroud)

比较这个系列的正确方法是什么?

python numpy nan equality-operator pandas

8
推荐指数
2
解决办法
8021
查看次数

"检测到未注册的Git根目录",因为项目的父目录由Git进行版本控制

我建立了一个/parent/project由Mercurial管理的PyCharm项目/parent/project/.hg.独立于此项目,/parent由Git at管理/parent/.git.

不幸的是,这导致PyCharm抱怨:"检测到未注册的Git root:目录/父目录在Git下,但未在设置中注册."

什么是干净的解决方案?理想情况下,我希望PyCharm简单地忽略项目目录本身上方目录中的任何存储库.

git mercurial intellij-idea pycharm

8
推荐指数
1
解决办法
2万
查看次数

在Vim的状态栏中显示当前编辑文件的相对路径?

:help statusline索赔%f将呈现为:

缓冲区中文件的路径,以键入的形式或相对于当前目录的形式出现。

当I时set statusline=%f,状态栏中的路径有时是相对的,但通常是绝对的。

有没有办法确保显示的路径始终是相对的?

vim

6
推荐指数
1
解决办法
689
查看次数