小编Tro*_*mba的帖子

如何使用pandas数据框删除不在群集中的值?

如果我有一个由0和1组成的pandas数据框:

 1 1 1 0 0 0 0 1 0
 1 1 1 1 1 0 0 0 0
 1 1 1 0 0 0 0 1 0 
 1 0 0 0 0 1 0 0 0 
Run Code Online (Sandbox Code Playgroud)

如何过滤异常值,以便我得到这样的结果:

 1 1 1 0 0 0 0 0 0 
 1 1 1 1 1 0 0 0 0
 1 1 1 0 0 0 0 0 0
 1 0 0 0 0 0 0 0 0
Run Code Online (Sandbox Code Playgroud)

这样我就删除了异常值.

python python-2.7 pandas

9
推荐指数
1
解决办法
108
查看次数

在 Pandas 数据框行中仅保留第一组非 nan 值

如果我有一个像这样的熊猫数据框:

      A     B     C     D     E     F
 0    1    NaN   NaN   NaN   NaN   NaN
 1    2     5     6     1    NaN    1
 2    2     3    NaN    1     4     1
 3    5     5     2     1     2     1
 4   NaN    2     3     4     1     2
 5   NaN   NaN    2    NaN   NaN    1
Run Code Online (Sandbox Code Playgroud)

我如何只保留第一组非 NaN 值,以便获得如下所示的 Pandas 数据框:

      A     B     C     D     E     F
 0    1    NaN   NaN   NaN   NaN   NaN
 1    2     5     6     1    NaN   NaN
 2    2     3    NaN   NaN   NaN …
Run Code Online (Sandbox Code Playgroud)

python-3.x pandas

4
推荐指数
1
解决办法
78
查看次数

如何每半秒用每秒数据重新采样一个熊猫数据帧?

我有一个像这样的 Pandas DataFrame,在索引和 A 列中有时间:

                         A
 2018-01-24 00:06:00    3.0
 2018-01-24 00:06:01    4.0
 2018-01-24 00:06:02    8.0
 2018-01-24 00:06:03    4.0
 2018-01-24 00:06:04    2.0
Run Code Online (Sandbox Code Playgroud)

我希望数据帧有半秒的间隔,其中半秒是两个数据点之间的平均值,这样我就会得到这样的结果:

                             A
 2018-01-24 00:06:00        3.0
 2018-01-24 00:06:00.500    3.5
 2018-01-24 00:06:01        4.0
 2018-01-24 00:06:01.500    6.0
 2018-01-24 00:06:02        8.0
 2018-01-24 00:06:02.500    6.0
 2018-01-24 00:06:03        4.0
 2018-01-24 00:06:03.500    3.0
 2018-01-24 00:06:04        2.0
Run Code Online (Sandbox Code Playgroud)

python python-3.x pandas

3
推荐指数
1
解决办法
220
查看次数

如何重复熊猫数据框列 x 次?

如果我有这样的 Pandas 数据框:

    A
 1  8
 2  9
 3  7
 4  2
Run Code Online (Sandbox Code Playgroud)

我如何重复 x 次?例如,如果我想重复 3 次,我会得到这样的结果:

    A  B  C  D
 1  8  8  8  8
 2  9  9  9  9
 3  7  7  7  7
 4  2  2  2  2
Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

2
推荐指数
1
解决办法
1490
查看次数

每次在 Pandas 数据框中有 NaN 时如何重置累积总和?

如果我有这样的 Pandas 数据框:

     1   2   3   4   5   6   7
 1  NaN  1   1   1  NaN  1   1
 2  NaN NaN  1   1   1   1   1 
 3  NaN NaN NaN  1  NaN  1   1
 4   1   1  NaN NaN  1   1  NaN
Run Code Online (Sandbox Code Playgroud)

如何进行累积总和,以便每次在行中有 NaN 值时重置计数?这样我就得到了这样的东西:

     1   2   3   4   5   6   7
 1  NaN  1   2   3  NaN  1   2
 2  NaN NaN  1   2   3   4   5 
 3  NaN NaN NaN  1  NaN  1   2
 4   1   2  NaN …
Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

1
推荐指数
1
解决办法
872
查看次数

如何使用熊猫在两个不同的单词之间填充?

如果我有一个像这样的数据框:

        A
 0  Ascent
 1   NaN
 2   NaN
 3  Descent
 4   NaN
 5  Ascent
Run Code Online (Sandbox Code Playgroud)

如何填充单词之间的距离,以使“上升”和“下降”之间的nan值填充为“之上”,而使“下降”和“上升”之间的nan值填充为“下面”。这样我就得到了一个熊猫数据框,如下所示:

        A
 0  'Ascent'
 1   'Above'
 2   'Above'
 3  'Descent'
 4   'Below'
 5  'Ascent'
Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

1
推荐指数
1
解决办法
145
查看次数

如何制作一个发散的颜色条,两个值之间有空白 Matplotlib?

我正在尝试使用彩色图地震创建颜色条。我希望颜色图在-6 到 6 的范围内,但在 -1.5 到 -.5 范围内为白色,然后从那里开始发散,大于-.5的数字为红色,小于-1.5的数字为蓝色。

有什么简单的方法可以做到这一点吗?

我正在尝试这个:

lower = plt.cm.seismic(np.linspace(-6, -1.5, 10))
upper = plt.cm.seismic(np.linspace(-.5, 6, 10))
colors = np.vstack((lower, upper))
tmap = matplotlib.colors.LinearSegmentedColormap.from_list('map_white', colors)
Run Code Online (Sandbox Code Playgroud)

python matplotlib

1
推荐指数
1
解决办法
1419
查看次数

标签 统计

pandas ×6

python ×6

python-2.7 ×4

python-3.x ×2

matplotlib ×1