小编Tro*_*mba的帖子

如何使用pandas数据框删除不在群集中的值？

如果我有一个由0和1组成的pandas数据框:

 1 1 1 0 0 0 0 1 0
 1 1 1 1 1 0 0 0 0
 1 1 1 0 0 0 0 1 0 
 1 0 0 0 0 1 0 0 0

Run Code Online (Sandbox Code Playgroud)

如何过滤异常值,以便我得到这样的结果:

 1 1 1 0 0 0 0 0 0 
 1 1 1 1 1 0 0 0 0
 1 1 1 0 0 0 0 0 0
 1 0 0 0 0 0 0 0 0

Run Code Online (Sandbox Code Playgroud)

这样我就删除了异常值.

python python-2.7 pandas

Tro*_*mba

lucky-day

9
推荐指数

1
解决办法

108
查看次数

在 Pandas 数据框行中仅保留第一组非 nan 值

如果我有一个像这样的熊猫数据框：

      A     B     C     D     E     F
 0    1    NaN   NaN   NaN   NaN   NaN
 1    2     5     6     1    NaN    1
 2    2     3    NaN    1     4     1
 3    5     5     2     1     2     1
 4   NaN    2     3     4     1     2
 5   NaN   NaN    2    NaN   NaN    1

Run Code Online (Sandbox Code Playgroud)

我如何只保留第一组非 NaN 值，以便获得如下所示的 Pandas 数据框：

      A     B     C     D     E     F
 0    1    NaN   NaN   NaN   NaN   NaN
 1    2     5     6     1    NaN   NaN
 2    2     3    NaN   NaN   NaN …

Run Code Online (Sandbox Code Playgroud)

python-3.x pandas

Tro*_*mba

lucky-day

4
推荐指数

1
解决办法

78
查看次数

如何每半秒用每秒数据重新采样一个熊猫数据帧？

我有一个像这样的 Pandas DataFrame，在索引和 A 列中有时间：

                         A
 2018-01-24 00:06:00    3.0
 2018-01-24 00:06:01    4.0
 2018-01-24 00:06:02    8.0
 2018-01-24 00:06:03    4.0
 2018-01-24 00:06:04    2.0

Run Code Online (Sandbox Code Playgroud)

我希望数据帧有半秒的间隔，其中半秒是两个数据点之间的平均值，这样我就会得到这样的结果：

                             A
 2018-01-24 00:06:00        3.0
 2018-01-24 00:06:00.500    3.5
 2018-01-24 00:06:01        4.0
 2018-01-24 00:06:01.500    6.0
 2018-01-24 00:06:02        8.0
 2018-01-24 00:06:02.500    6.0
 2018-01-24 00:06:03        4.0
 2018-01-24 00:06:03.500    3.0
 2018-01-24 00:06:04        2.0

Run Code Online (Sandbox Code Playgroud)

python python-3.x pandas

Tro*_*mba

lucky-day

3
推荐指数

1
解决办法

220
查看次数

如何重复熊猫数据框列 x 次？

如果我有这样的 Pandas 数据框：

Run Code Online (Sandbox Code Playgroud)

我如何重复 x 次？例如，如果我想重复 3 次，我会得到这样的结果：

    A  B  C  D
 1  8  8  8  8
 2  9  9  9  9
 3  7  7  7  7
 4  2  2  2  2

Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

Tro*_*mba

lucky-day

2
推荐指数

1
解决办法

1490
查看次数

每次在 Pandas 数据框中有 NaN 时如何重置累积总和？

如果我有这样的 Pandas 数据框：

     1   2   3   4   5   6   7
 1  NaN  1   1   1  NaN  1   1
 2  NaN NaN  1   1   1   1   1 
 3  NaN NaN NaN  1  NaN  1   1
 4   1   1  NaN NaN  1   1  NaN

Run Code Online (Sandbox Code Playgroud)

如何进行累积总和，以便每次在行中有 NaN 值时重置计数？这样我就得到了这样的东西：

     1   2   3   4   5   6   7
 1  NaN  1   2   3  NaN  1   2
 2  NaN NaN  1   2   3   4   5 
 3  NaN NaN NaN  1  NaN  1   2
 4   1   2  NaN …

Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

Tro*_*mba

lucky-day

1
推荐指数

1
解决办法

872
查看次数

如何使用熊猫在两个不同的单词之间填充？

如果我有一个像这样的数据框：

        A
 0  Ascent
 1   NaN
 2   NaN
 3  Descent
 4   NaN
 5  Ascent

Run Code Online (Sandbox Code Playgroud)

如何填充单词之间的距离，以使“上升”和“下降”之间的nan值填充为“之上”，而使“下降”和“上升”之间的nan值填充为“下面”。这样我就得到了一个熊猫数据框，如下所示：

        A
 0  'Ascent'
 1   'Above'
 2   'Above'
 3  'Descent'
 4   'Below'
 5  'Ascent'

Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

Tro*_*mba

2019 04-01

1
推荐指数

1
解决办法

145
查看次数

如何制作一个发散的颜色条，两个值之间有空白 Matplotlib？

我正在尝试使用彩色图地震创建颜色条。我希望颜色图在-6 到 6 的范围内，但在 -1.5 到 -.5 范围内为白色，然后从那里开始发散，大于-.5的数字为红色，小于-1.5的数字为蓝色。

有什么简单的方法可以做到这一点吗？

我正在尝试这个：

lower = plt.cm.seismic(np.linspace(-6, -1.5, 10))
upper = plt.cm.seismic(np.linspace(-.5, 6, 10))
colors = np.vstack((lower, upper))
tmap = matplotlib.colors.LinearSegmentedColormap.from_list('map_white', colors)

Run Code Online (Sandbox Code Playgroud)

python matplotlib

Tro*_*mba

2019 12-10

1
推荐指数

1
解决办法

1419
查看次数