小编mar*_*ain的帖子

如何选择除pandas中的一列以外的所有列?

我的数据框看起来像这样:

import pandas
import numpy as np
df = DataFrame(np.random.rand(4,4), columns = list('abcd'))
df
      a         b         c         d
0  0.418762  0.042369  0.869203  0.972314
1  0.991058  0.510228  0.594784  0.534366
2  0.407472  0.259811  0.396664  0.894202
3  0.726168  0.139531  0.324932  0.906575
Run Code Online (Sandbox Code Playgroud)

除了以外我怎么能得到所有列column b

python pandas

214
推荐指数
9
解决办法
23万
查看次数

找到每行具有最大值的列名称

我有一个像这样的DataFrame:

In [7]:
frame.head()
Out[7]:
Communications and Search   Business    General Lifestyle
0   0.745763    0.050847    0.118644    0.084746
0   0.333333    0.000000    0.583333    0.083333
0   0.617021    0.042553    0.297872    0.042553
0   0.435897    0.000000    0.410256    0.153846
0   0.358974    0.076923    0.410256    0.153846
Run Code Online (Sandbox Code Playgroud)

在这里,我想询问如何获取每行具有最大值的列名,所需的输出如下:

In [7]:
    frame.head()
    Out[7]:
    Communications and Search   Business    General Lifestyle   Max
    0   0.745763    0.050847    0.118644    0.084746           Communications 
    0   0.333333    0.000000    0.583333    0.083333           Business  
    0   0.617021    0.042553    0.297872    0.042553           Communications 
    0   0.435897    0.000000    0.410256    0.153846           Communications 
    0   0.358974    0.076923    0.410256    0.153846           Business 
Run Code Online (Sandbox Code Playgroud)

python max dataframe pandas

97
推荐指数
4
解决办法
5万
查看次数

删除pandas中的索引名称

我有一个像这样的数据帧:

In [10]: df
Out[10]: 
         Column 1
foo              
Apples          1
Oranges         2
Puppies         3
Ducks           4
Run Code Online (Sandbox Code Playgroud)

如何index name foo从该数据框中删除?所需的输出是这样的:

In [10]: df
Out[10]: 
         Column 1             
Apples          1
Oranges         2
Puppies         3
Ducks           4
Run Code Online (Sandbox Code Playgroud)

python indexing rowname pandas

63
推荐指数
4
解决办法
6万
查看次数

读取csv文件pandas时给出列名

这是我的数据集的示例.

在[54]中:

user1 = pd.read_csv('dataset/1.csv')
In [55]:

user1
Out[55]:
          0     0.69464     3.1735  7.5048
0   0.030639    0.149820    3.48680 9.2755
1   0.069763    -0.299650   1.94770 9.1120
2   0.099823    -1.688900   1.41650 10.1200
3   0.129820    -2.179300   0.95342 10.9240
4   0.159790    -2.301800   0.23155 10.6510
5   0.189820    -1.416500   1.18500 11.0730
Run Code Online (Sandbox Code Playgroud)

如何按下第一列并在第一列上添加名称列[TIME,X,Y和Z].

所需的输出是这样的:

        TIME        X           Y       Z
0        0      0.69464     3.1735  7.5048
1   0.030639    0.149820    3.48680 9.2755
2   0.069763    -0.299650   1.94770 9.1120
3   0.099823    -1.688900   1.41650 10.1200
4   0.129820    -2.179300   0.95342 10.9240
5   0.159790    -2.301800   0.23155 10.6510
5 …
Run Code Online (Sandbox Code Playgroud)

python pandas

31
推荐指数
5
解决办法
4万
查看次数

ndarray到系列python

我有一个像这样的ndarray:

In [75]:
z_r
Out[75]:
array([[ 0.00909254],
       [ 0.02390291],
       [ 0.02998752]])
Run Code Online (Sandbox Code Playgroud)

在这里,我想问一下如何将这些东西转换为系列,所需的输出是这样的:

0   0.00909254
1   0.02390291
2   0.02998752
Run Code Online (Sandbox Code Playgroud)

python pandas

17
推荐指数
3
解决办法
2万
查看次数

pandas中的read_csv index_col = None/0/False不同

我使用了下面的read_csv命令:

    In [20]:
    dataframe = pd.read_csv('D:/UserInterest/output/ENFP_0719/Bookmark.csv', index_col=None)
    dataframe.head()
    Out[20]:
    Unnamed: 0  timestamp   url visits
    0   0   1.404028e+09    http://m.blog.naver.com/PostView.nhn?blogId=mi...   2
    1   1   1.404028e+09    http://m.facebook.com/l.php?u=http%3A%2F%2Fblo...   1
    2   2   1.404028e+09    market://details?id=com.kakao.story 1
    3   3   1.404028e+09    https://story-api.kakao.com/upgrade/install 4
    4   4   1.403889e+09    http://m.cafe.daum.net/WorldcupLove/Knj/173424...   1
Run Code Online (Sandbox Code Playgroud)

结果显示列Unnamed:0,当我使用时它是相似的index_col=False,但是当我使用时index_col=0,结果如下:

dataframe = pd.read_csv('D:/UserInterest/output/ENFP_0719/Bookmark.csv', index_col=0)
dataframe.head()
Out[21]:
timestamp   url visits
0   1.404028e+09    http://m.blog.naver.com/PostView.nhn?blogId=mi...   2
1   1.404028e+09    http://m.facebook.com/l.php?u=http%3A%2F%2Fblo...   1
2   1.404028e+09    market://details?id=com.kakao.story 1
3   1.404028e+09    https://story-api.kakao.com/upgrade/install 4
4   1.403889e+09    http://m.cafe.daum.net/WorldcupLove/Knj/173424...   1
Run Code Online (Sandbox Code Playgroud)

结果却显示列Unnamed:0,在这里我要问,是什么区别index_col=None, …

python csv pandas

14
推荐指数
1
解决办法
4万
查看次数

错误python:[ZeroDivisionError:除以零]

当我使用python运行程序时遇到错误:错误是这样的:

ZeroDivisionError: division by zero
Run Code Online (Sandbox Code Playgroud)

可视化我的程序类似于:

In [55]:

x = 0
y = 0
z = x/y
---------------------------------------------------------------------------
ZeroDivisionError                         Traceback (most recent call last)
<ipython-input-55-30b5d8268cca> in <module>()
      1 x = 0
      2 y = 0
----> 3 z = x/y

ZeroDivisionError: division by zero
Run Code Online (Sandbox Code Playgroud)

在这里我想问一下,如何避免python中的错误,我想要的输出是 z = 0

python

7
推荐指数
1
解决办法
4万
查看次数

计算Python中感兴趣的频率F附近的每个频带的能量

我是信号处理的新手,在这个问题中,我想问一下如何为感兴趣的频率F周围的每个频段获取能量.我找到了一个公式,但我不知道如何在Python中实现它.这是公式和我的傅里叶变换图: 在此输入图像描述

x = np.linspace(0,5,100)
y = np.sin(2*np.pi*x)

## fourier transform
f = np.fft.fft(y)
## sample frequencies
freq = np.fft.fftfreq(len(y), d=x[1]-x[0])
plt.plot(freq, abs(f)**2) ## will show a peak at a frequency of 1 as it should.
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

python physics signal-processing

7
推荐指数
1
解决办法
3089
查看次数

保存到csv文件python时更改日期时间格式

我有这样的数据帧:

In [67]:
call_df.head()
Out[67]:
timestamp   types
1   2014-06-30 07:00:55 Call_O
2   2014-06-30 07:00:05 Call_O
3   2014-06-30 06:54:55 Call_O
501 2014-06-30 11:24:01 Call_O
Run Code Online (Sandbox Code Playgroud)

当我将该数据帧保存到csv文件时,日期时间的格式会发生变化,而且会丢失秒数.我只是把这段代码保存到csv文件中:

call_df.to_csv('D:/Call.csv')
Run Code Online (Sandbox Code Playgroud)

csv文件输出如下:

在此输入图像描述

在这里我想问一下,如何将相同的日期时间格式从dataframe保存到csv文件中

python pandas

6
推荐指数
2
解决办法
1万
查看次数

Python中的傅里叶变换

我是使用Python进行信号处理的新手.我想了解如何将加速度计的幅度值转换为频域.我的示例代码如下:

在[44]中:

  x = np.arange(30)
  plt.plot(x, np.sin(x))
  plt.xlabel('Number of Sample')
  plt.ylabel('Magnitude Value')
  plt.show()
Run Code Online (Sandbox Code Playgroud)

样本值的图表

在这里,我想将数据绘制到域频率.所需的输出可能是这样的: 预期输出的图表

python matplotlib

4
推荐指数
1
解决办法
2750
查看次数