我的数据框看起来像这样:
import pandas
import numpy as np
df = DataFrame(np.random.rand(4,4), columns = list('abcd'))
df
a b c d
0 0.418762 0.042369 0.869203 0.972314
1 0.991058 0.510228 0.594784 0.534366
2 0.407472 0.259811 0.396664 0.894202
3 0.726168 0.139531 0.324932 0.906575
Run Code Online (Sandbox Code Playgroud)
除了以外我怎么能得到所有列column b?
我有一个像这样的DataFrame:
In [7]:
frame.head()
Out[7]:
Communications and Search Business General Lifestyle
0 0.745763 0.050847 0.118644 0.084746
0 0.333333 0.000000 0.583333 0.083333
0 0.617021 0.042553 0.297872 0.042553
0 0.435897 0.000000 0.410256 0.153846
0 0.358974 0.076923 0.410256 0.153846
Run Code Online (Sandbox Code Playgroud)
在这里,我想询问如何获取每行具有最大值的列名,所需的输出如下:
In [7]:
frame.head()
Out[7]:
Communications and Search Business General Lifestyle Max
0 0.745763 0.050847 0.118644 0.084746 Communications
0 0.333333 0.000000 0.583333 0.083333 Business
0 0.617021 0.042553 0.297872 0.042553 Communications
0 0.435897 0.000000 0.410256 0.153846 Communications
0 0.358974 0.076923 0.410256 0.153846 Business
Run Code Online (Sandbox Code Playgroud) 我有一个像这样的数据帧:
In [10]: df
Out[10]:
Column 1
foo
Apples 1
Oranges 2
Puppies 3
Ducks 4
Run Code Online (Sandbox Code Playgroud)
如何index name foo从该数据框中删除?所需的输出是这样的:
In [10]: df
Out[10]:
Column 1
Apples 1
Oranges 2
Puppies 3
Ducks 4
Run Code Online (Sandbox Code Playgroud) 这是我的数据集的示例.
在[54]中:
user1 = pd.read_csv('dataset/1.csv')
In [55]:
user1
Out[55]:
0 0.69464 3.1735 7.5048
0 0.030639 0.149820 3.48680 9.2755
1 0.069763 -0.299650 1.94770 9.1120
2 0.099823 -1.688900 1.41650 10.1200
3 0.129820 -2.179300 0.95342 10.9240
4 0.159790 -2.301800 0.23155 10.6510
5 0.189820 -1.416500 1.18500 11.0730
Run Code Online (Sandbox Code Playgroud)
如何按下第一列并在第一列上添加名称列[TIME,X,Y和Z].
所需的输出是这样的:
TIME X Y Z
0 0 0.69464 3.1735 7.5048
1 0.030639 0.149820 3.48680 9.2755
2 0.069763 -0.299650 1.94770 9.1120
3 0.099823 -1.688900 1.41650 10.1200
4 0.129820 -2.179300 0.95342 10.9240
5 0.159790 -2.301800 0.23155 10.6510
5 …Run Code Online (Sandbox Code Playgroud) 我有一个像这样的ndarray:
In [75]:
z_r
Out[75]:
array([[ 0.00909254],
[ 0.02390291],
[ 0.02998752]])
Run Code Online (Sandbox Code Playgroud)
在这里,我想问一下如何将这些东西转换为系列,所需的输出是这样的:
0 0.00909254
1 0.02390291
2 0.02998752
Run Code Online (Sandbox Code Playgroud) 我使用了下面的read_csv命令:
In [20]:
dataframe = pd.read_csv('D:/UserInterest/output/ENFP_0719/Bookmark.csv', index_col=None)
dataframe.head()
Out[20]:
Unnamed: 0 timestamp url visits
0 0 1.404028e+09 http://m.blog.naver.com/PostView.nhn?blogId=mi... 2
1 1 1.404028e+09 http://m.facebook.com/l.php?u=http%3A%2F%2Fblo... 1
2 2 1.404028e+09 market://details?id=com.kakao.story 1
3 3 1.404028e+09 https://story-api.kakao.com/upgrade/install 4
4 4 1.403889e+09 http://m.cafe.daum.net/WorldcupLove/Knj/173424... 1
Run Code Online (Sandbox Code Playgroud)
结果显示列Unnamed:0,当我使用时它是相似的index_col=False,但是当我使用时index_col=0,结果如下:
dataframe = pd.read_csv('D:/UserInterest/output/ENFP_0719/Bookmark.csv', index_col=0)
dataframe.head()
Out[21]:
timestamp url visits
0 1.404028e+09 http://m.blog.naver.com/PostView.nhn?blogId=mi... 2
1 1.404028e+09 http://m.facebook.com/l.php?u=http%3A%2F%2Fblo... 1
2 1.404028e+09 market://details?id=com.kakao.story 1
3 1.404028e+09 https://story-api.kakao.com/upgrade/install 4
4 1.403889e+09 http://m.cafe.daum.net/WorldcupLove/Knj/173424... 1
Run Code Online (Sandbox Code Playgroud)
结果却显示列Unnamed:0,在这里我要问,是什么区别index_col=None, …
当我使用python运行程序时遇到错误:错误是这样的:
ZeroDivisionError: division by zero
Run Code Online (Sandbox Code Playgroud)
可视化我的程序类似于:
In [55]:
x = 0
y = 0
z = x/y
---------------------------------------------------------------------------
ZeroDivisionError Traceback (most recent call last)
<ipython-input-55-30b5d8268cca> in <module>()
1 x = 0
2 y = 0
----> 3 z = x/y
ZeroDivisionError: division by zero
Run Code Online (Sandbox Code Playgroud)
在这里我想问一下,如何避免python中的错误,我想要的输出是 z = 0
我是信号处理的新手,在这个问题中,我想问一下如何为感兴趣的频率F周围的每个频段获取能量.我找到了一个公式,但我不知道如何在Python中实现它.这是公式和我的傅里叶变换图:

x = np.linspace(0,5,100)
y = np.sin(2*np.pi*x)
## fourier transform
f = np.fft.fft(y)
## sample frequencies
freq = np.fft.fftfreq(len(y), d=x[1]-x[0])
plt.plot(freq, abs(f)**2) ## will show a peak at a frequency of 1 as it should.
Run Code Online (Sandbox Code Playgroud)

我有这样的数据帧:
In [67]:
call_df.head()
Out[67]:
timestamp types
1 2014-06-30 07:00:55 Call_O
2 2014-06-30 07:00:05 Call_O
3 2014-06-30 06:54:55 Call_O
501 2014-06-30 11:24:01 Call_O
Run Code Online (Sandbox Code Playgroud)
当我将该数据帧保存到csv文件时,日期时间的格式会发生变化,而且会丢失秒数.我只是把这段代码保存到csv文件中:
call_df.to_csv('D:/Call.csv')
Run Code Online (Sandbox Code Playgroud)
csv文件输出如下:

在这里我想问一下,如何将相同的日期时间格式从dataframe保存到csv文件中
我是使用Python进行信号处理的新手.我想了解如何将加速度计的幅度值转换为频域.我的示例代码如下:
在[44]中:
x = np.arange(30)
plt.plot(x, np.sin(x))
plt.xlabel('Number of Sample')
plt.ylabel('Magnitude Value')
plt.show()
Run Code Online (Sandbox Code Playgroud)

在这里,我想将数据绘制到域频率.所需的输出可能是这样的:
