小编mpj*_*jan的帖子

在解析Pandas中的csv文件时,如何从字符串中删除额外的空格？

我有以下名为'data.csv'的文件:

    1997,Ford,E350
    1997, Ford , E350
    1997,Ford,E350,"Super, luxurious truck"
    1997,Ford,E350,"Super ""luxurious"" truck"
    1997,Ford,E350," Super luxurious truck "
    "1997",Ford,E350
    1997,Ford,E350
    2000,Mercury,Cougar

Run Code Online (Sandbox Code Playgroud)

我想将它解析为pandas DataFrame,以便DataFrame如下所示:

       Year     Make   Model              Description
    0  1997     Ford    E350                     None
    1  1997     Ford    E350                     None
    2  1997     Ford    E350   Super, luxurious truck
    3  1997     Ford    E350  Super "luxurious" truck
    4  1997     Ford    E350    Super luxurious truck
    5  1997     Ford    E350                     None
    6  1997     Ford    E350                     None
    7  2000  Mercury  Cougar                     None

Run Code Online (Sandbox Code Playgroud)

我能做的最好的事情是:

    pd.read_table("data.csv", sep=r',', names=["Year", "Make", "Model", "Description"])

Run Code Online (Sandbox Code Playgroud)

哪个让我: …

python parsing pandas

mpj*_*jan

2012 11-15

49
推荐指数

7
解决办法

5万
查看次数

如何根据多个标准对Pandas DataFrame进行排序？

我有以下DataFrame包含歌曲名称,他们的峰值图表位置以及他们在1号位置花费的周数:

                                          Song            Peak            Weeks
76                            Paperback Writer               1               16
117                               Lady Madonna               1                9
118                                   Hey Jude               1               27
22                           Can't Buy Me Love               1               17
29                          A Hard Day's Night               1               14
48                              Ticket To Ride               1               14
56                                       Help!               1               17
109                       All You Need Is Love               1               16
173                The Ballad Of John And Yoko               1               13
85                               Eleanor Rigby               1               14
87                            Yellow Submarine               1               14
20                    I Want To Hold Your Hand               1               24
45 …

Run Code Online (Sandbox Code Playgroud)

python pandas

mpj*_*jan

lucky-day

25
推荐指数

4
解决办法

6万
查看次数

在Mac OSX上安装Pandas

我在Mac OSX计算机上安装Python Pandas库时遇到问题.

我在终端输入以下内容:

$ sudo easy_install pandas

Run Code Online (Sandbox Code Playgroud)

但后来我得到以下内容:

Searching for pandas
Reading http://pypi.python.org/simple/pandas/
Reading http://pandas.pydata.org
Reading http://pandas.sourceforge.net
Best match: pandas 0.9.0
Downloading http://pypi.python.org/packages/source/p/pandas/pandas-
0.9.0.zip#md5=04b1d8e11cc0fc30ae777499d89003ec
Processing pandas-0.9.0.zip
Writing /tmp/easy_install-ixjbQO/pandas-0.9.0/setup.cfg
Running pandas-0.9.0/setup.py -q bdist_egg --dist-dir /tmp/easy_install-ixjbQO/pandas-
0.9.0/egg-dist-tmp-EGREoT
warning: no files found matching 'setupegg.py'
no previously-included directories found matching 'doc/build'
warning: no previously-included files matching '*.so' found anywhere in distribution
warning: no previously-included files matching '*.pyd' found anywhere in distribution
warning: no previously-included files matching '*.pyc' found anywhere in distribution
warning: no …

Run Code Online (Sandbox Code Playgroud)

python pandas

mpj*_*jan

2012 12-10

17
推荐指数

5
解决办法

10万
查看次数

如何删除Python Pandas系列或数据框中的行中的省略号,如果长行/宽列被截断时显示？

当我创建以下Pandas系列时:

    pandas.Series(['a', 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa', 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa', 'aaaaaaaaaaaaaaaa', 'aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa']

Run Code Online (Sandbox Code Playgroud)

我得到了这个结果:

    0                                                    a
    1    aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa...
    2    aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa...
    3                                     aaaaaaaaaaaaaaaa
    4    aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa...

Run Code Online (Sandbox Code Playgroud)

如何在不使用如下所示的省略号的情况下获得一个系列:

    0                                                                         a
    1    aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
    2         aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
    3                                                          aaaaaaaaaaaaaaaa
    4        aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

Run Code Online (Sandbox Code Playgroud)

python printing column-width options pandas

mpj*_*jan

2016 09-23

11
推荐指数

1
解决办法

6248
查看次数

如何减慢Python中的循环？

如果我有一个清单l:

l = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Run Code Online (Sandbox Code Playgroud)

有没有办法控制以下for循环,以便列表中的下一个元素仅在前一个后打印一秒？

for i in l:
    print i

Run Code Online (Sandbox Code Playgroud)

换句话说,有没有办法优雅地减慢Python中的循环？

python

mpj*_*jan

lucky-day

8
推荐指数

3
解决办法

9325
查看次数

如何计算 Pandas 中滚动窗口的累积乘积？

我有一个 DataFrame，df每日股票收益如下：

Date         Stock A    Stock B     Stock C
2018-12-26  -0.018207   0.083554   -0.006546
2018-12-27   0.004223   0.000698    0.003806
2018-12-28   0.024847  -0.008717    0.028399
2018-12-31   0.000000   0.010904    0.000000
2019-01-02   0.036554   0.002436    0.035557
2019-01-03   0.043541  -0.028462    0.006065
2019-01-04  -0.036207   0.070025    0.003025
2019-01-07  -0.005367   0.046411   -0.001546
2019-01-08   0.002878   0.014678    0.003631
2019-01-09   0.004663   0.014151    0.017179
2019-01-10   0.009282   0.026047    0.002062
2019-01-11   0.021224  -0.006649   -0.001578
2019-01-14   0.022168  -0.015211    0.008713
2019-01-15  -0.009827   0.020080   -0.004424
2019-01-16   0.021561  -0.016657    0.003583
2019-01-17   0.005025   0.011703    0.010149
2019-01-18   0.013333   0.012785    0.007824
2019-01-21 …

Run Code Online (Sandbox Code Playgroud)

python quantitative-finance pandas

mpj*_*jan

2019 02-07

2
推荐指数

1
解决办法

3536
查看次数