小编sus*_*mit的帖子

无法查看Pandas数据框中的所有列

我试图输出数据框的所有列.

以下是代码:

df_advertiser_activity_part_qa  = df_advertiser_activity_part.loc[(df_advertiser_activity_part['advertiser_id']==209988 )]
df_advertiser_activity_part_qa.sort(columns ='date_each_day_et')

df_advertiser_activity_part_qa
Run Code Online (Sandbox Code Playgroud)

当我输出数据帧时,不会显示所有列.这有21列,在一些列之间只有点"......"我正在使用ipython笔记本.有没有办法可以忽略它.![在此处输入图像描述] [1]

python pandas

17
推荐指数
1
解决办法
3万
查看次数

冻结pandas数据帧中的标题

有没有办法可以冻结Pandas数据框头{就像我们在excel中那样}.所以,如果它是一个有多行的长数据帧,我们可以在向下滚动时看到标题!! 我假设是ipython笔记本

python-2.7 pandas

15
推荐指数
4
解决办法
5174
查看次数

Anaconda错误启动python 3 jupyter笔记本

我在安装Anaconda3.5后尝试使用jupyter打开python 3笔记本时收到错误.python 2笔记本没有问题.这是错误

Failed to run command:
    ['/Users/sushmitroy/anaconda/envs/py35/bin/python', '-m', 'ipykernel', '-f', '/Users/sushmitroy/Library/Jupyter/runtime/kernel-64704aa3-3d05-4249-8ec2-8a9c98659538.json']
    with kwargs:
    {'stderr': None, 'cwd': '/Users/sushmitroy', 'stdin': -1, 'env': {'HOME': '/Users/sushmitroy', 'LOGNAME': 'sushmitroy', 'PWD': '/Users/sushmitroy', 'TERM': 'xterm-256color', 'SECURITYSESSIONID': '186a8', 'Apple_PubSub_Socket_Render': '/private/tmp/com.apple.launchd.EDDWkpkF2z/Render', 'XPC_SERVICE_NAME': '0', '__CF_USER_TEXT_ENCODING': '0x1F5:0x0:0x0', 'XPC_FLAGS': '0x0', 'SHELL': '/bin/bash', 'JPY_PARENT_PID': '5519', 'TERM_SESSION_ID': '28DC0BD0-4ED2-4C96-B2D9-1375A8C804D8', 'LANG': 'en_US.UTF-8', 'TMPDIR': '/var/folders/bj/2h_6v_sd7rn4_4hvy91gy_rm0000gn/T/', 'SSH_AUTH_SOCK': '/private/tmp/com.apple.launchd.vrnAzalULu/Listeners', 'TERM_PROGRAM_VERSION': '361.1', '_': '/Users/sushmitroy/anaconda/bin/jupyter-notebook', 'USER': 'sushmitroy', 'TERM_PROGRAM': 'Apple_Terminal', 'SHLVL': '2', 'PATH': '/Users/sushmitroy/anaconda/bin:/Users/sushmitroy/anaconda/bin:/Users/sushmitroy/anaconda/bin:/Users/sushmitroy/anaconda/bin://anaconda/bin:/Users/sushmitroy/anaconda/bin:/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin'}, 'stdout': None, 'start_new_session': True}

[E 01:25:15.946 NotebookApp] Unhandled error in API request
    Traceback (most recent call last): …
Run Code Online (Sandbox Code Playgroud)

python anaconda jupyter-notebook

2
推荐指数
1
解决办法
1402
查看次数

使用dask计算移动平均线

我正在尝试计算一个非常大的数据集的移动平均值。行数约为30M。使用pandas来说明如下

df = pd.DataFrame({'cust_id':['a', 'a', 'a', 'b', 'b'], 'sales': [100, 200, 300, 400, 500]})
df['mov_avg'] = df.groupby("cust_id")["sales"].apply(lambda x: x.ewm(alpha=0.5, adjust=False).mean())
Run Code Online (Sandbox Code Playgroud)

这里我使用 pandas 来计算移动平均值。使用上面的方法,在 30M 数据集上计算大约需要 20 分钟。有没有办法在这里利用 DASK?

python pandas dask

0
推荐指数
1
解决办法
1479
查看次数

标签 统计

pandas ×3

python ×3

anaconda ×1

dask ×1

jupyter-notebook ×1

python-2.7 ×1