小编Lin*_*dc3的帖子

将字符串转换为dict,然后访问键:值??? 如何访问Python的<class'dict'>中的数据?

我在访问字典中的数据时遇到问题.

Sys:Macbook 2012
Python:Python 3.5.1 :: Continuum Analytics,Inc.

我正在使用从csv创建的dask.dataframe.

编辑问题

我是如何达到这一点的

假设我从熊猫系列开始:

df.Coordinates
130      {u'type': u'Point', u'coordinates': [-43.30175...
278      {u'type': u'Point', u'coordinates': [-51.17913...
425      {u'type': u'Point', u'coordinates': [-43.17986...
440      {u'type': u'Point', u'coordinates': [-51.16376...
877      {u'type': u'Point', u'coordinates': [-43.17986...
1313     {u'type': u'Point', u'coordinates': [-49.72688...
1734     {u'type': u'Point', u'coordinates': [-43.57405...
1817     {u'type': u'Point', u'coordinates': [-43.77649...
1835     {u'type': u'Point', u'coordinates': [-43.17132...
2739     {u'type': u'Point', u'coordinates': [-43.19583...
2915     {u'type': u'Point', u'coordinates': [-43.17986...
3035     {u'type': u'Point', u'coordinates': [-51.01583...
3097     {u'type': u'Point', u'coordinates': [-43.17891... …
Run Code Online (Sandbox Code Playgroud)

python dictionary data-manipulation pandas dask

10
推荐指数
3
解决办法
5643
查看次数

如何转置 dask 数据框(将列转换为行)以实现整洁的数据原则

TLDR:我从 dask bag 创建了一个 dask 数据框。dask 数据框将每个观察(事件)视为一列。因此,我没有为每个事件提供几行数据,而是为每个事件提供一列。目标是将列转置为行,就像 pandas 使用 df.T 转置数据帧一样。

详细信息:我的时间线中有示例 Twitter 数据。为了达到我的起点,这里是从磁盘读取 json 到 adask.bag然后将其转换为 a 的代码dask.dataframe

import dask.bag as db
import dask.dataframe as dd
import json


b = db.read_text('./sampleTwitter.json').map(json.loads)
df = b.to_dataframe()
df.head()
Run Code Online (Sandbox Code Playgroud)

问题我所有的个人事件(即推文)都记录为列副行。根据tidy原则,我希望每个事件都有行。 pandas有一个用于数据帧的转置方法,而 dask.array 有一个用于数组的转置方法。我的目标是在 dask 数据帧上执行相同的转置操作。我该怎么做呢?

  1. 将行转换为列

编辑解决方案

此代码解决了原始转置问题,通过定义要保留的列并删除其余列来清理 Twitter json 文件,并通过将函数应用于 Series 来创建新列。然后,我们将一个更小的、干净的文件写入磁盘。

import dask.dataframe as dd
from dask.delayed import delayed
import dask.bag as db
from dask.diagnostics import ProgressBar,Profiler, ResourceProfiler, CacheProfiler
import …
Run Code Online (Sandbox Code Playgroud)

python twitter transpose dataframe dask

5
推荐指数
1
解决办法
4239
查看次数

如何摆脱Python Jupyter笔记本错误:404 GET /nbextensions/nbextensions_configurator/tree_tab/main.js

Sys:Macbook 2012
Python:Python 3.5.1 :: Continuum Analytics,
Inc.Anaconda:conda 4.2.13

我在Jupyter笔记本中使用笔记本扩展名(nbextensions)时遇到问题,不知道如何解决该问题。我最终想使用Jupyter Notebook工具栏上未显示的nbextensions,尽管已安装和重新安装了几次(使用pip和/或conda)并完全删除并重新安装了蟒蛇。带有链接日志的确切症状如下。

我的错误消息:404 GET /nbextensions/nbextensions_configurator/tree_tab/main.js

目标:我只想再次使用笔记本扩展:-(

症状总结

  • 我不能使用笔记本扩展。按钮在我的页面上没有显示nbpresent,当我尝试使用conda packages 扩展程序时,出现错误。(下面的屏幕截图)
  • 我有多个nbextension文件夹;不知道我是否应该删除某些内容(下面的屏幕截图)
  • 我试图完全删除anaconda安装并重新安装;没有工作尝试jupyter的pip卸载和conda删除jupyter的操作,但没有更改此问题
  • jupyter_path有几个不同的路径作为输出。我不确定这是否有问题,但也许是。我不知道要删除什么

以下是详细信息和屏幕截图;任何帮助表示赞赏

我将通过调试启动jupyter笔记本的日志文件放在此处

这是我的jupyter_path输出:

>>> from jupyter_core.paths import jupyter_path
>>> print(jupyter_path())
['/Users/linwood/Library/Jupyter', '/Users/linwood/anaconda3/share/jupyter', '/usr/local/share/jupyter', '/usr/share/jupyter']
Run Code Online (Sandbox Code Playgroud)

如果这有帮助,这是我不在环境中时使用的jupyter:

$ which jupyter
/Users/linwood/anaconda3/bin/jupyter
Run Code Online (Sandbox Code Playgroud)

现在屏幕截图:

多个nbextension文件夹 多种血压

康达包装错误 康达包装错误

Jupyter_path打印输出 朱庇特路径

编辑

根据要求,javascript控制台日志。对于这是错误的事情,我深表歉意,但是我使用了Chrome浏览器的“开发人员工具”控制台来记录页面重新加载时的javascript活动。这是信息(下面的错误图片):

2. Network(X) Basics (Student).ipynb:119 loaded custom.js
default.js:48 Default extension for cell metadata editing loaded.
rawcell.js:82 Raw Cell Format toolbar preset loaded.
slideshow.js:43 Slideshow extension …
Run Code Online (Sandbox Code Playgroud)

python ipython jupyter jupyter-notebook

5
推荐指数
1
解决办法
4546
查看次数