小编Y. *_*Gao的帖子

如何在Jupyter Notebook中更改工作目录？

我找不到一个地方让我更改Jupyter Notebook中的工作目录,所以我无法使用pd.read_csv方法读取特定的csv文档.

有什么方法可以做到吗？仅供参考,我目前正在使用Python3.5.1.

谢谢!

python jupyter-notebook

Y. *_*Gao

lucky-day

28
推荐指数

5
解决办法

7万
查看次数

与另一个简单的实现相比，为什么 pandas dataframe to_dict("records") 性能较差？

与简单的实现相比，Pandas to_dict("records") 的性能似乎要差得多。下面是我的实现的代码片段：

def fast_to_dict_records(df):\n    data = df.values.tolist()\n    columns = df.columns.tolist() \n    return [\n        dict(zip(columns, datum))\n        for datum in data\n    ]\n

Run Code Online (Sandbox Code Playgroud)\n

要比较性能，请尝试以下代码片段：

import pandas as pd\nimport numpy as np\n\ndf_test = pd.DataFrame(\n    np.random.normal(size=(10000, 300)),\n    columns=range(300)\n)\n\n%timeit df_test.to_dict('records')\n%timeit fast_to_dict_records(df_test)\n

Run Code Online (Sandbox Code Playgroud)\n

输出是：

2.21 s \xc2\xb1 71.2 ms per loop (mean \xc2\xb1 std. dev. of 7 runs, 1 loop each)\n293 ms \xc2\xb1 15.8 ms per loop (mean \xc2\xb1 std. dev. of 7 runs, 1 loop each)\n

Run Code Online (Sandbox Code Playgroud)\n

也就是说，我的实现比 pandas 本机实现快约 7.5 …

python performance dataframe pandas

Y. *_*Gao

lucky-day

6
推荐指数

1
解决办法

2403
查看次数