小编Y. *_*Gao的帖子

如何在Jupyter Notebook中更改工作目录?

我找不到一个地方让我更改Jupyter Notebook中的工作目录,所以我无法使用pd.read_csv方法读取特定的csv文档.

有什么方法可以做到吗?仅供参考,我目前正在使用Python3.5.1.

谢谢!

python jupyter-notebook

28
推荐指数
5
解决办法
7万
查看次数

与另一个简单的实现相比,为什么 pandas dataframe to_dict("records") 性能较差?

与简单的实现相比,Pandas to_dict("records") 的性能似乎要差得多。下面是我的实现的代码片段:

\n
def fast_to_dict_records(df):\n    data = df.values.tolist()\n    columns = df.columns.tolist() \n    return [\n        dict(zip(columns, datum))\n        for datum in data\n    ]\n
Run Code Online (Sandbox Code Playgroud)\n

要比较性能,请尝试以下代码片段:

\n
import pandas as pd\nimport numpy as np\n\ndf_test = pd.DataFrame(\n    np.random.normal(size=(10000, 300)),\n    columns=range(300)\n)\n\n%timeit df_test.to_dict('records')\n%timeit fast_to_dict_records(df_test)\n
Run Code Online (Sandbox Code Playgroud)\n

输出是:

\n
2.21 s \xc2\xb1 71.2 ms per loop (mean \xc2\xb1 std. dev. of 7 runs, 1 loop each)\n293 ms \xc2\xb1 15.8 ms per loop (mean \xc2\xb1 std. dev. of 7 runs, 1 loop each)\n
Run Code Online (Sandbox Code Playgroud)\n

也就是说,我的实现比 pandas 本机实现快约 7.5 …

python performance dataframe pandas

6
推荐指数
1
解决办法
2403
查看次数