我找不到一个地方让我更改Jupyter Notebook中的工作目录,所以我无法使用pd.read_csv方法读取特定的csv文档.
有什么方法可以做到吗?仅供参考,我目前正在使用Python3.5.1.
谢谢!
与简单的实现相比,Pandas to_dict("records") 的性能似乎要差得多。下面是我的实现的代码片段:
\ndef fast_to_dict_records(df):\n data = df.values.tolist()\n columns = df.columns.tolist() \n return [\n dict(zip(columns, datum))\n for datum in data\n ]\n
Run Code Online (Sandbox Code Playgroud)\n要比较性能,请尝试以下代码片段:
\nimport pandas as pd\nimport numpy as np\n\ndf_test = pd.DataFrame(\n np.random.normal(size=(10000, 300)),\n columns=range(300)\n)\n\n%timeit df_test.to_dict('records')\n%timeit fast_to_dict_records(df_test)\n
Run Code Online (Sandbox Code Playgroud)\n输出是:
\n2.21 s \xc2\xb1 71.2 ms per loop (mean \xc2\xb1 std. dev. of 7 runs, 1 loop each)\n293 ms \xc2\xb1 15.8 ms per loop (mean \xc2\xb1 std. dev. of 7 runs, 1 loop each)\n
Run Code Online (Sandbox Code Playgroud)\n也就是说,我的实现比 pandas 本机实现快约 7.5 …