我有一个看起来像这样的代码:
\n\n%%time\nimport time\ntime.sleep(3)\nRun Code Online (Sandbox Code Playgroud)\n\n当我在 jupyter 中执行此单元时,我得到以下输出:
\n\nCPU times: user 791 \xc2\xb5s, sys: 1.47 ms, total: 2.27 ms\nWall time: 3 s\nRun Code Online (Sandbox Code Playgroud)\n\n我的问题是,当我放置时,sleep(3)总时间不应该是 3 秒而不是 2.27 毫秒。
我想了解 udf 在 pyspark 中的工作原理。每次我们在数据框上使用 udf 时,Python shell 都会打开吗?