小编xce*_*cen的帖子

无法在 Python 3 上从 itertools izip 导入

在我的项目中,我尝试导入 izip 库,但不起作用

from itertools import izip
from random    import normalvariate, random
from datetime  import timedelta, datetime
Run Code Online (Sandbox Code Playgroud)

我收到此错误:

from itertools import izip
ImportError: cannot import name 'izip'
Run Code Online (Sandbox Code Playgroud)

但我只是想将库导入到我的 python 3 项目中

python python-itertools izip

6
推荐指数
1
解决办法
5499
查看次数

Google Apps 脚本的数据分析库

有没有用于数据分析和矩阵运算的GAS库?像 Python numpy&pandas或 JavaScript numjs&之类的东西undescorejs。我想在GAS中做一些统计操作。

statistics data-analysis google-apps-script data-science

5
推荐指数
1
解决办法
1068
查看次数

DataFrame 列按给定列表排序,并为缺失的列添加空列

我有一个 DataFrame 如下。

df =  pd.DataFrame(
    {  
       "code": ["AA", "BB", "CC","DD"],
        "YA" : [2,1,1,np.nan],
        "YD" : [1,np.nan,np.nan,1],
        "ZB" : [1,np.nan,np.nan,np.nan],
        "ZD" : [1,np.nan,np.nan,1]       
    }
)
Run Code Online (Sandbox Code Playgroud)

另外,我有一个排序列表。

sort_list = ['YD','YA', 'ZD', 'YB', 'ZA', 'ZB']
Run Code Online (Sandbox Code Playgroud)

我正在尝试根据排序列表添加缺少的列并对 DataFrame 进行排序。

预期输出:

   code YD  YA  ZD  YB  ZA  ZB
0   AA  1.0 2.0 1.0 NaN NaN 1.0
1   BB  NaN 1.0 NaN NaN NaN NaN
2   CC  NaN 1.0 NaN NaN NaN NaN
3   DD  1.0 NaN 1.0 NaN NaN NaN
Run Code Online (Sandbox Code Playgroud)

我可以使用以下代码获得结果。有没有另一种(简单的)方法来做到这一点?

我的代码:

col_list = …
Run Code Online (Sandbox Code Playgroud)

python dataframe python-3.x pandas

5
推荐指数
1
解决办法
122
查看次数

Plotly:如何向条形图添加趋势线?

我正在尝试将趋势线添加到绘制的条形图中plotly

代码

import plotly.express as px

fig = px.bar(count, x="date", y="count",trendline="ols")

fig.update_layout(
    xaxis_title="Date",
    yaxis_title = "Count"
)

fig.show()
Run Code Online (Sandbox Code Playgroud)

错误:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-129-8b01de219d3c> in <module>
----> 1 fig = px.bar(count, x="date", y="count",trendline="ols")
      2 
      3 fig.update_layout(
      4     xaxis_title="Date",
      5     yaxis_title = "Count"

TypeError: bar() got an unexpected keyword argument 'trendline'
Run Code Online (Sandbox Code Playgroud)

这是数据

如何成功地将趋势线添加到该图中?

python regression data-visualization bar-chart plotly

4
推荐指数
1
解决办法
1万
查看次数

通过仅跳过空白行来读取 excel 文件 (pd.read_excel())

我有一个如下的数据框。

    id       date       name    branch  position
0   20323   2019-02-03  Bete    H       IE
1   20326   2019-02-03  Veso    R       MGR
2   22357   2019-02-03  Nom     D       IE
3   20935   2019-02-06  Dow     A       MGR
4   NaN     NaT         NaN     NaN     NaN
5   20432   2019-02-07  Tem     W       MGR
6   23999   NaT         Bonny   NaN     NaN
7   21102   2019-02-07  Xi      A       IE
Run Code Online (Sandbox Code Playgroud)

我只想删除空白行(例如:索引 4)。

我尝试使用df = pd.read_excel("../20191210/test.xlsx", skip_blank_lines=True).

但与结果没有区别 df = pd.read_excel("..20191210/test.xlsx")

是该文件的下载链接。

谁能帮我这个?

python dataframe pandas

3
推荐指数
2
解决办法
9064
查看次数

Pyspark:使用 udf 根据另一个数据帧中的值向数据帧添加新列

我有两个 pyspark 数据帧,我正在尝试根据 dataframe_1df_2的值向 dataframe_2 ( )添加一个新列。Dataframe_2 列val_1val_2应该是dataframe_1 的行和列位置。

数据帧_1

df_1 = sqlContext.createDataFrame([(0.78, 0.79, 0.45, 0.67, 0.88), (0.77, 0.79, 0.81, 0.82, 0.66), (0.99, 0.92, 0.94, 0.95, 0.91), (
    0.75, 0.53, 0.83, 0.73, 0.56), (0.77, 0.78, 0.99, 0.34, 0.67)], ["col_1", "col_2", "col_3", "col_4", "col_5"])

df_1.show()
+-----+-----+-----+-----+-----+
|col_1|col_2|col_3|col_4|col_5|
+-----+-----+-----+-----+-----+
| 0.78| 0.79| 0.45| 0.67| 0.88|
| 0.77| 0.79| 0.81| 0.82| 0.66|
| 0.99| 0.92| 0.94| 0.95| 0.91|
| 0.75| 0.53| 0.83| 0.73| 0.56|
| 0.77| 0.78| …
Run Code Online (Sandbox Code Playgroud)

python apache-spark apache-spark-sql pyspark

3
推荐指数
1
解决办法
125
查看次数