小编xce*_*cen的帖子

无法在 Python 3 上从 itertools izip 导入

在我的项目中，我尝试导入 izip 库，但不起作用

from itertools import izip
from random    import normalvariate, random
from datetime  import timedelta, datetime

Run Code Online (Sandbox Code Playgroud)

我收到此错误：

from itertools import izip
ImportError: cannot import name 'izip'

Run Code Online (Sandbox Code Playgroud)

但我只是想将库导入到我的 python 3 项目中

python python-itertools izip

cyb*_*est

2019 12-02

6
推荐指数

1
解决办法

5499
查看次数

Google Apps 脚本的数据分析库

有没有用于数据分析和矩阵运算的GAS库？像 Python numpy&pandas或 JavaScript numjs&之类的东西undescorejs。我想在GAS中做一些统计操作。

statistics data-analysis google-apps-script data-science

xce*_*cen

2018 12-18

5
推荐指数

1
解决办法

1068
查看次数

DataFrame 列按给定列表排序，并为缺失的列添加空列

我有一个 DataFrame 如下。

df =  pd.DataFrame(
    {  
       "code": ["AA", "BB", "CC","DD"],
        "YA" : [2,1,1,np.nan],
        "YD" : [1,np.nan,np.nan,1],
        "ZB" : [1,np.nan,np.nan,np.nan],
        "ZD" : [1,np.nan,np.nan,1]       
    }
)

Run Code Online (Sandbox Code Playgroud)

另外，我有一个排序列表。

sort_list = ['YD','YA', 'ZD', 'YB', 'ZA', 'ZB']

Run Code Online (Sandbox Code Playgroud)

我正在尝试根据排序列表添加缺少的列并对 DataFrame 进行排序。

预期输出：

   code YD  YA  ZD  YB  ZA  ZB
0   AA  1.0 2.0 1.0 NaN NaN 1.0
1   BB  NaN 1.0 NaN NaN NaN NaN
2   CC  NaN 1.0 NaN NaN NaN NaN
3   DD  1.0 NaN 1.0 NaN NaN NaN

Run Code Online (Sandbox Code Playgroud)

我可以使用以下代码获得结果。有没有另一种（简单的）方法来做到这一点？

我的代码：

col_list = …

Run Code Online (Sandbox Code Playgroud)

python dataframe python-3.x pandas

xce*_*cen

lucky-day

5
推荐指数

1
解决办法

122
查看次数

Plotly：如何向条形图添加趋势线？

我正在尝试将趋势线添加到绘制的条形图中plotly

代码：

import plotly.express as px

fig = px.bar(count, x="date", y="count",trendline="ols")

fig.update_layout(
    xaxis_title="Date",
    yaxis_title = "Count"
)

fig.show()

Run Code Online (Sandbox Code Playgroud)

错误：

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-129-8b01de219d3c> in <module>
----> 1 fig = px.bar(count, x="date", y="count",trendline="ols")
      2 
      3 fig.update_layout(
      4     xaxis_title="Date",
      5     yaxis_title = "Count"

TypeError: bar() got an unexpected keyword argument 'trendline'

Run Code Online (Sandbox Code Playgroud)

这是数据

如何成功地将趋势线添加到该图中？

python regression data-visualization bar-chart plotly

xce*_*cen

2021 02-05

4
推荐指数

1
解决办法

1万
查看次数

通过仅跳过空白行来读取 excel 文件 (pd.read_excel())

我有一个如下的数据框。

    id       date       name    branch  position
0   20323   2019-02-03  Bete    H       IE
1   20326   2019-02-03  Veso    R       MGR
2   22357   2019-02-03  Nom     D       IE
3   20935   2019-02-06  Dow     A       MGR
4   NaN     NaT         NaN     NaN     NaN
5   20432   2019-02-07  Tem     W       MGR
6   23999   NaT         Bonny   NaN     NaN
7   21102   2019-02-07  Xi      A       IE

Run Code Online (Sandbox Code Playgroud)

我只想删除空白行（例如：索引 4）。

我尝试使用df = pd.read_excel("../20191210/test.xlsx", skip_blank_lines=True).

但与结果没有区别 df = pd.read_excel("..20191210/test.xlsx")

这是该文件的下载链接。

谁能帮我这个？

python dataframe pandas

xce*_*cen

2019 12-11

3
推荐指数

2
解决办法

9064
查看次数

Pyspark：使用 udf 根据另一个数据帧中的值向数据帧添加新列

我有两个 pyspark 数据帧，我正在尝试根据 dataframe_1df_2的值向 dataframe_2 ( )添加一个新列。Dataframe_2 列val_1，val_2应该是dataframe_1 的行和列位置。

数据帧_1

df_1 = sqlContext.createDataFrame([(0.78, 0.79, 0.45, 0.67, 0.88), (0.77, 0.79, 0.81, 0.82, 0.66), (0.99, 0.92, 0.94, 0.95, 0.91), (
    0.75, 0.53, 0.83, 0.73, 0.56), (0.77, 0.78, 0.99, 0.34, 0.67)], ["col_1", "col_2", "col_3", "col_4", "col_5"])

df_1.show()
+-----+-----+-----+-----+-----+
|col_1|col_2|col_3|col_4|col_5|
+-----+-----+-----+-----+-----+
| 0.78| 0.79| 0.45| 0.67| 0.88|
| 0.77| 0.79| 0.81| 0.82| 0.66|
| 0.99| 0.92| 0.94| 0.95| 0.91|
| 0.75| 0.53| 0.83| 0.73| 0.56|
| 0.77| 0.78| …

Run Code Online (Sandbox Code Playgroud)

python apache-spark apache-spark-sql pyspark

xce*_*cen

2021 02-18

3
推荐指数

1
解决办法

125
查看次数