小编sco*_*tin的帖子

重命名python列表中的项目

我有一个 python 列表如下:

['item1','item2','item3'] 
Run Code Online (Sandbox Code Playgroud)

我正在尝试将列表中的项目重命名为

['person1','person2','person3']
Run Code Online (Sandbox Code Playgroud)

谁能指导我。谢谢

python list python-3.x

3
推荐指数
3
解决办法
9047
查看次数

python-pptx - 更改自动形状边框颜色

我正在尝试为我创建的矩形自动形状的边框添加颜色,如下所示。默认颜色似乎是蓝色,但我不确定如何将其修改为自定义颜色。

shapes = slide.shapes
left = top = width = height = Inches(1.0)
shape = shapes.add_shape(
MSO_SHAPE.ROUNDED_RECTANGLE, left, top, width, height)

fill = shape.fill
fill.solid()
fill.fore_color.rgb = RGBColor(255, 255, 255)

slide.shapes._spTree.remove(shape._element)
slide.shapes._spTree.insert(2, shape._element)
Run Code Online (Sandbox Code Playgroud)

python-pptx

3
推荐指数
1
解决办法
1456
查看次数

使用pandas标记每组的每第N行

我有一个带有客户信息的Dataframe及其购买详情.我正在尝试添加一个新列,指示同一客户完成的每次第三次购买.

下面给出的是Dataframe

customer_name,bill_no,date
Mark,101,2018-10-01
Scott,102,2018-10-01
Pete,103,2018-10-02
Mark,104,2018-10-02
Mark,105,2018-10-04
Scott,106,2018-10-21
Julie,107,2018-10-03
Kevin,108,2018-10-07
Steve,109,2018-10-02
Mark,110,2018-10-06
Mark,111,2018-10-02
Mark,112,2018-10-05
Mark,113,2018-10-05
Run Code Online (Sandbox Code Playgroud)

我写的是过滤同一客户完成的每次第三次购买.所以在这种情况下,我想为下面的bill_no添加一个标志

Mark,105,2018-10-04
Mark,112,2018-10-05
Run Code Online (Sandbox Code Playgroud)

基本上每个3个账单的倍数为同一个客户生成.

python group-by dataframe pandas pandas-groupby

2
推荐指数
1
解决办法
89
查看次数

在 Pandas 中连接两个 groupby Dataframe 时出错

我有一个包含每日销售数据的 Dataframe,我使用它创建了一个 groupby 函数,如下所示:

df_new1 = df_1.groupby(['emp_id']).size() 
df_new2 = df_2.groupby(['emp_id']).size()
Run Code Online (Sandbox Code Playgroud)

df_new1 的示例输出:

emp_id,count1
101,2
102,4
Run Code Online (Sandbox Code Playgroud)

df_new2 的示例输出:

emp_id,count2
101,4
102,6
Run Code Online (Sandbox Code Playgroud)

我正在尝试比较上述两个数据帧(df_new1df_new2),如下所示:

new_df = pd.concat(df_new1, df_new2)
Run Code Online (Sandbox Code Playgroud)

这会引发错误:

TypeError: first argument must be an iterable of pandas objects, you passed an object of type "Series"
Run Code Online (Sandbox Code Playgroud)

预期输出:

emp_id,count1,count2
101,2,4
102,4,6
Run Code Online (Sandbox Code Playgroud)

其中 count1 是来自的值df_new1,count2 是来自的值df_new2

python pandas

2
推荐指数
1
解决办法
7506
查看次数

使用定界符从列表中提取数据

我有一组10个以下格式的python列表:

[ABC*DEF*123>~123*999*HHH]
[PQR*RST*567>~AWS*999*POI]
[XYZ*TGT*234>~2352*245*HFT]
[STU*DEF*789>~654*345*QQQ]
Run Code Online (Sandbox Code Playgroud)

我试图从上面的列表中提取数据,以便最终输出是一个Dataframe,并期望下面的输出

123,999,HHH
AWS,999,POI
2352,245,HFT
654,345,QQQ
Run Code Online (Sandbox Code Playgroud)

以下是到目前为止我所做的事情:

allFiles = Path where all the txt files are stored
list_ = []
for file_ in allFiles:
    with open(file_) as fp:
        lines1 = fp.read().split('\n')
        b = [i.split('~', 1)[1] for i in lines1]
        print(b)
Run Code Online (Sandbox Code Playgroud)

上面给了我如下列表:

[123*999*HHH]
[AWS*999*POI]
[2352*245*HFT]
[654*345*QQQ]
Run Code Online (Sandbox Code Playgroud)

我无法使用定界符(*)提取上述数据并将其拆分为不同的列,并将其保存到Dataframe中

python string list pandas

2
推荐指数
1
解决办法
107
查看次数

Pandas - 自动将缺失的列添加到数据框

我有一个列表,其中包含 pandas Dataframe 可以包含的所有可能的列。

possible_values = ['apples','banana','orange']
Run Code Online (Sandbox Code Playgroud)

我正在尝试执行检查,如果 Dataframe 不具有上述列表中的所有列,则需要将该列添加到 Dataframe 中,并将值设置为 0

例如,如果我的数据框包含以下列,则需要添加另外两列

df.columns = ['apples']
Run Code Online (Sandbox Code Playgroud)

预期产出

df.columns = ['apples','banana','orange']
Run Code Online (Sandbox Code Playgroud)

dataframe pandas

1
推荐指数
1
解决办法
1197
查看次数

Python-从文件夹中删除xlsx文件

我正在尝试删除xlsx文件夹中的所有文件,请注意它包含其他扩展名的文件。下面给出的是我尝试过的:

path = '/users/user/folder'.  <-- Folder that has all the files
list_ = []
for file_ in path:
    fileList = glob.glob(path + "/*.xlsx")
    fileList1 = " ".join(str(x) for x in fileList)
        try:
            os.remove(fileList1)
        except Exception as e:
            print(e)
Run Code Online (Sandbox Code Playgroud)

但上面并没有删除xlsx文件。

python delete-file

0
推荐指数
1
解决办法
5883
查看次数

Redshift-过滤掉字符左侧或右侧空白的行

我正在尝试检查是否排除在连字符(-)左侧或右侧具有空值的行的情况。

在下面的示例中,我需要过滤掉第2行和第3行,因为在连字符左侧或右侧空白。

尝试使用Redshift做到这一点。

样本数据:

data_set
apple - banana
 - banana
apple - 
Run Code Online (Sandbox Code Playgroud)

预期产量:

data_set
apple - banana
Run Code Online (Sandbox Code Playgroud)

sql amazon-redshift

0
推荐指数
1
解决办法
19
查看次数