小编sco*_*tin的帖子

重命名python列表中的项目

我有一个 python 列表如下：

['item1','item2','item3']

Run Code Online (Sandbox Code Playgroud)

我正在尝试将列表中的项目重命名为

['person1','person2','person3']

Run Code Online (Sandbox Code Playgroud)

谁能指导我。谢谢

python list python-3.x

sco*_*tin

2018 11-26

3
推荐指数

3
解决办法

9047
查看次数

python-pptx - 更改自动形状边框颜色

我正在尝试为我创建的矩形自动形状的边框添加颜色，如下所示。默认颜色似乎是蓝色，但我不确定如何将其修改为自定义颜色。

shapes = slide.shapes
left = top = width = height = Inches(1.0)
shape = shapes.add_shape(
MSO_SHAPE.ROUNDED_RECTANGLE, left, top, width, height)

fill = shape.fill
fill.solid()
fill.fore_color.rgb = RGBColor(255, 255, 255)

slide.shapes._spTree.remove(shape._element)
slide.shapes._spTree.insert(2, shape._element)

Run Code Online (Sandbox Code Playgroud)

python-pptx

sco*_*tin

lucky-day

3
推荐指数

1
解决办法

1456
查看次数

使用pandas标记每组的每第N行

我有一个带有客户信息的Dataframe及其购买详情.我正在尝试添加一个新列,指示同一客户完成的每次第三次购买.

下面给出的是Dataframe

customer_name,bill_no,date
Mark,101,2018-10-01
Scott,102,2018-10-01
Pete,103,2018-10-02
Mark,104,2018-10-02
Mark,105,2018-10-04
Scott,106,2018-10-21
Julie,107,2018-10-03
Kevin,108,2018-10-07
Steve,109,2018-10-02
Mark,110,2018-10-06
Mark,111,2018-10-02
Mark,112,2018-10-05
Mark,113,2018-10-05

Run Code Online (Sandbox Code Playgroud)

我写的是过滤同一客户完成的每次第三次购买.所以在这种情况下,我想为下面的bill_no添加一个标志

Mark,105,2018-10-04
Mark,112,2018-10-05

Run Code Online (Sandbox Code Playgroud)

基本上每个3个账单的倍数为同一个客户生成.

python group-by dataframe pandas pandas-groupby

sco*_*tin

2018 12-17

2
推荐指数

1
解决办法

89
查看次数

在 Pandas 中连接两个 groupby Dataframe 时出错

我有一个包含每日销售数据的 Dataframe，我使用它创建了一个 groupby 函数，如下所示：

df_new1 = df_1.groupby(['emp_id']).size() 
df_new2 = df_2.groupby(['emp_id']).size()

Run Code Online (Sandbox Code Playgroud)

df_new1 的示例输出：

emp_id,count1
101,2
102,4

Run Code Online (Sandbox Code Playgroud)

df_new2 的示例输出：

emp_id,count2
101,4
102,6

Run Code Online (Sandbox Code Playgroud)

我正在尝试比较上述两个数据帧（df_new1和df_new2），如下所示：

new_df = pd.concat(df_new1, df_new2)

Run Code Online (Sandbox Code Playgroud)

这会引发错误：

TypeError: first argument must be an iterable of pandas objects, you passed an object of type "Series"

Run Code Online (Sandbox Code Playgroud)

预期输出：

emp_id,count1,count2
101,2,4
102,4,6

Run Code Online (Sandbox Code Playgroud)

其中 count1 是来自的值df_new1，count2 是来自的值df_new2

python pandas

sco*_*tin

2019 01-15

2
推荐指数

1
解决办法

7506
查看次数

使用定界符从列表中提取数据

我有一组10个以下格式的python列表：

[ABC*DEF*123>~123*999*HHH]
[PQR*RST*567>~AWS*999*POI]
[XYZ*TGT*234>~2352*245*HFT]
[STU*DEF*789>~654*345*QQQ]

Run Code Online (Sandbox Code Playgroud)

我试图从上面的列表中提取数据，以便最终输出是一个Dataframe，并期望下面的输出：

123,999,HHH
AWS,999,POI
2352,245,HFT
654,345,QQQ

Run Code Online (Sandbox Code Playgroud)

以下是到目前为止我所做的事情：

allFiles = Path where all the txt files are stored
list_ = []
for file_ in allFiles:
    with open(file_) as fp:
        lines1 = fp.read().split('\n')
        b = [i.split('~', 1)[1] for i in lines1]
        print(b)

Run Code Online (Sandbox Code Playgroud)

上面给了我如下列表：

[123*999*HHH]
[AWS*999*POI]
[2352*245*HFT]
[654*345*QQQ]

Run Code Online (Sandbox Code Playgroud)

我无法使用定界符（*）提取上述数据并将其拆分为不同的列，并将其保存到Dataframe中

python string list pandas

sco*_*tin

2019 03-15

2
推荐指数

1
解决办法

107
查看次数

Pandas - 自动将缺失的列添加到数据框

我有一个列表，其中包含 pandas Dataframe 可以包含的所有可能的列。

possible_values = ['apples','banana','orange']

Run Code Online (Sandbox Code Playgroud)

我正在尝试执行检查，如果 Dataframe 不具有上述列表中的所有列，则需要将该列添加到 Dataframe 中，并将值设置为 0

例如，如果我的数据框包含以下列，则需要添加另外两列

df.columns = ['apples']

Run Code Online (Sandbox Code Playgroud)

预期产出

df.columns = ['apples','banana','orange']

Run Code Online (Sandbox Code Playgroud)

dataframe pandas

sco*_*tin

lucky-day

1
推荐指数

1
解决办法

1197
查看次数

Python-从文件夹中删除xlsx文件

我正在尝试删除xlsx文件夹中的所有文件，请注意它包含其他扩展名的文件。下面给出的是我尝试过的：

path = '/users/user/folder'.  <-- Folder that has all the files
list_ = []
for file_ in path:
    fileList = glob.glob(path + "/*.xlsx")
    fileList1 = " ".join(str(x) for x in fileList)
        try:
            os.remove(fileList1)
        except Exception as e:
            print(e)

Run Code Online (Sandbox Code Playgroud)

但上面并没有删除xlsx文件。

python delete-file

sco*_*tin

lucky-day

0
推荐指数

1
解决办法

5883
查看次数

Redshift-过滤掉字符左侧或右侧空白的行

我正在尝试检查是否排除在连字符（-）左侧或右侧具有空值的行的情况。

在下面的示例中，我需要过滤掉第2行和第3行，因为在连字符左侧或右侧空白。

尝试使用Redshift做到这一点。

样本数据：

data_set
apple - banana
 - banana
apple -

Run Code Online (Sandbox Code Playgroud)

预期产量：

data_set
apple - banana

Run Code Online (Sandbox Code Playgroud)

sql amazon-redshift

sco*_*tin

lucky-day

0
推荐指数

1
解决办法

19
查看次数

标签统计

python ×5

pandas ×4

dataframe ×2

list ×2

amazon-redshift ×1

delete-file ×1

group-by ×1

pandas-groupby ×1

python-3.x ×1

python-pptx ×1

sql ×1

string ×1

标签 统计

小编sco_tin的帖子

标签统计