我有一个 python 列表如下:
['item1','item2','item3']
Run Code Online (Sandbox Code Playgroud)
我正在尝试将列表中的项目重命名为
['person1','person2','person3']
Run Code Online (Sandbox Code Playgroud)
谁能指导我。谢谢
我正在尝试为我创建的矩形自动形状的边框添加颜色,如下所示。默认颜色似乎是蓝色,但我不确定如何将其修改为自定义颜色。
shapes = slide.shapes
left = top = width = height = Inches(1.0)
shape = shapes.add_shape(
MSO_SHAPE.ROUNDED_RECTANGLE, left, top, width, height)
fill = shape.fill
fill.solid()
fill.fore_color.rgb = RGBColor(255, 255, 255)
slide.shapes._spTree.remove(shape._element)
slide.shapes._spTree.insert(2, shape._element)
Run Code Online (Sandbox Code Playgroud) 我有一个带有客户信息的Dataframe及其购买详情.我正在尝试添加一个新列,指示同一客户完成的每次第三次购买.
下面给出的是Dataframe
customer_name,bill_no,date
Mark,101,2018-10-01
Scott,102,2018-10-01
Pete,103,2018-10-02
Mark,104,2018-10-02
Mark,105,2018-10-04
Scott,106,2018-10-21
Julie,107,2018-10-03
Kevin,108,2018-10-07
Steve,109,2018-10-02
Mark,110,2018-10-06
Mark,111,2018-10-02
Mark,112,2018-10-05
Mark,113,2018-10-05
Run Code Online (Sandbox Code Playgroud)
我写的是过滤同一客户完成的每次第三次购买.所以在这种情况下,我想为下面的bill_no添加一个标志
Mark,105,2018-10-04
Mark,112,2018-10-05
Run Code Online (Sandbox Code Playgroud)
基本上每个3个账单的倍数为同一个客户生成.
我有一个包含每日销售数据的 Dataframe,我使用它创建了一个 groupby 函数,如下所示:
df_new1 = df_1.groupby(['emp_id']).size()
df_new2 = df_2.groupby(['emp_id']).size()
Run Code Online (Sandbox Code Playgroud)
df_new1 的示例输出:
emp_id,count1
101,2
102,4
Run Code Online (Sandbox Code Playgroud)
df_new2 的示例输出:
emp_id,count2
101,4
102,6
Run Code Online (Sandbox Code Playgroud)
我正在尝试比较上述两个数据帧(df_new1和df_new2),如下所示:
new_df = pd.concat(df_new1, df_new2)
Run Code Online (Sandbox Code Playgroud)
这会引发错误:
TypeError: first argument must be an iterable of pandas objects, you passed an object of type "Series"
Run Code Online (Sandbox Code Playgroud)
预期输出:
emp_id,count1,count2
101,2,4
102,4,6
Run Code Online (Sandbox Code Playgroud)
其中 count1 是来自的值df_new1,count2 是来自的值df_new2
我有一组10个以下格式的python列表:
[ABC*DEF*123>~123*999*HHH]
[PQR*RST*567>~AWS*999*POI]
[XYZ*TGT*234>~2352*245*HFT]
[STU*DEF*789>~654*345*QQQ]
Run Code Online (Sandbox Code Playgroud)
我试图从上面的列表中提取数据,以便最终输出是一个Dataframe,并期望下面的输出:
123,999,HHH
AWS,999,POI
2352,245,HFT
654,345,QQQ
Run Code Online (Sandbox Code Playgroud)
以下是到目前为止我所做的事情:
allFiles = Path where all the txt files are stored
list_ = []
for file_ in allFiles:
with open(file_) as fp:
lines1 = fp.read().split('\n')
b = [i.split('~', 1)[1] for i in lines1]
print(b)
Run Code Online (Sandbox Code Playgroud)
上面给了我如下列表:
[123*999*HHH]
[AWS*999*POI]
[2352*245*HFT]
[654*345*QQQ]
Run Code Online (Sandbox Code Playgroud)
我无法使用定界符(*)提取上述数据并将其拆分为不同的列,并将其保存到Dataframe中
我有一个列表,其中包含 pandas Dataframe 可以包含的所有可能的列。
possible_values = ['apples','banana','orange']
Run Code Online (Sandbox Code Playgroud)
我正在尝试执行检查,如果 Dataframe 不具有上述列表中的所有列,则需要将该列添加到 Dataframe 中,并将值设置为 0
例如,如果我的数据框包含以下列,则需要添加另外两列
df.columns = ['apples']
Run Code Online (Sandbox Code Playgroud)
预期产出
df.columns = ['apples','banana','orange']
Run Code Online (Sandbox Code Playgroud) 我正在尝试删除xlsx文件夹中的所有文件,请注意它包含其他扩展名的文件。下面给出的是我尝试过的:
path = '/users/user/folder'. <-- Folder that has all the files
list_ = []
for file_ in path:
fileList = glob.glob(path + "/*.xlsx")
fileList1 = " ".join(str(x) for x in fileList)
try:
os.remove(fileList1)
except Exception as e:
print(e)
Run Code Online (Sandbox Code Playgroud)
但上面并没有删除xlsx文件。
我正在尝试检查是否排除在连字符(-)左侧或右侧具有空值的行的情况。
在下面的示例中,我需要过滤掉第2行和第3行,因为在连字符左侧或右侧空白。
尝试使用Redshift做到这一点。
样本数据:
data_set
apple - banana
- banana
apple -
Run Code Online (Sandbox Code Playgroud)
预期产量:
data_set
apple - banana
Run Code Online (Sandbox Code Playgroud) python ×5
pandas ×4
dataframe ×2
list ×2
delete-file ×1
group-by ×1
python-3.x ×1
python-pptx ×1
sql ×1
string ×1