小编yos*_*rry的帖子

使用df.to_sql将pandas数据帧写入sqlite数据库表时如何设置主键

我使用pandas df.to_sql创建了一个sqlite数据库,但访问它似乎比只读取500mb csv文件慢得多.

我需要:

使用df.to_sql方法为每个表设置主键
告诉sqlite数据库3.dataframe中每个列的数据类型是什么？ - 我可以传递像[整数,整数,文本,文本]这样的列表

代码....(格式代码按钮不起作用)

if ext == ".csv": 
df = pd.read_csv("/Users/data/" +filename) 
columns = df.columns columns = [i.replace(' ', '_') for i in columns]

df.columns = columns
df.to_sql(name,con,flavor='sqlite',schema=None,if_exists='replace',index=True,index_label=None, chunksize=None, dtype=None)

Run Code Online (Sandbox Code Playgroud)

python sqlite primary-key pandas

yos*_*rry

2016 09-09

11
推荐指数

3
解决办法

9006
查看次数

如何将函数同时应用于pandas数据框中的多个列

我经常处理格式不正确的数据(即数字字段不一致等)

可能还有其他方法,我不知道,但我在数据框中格式化单个列的方式是使用函数并将列映射到该函数.

format = df.column_name.map(format_number)

Run Code Online (Sandbox Code Playgroud)

问题:1 - 如果我有一个包含50列的数据框,并希望将该格式应用于多列,等等,如第1,3,5,7,9列,该怎么办？

你可以去吗:

format = df.1,3,5,9.map(format_number)

Run Code Online (Sandbox Code Playgroud)

..这样我可以在一行中格式化我的所有数字列？

python filtering slice pandas

yos*_*rry

2014 02-28

9
推荐指数

1
解决办法

9973
查看次数

如何判断 Excel 单元格是否使用 VBA 应用了条件格式

我有一系列应用了条件格式的单元格。

目的是在视觉上区分正值、负值和无变化的值。

如何使用 VBA 检查单元格是否应用了条件格式（例如由于负数而导致单元格的颜色）？

excel vba conditional-formatting

yos*_*rry

lucky-day

9
推荐指数

1
解决办法

1万
查看次数

将总行追加到数据帧后删除pandas数据帧索引的名称

我已经计算了一周中的一系列总计提示,并将其附加到totalspt数据框的底部.

我已将数据框设置index.name为totalspt无.

但是,当数据帧显示默认的0,1,2,3索引时,它不会在索引正上方的左上角显示默认的空单元格.

我怎么能在数据帧中使这个单元格为空？

   total_bill   tip sex smoker  day time  size   tip_pct
0       16.54  1.01   F      N  Sun    D     2  0.061884
1       12.54  1.40   F      N  Mon    D     2  0.111643
2       10.34  3.50   M      Y  Tue    L     4  0.338491
3       20.25  2.50   M      Y  Wed    D     2  0.123457
4       16.54  1.01   M      Y  Thu    D     1  0.061064
5       12.54  1.40   F      N  Fri    L     2  0.111643
6       10.34  3.50   F      Y  Sat    D     3 …

Run Code Online (Sandbox Code Playgroud)

python indexing pivot-table pandas

yos*_*rry

2015 09-29

9
推荐指数

1
解决办法

4206
查看次数

如何创建pandas数据帧字典,并将数据帧返回到excel工作表？

大家好,

我正在学习pandas和python,我想创建一个包含一些数据帧的字典,然后我可以在每个数据帧上运行指标.对于每个唯一的群集名称(其中一列),我想创建一个数据帧(原始数据帧的子集).

然后我希望能够选择它,在其上运行指标,将结果放在一个新的数据帧中,然后使用xlsxwriter python库将原始数据帧(每个子集)放入一个单独的工作表中.

#create dictionary object

    c_dict = {}

#get a list of the unique names

c_dict= data.groupby('Cluster').groups

#create a dictionary of dataframes, one for each cluster

for cluster in c_dict.items():
    df = data[data['Cluster']==cluster
    c_dict[cluster] =df                                                        <<< im getting invalid syntax here

#go through the dictionary and create a worksheet and put the dataframe in it.

for k,v in c_dict.items():
    dataframe = GetDF(k)                                                            <<< creating worksheets and puts the data from the dataframe > worksheet is not working …

Run Code Online (Sandbox Code Playgroud)

python dictionary pandas

yos*_*rry

2014 02-25

7
推荐指数

1
解决办法

2万
查看次数

根据值对 pandas 数据框中的数据项进行颜色着色

我有一个包含一些数据的数据框（名称、amount_x、amount_y 和“diff”列，用于减去 X 和 Y 数量。

我想对单元格进行着色，其中“diff”是正数（并将其设置为绿色），如果是负数，则将其设置为红色）？

这可能吗？

python visualization pandas

yos*_*rry

2017 03-11

6
推荐指数

1
解决办法

1万
查看次数

如何强制matplotlib只显示Y轴上的整数

我可视化的数据只有在整数时才有意义.

即,就我正在分析的信息的背景而言,记录的0.2是没有意义的.

如何强制matplotlib仅使用Y轴上的整数.即1,100,5等？不是0.1,0.2等

for a in account_list:
    f = plt.figure()
    f.set_figheight(20)
    f.set_figwidth(20)
    f.sharex = True
    f.sharey=True

    left  = 0.125  # the left side of the subplots of the figure
    right = 0.9    # the right side of the subplots of the figure
    bottom = 0.1   # the bottom of the subplots of the figure
    top = 0.9      # the top of the subplots of the figure
    wspace = 0.2   # the amount of width reserved for blank space between subplots …

Run Code Online (Sandbox Code Playgroud)

python visualization

yos*_*rry

2014 12-16

6
推荐指数

4
解决办法

9048
查看次数