小编yos*_*rry的帖子

使用df.to_sql将pandas数据帧写入sqlite数据库表时如何设置主键

我使用pandas df.to_sql创建了一个sqlite数据库,但访问它似乎比只读取500mb csv文件慢得多.

我需要:

  1. 使用df.to_sql方法为每个表设置主键
  2. 告诉sqlite数据库3.dataframe中每个列的数据类型是什么? - 我可以传递像[整数,整数,文本,文本]这样的列表

代码....(格式代码按钮不起作用)

if ext == ".csv": 
df = pd.read_csv("/Users/data/" +filename) 
columns = df.columns columns = [i.replace(' ', '_') for i in columns]

df.columns = columns
df.to_sql(name,con,flavor='sqlite',schema=None,if_exists='replace',index=True,index_label=None, chunksize=None, dtype=None)
Run Code Online (Sandbox Code Playgroud)

python sqlite primary-key pandas

11
推荐指数
3
解决办法
9006
查看次数

如何将函数同时应用于pandas数据框中的多个列

我经常处理格式不正确的数据(即数字字段不一致等)

可能还有其他方法,我不知道,但我在数据框中格式化单个列的方式是使用函数并将列映射到该函数.

format = df.column_name.map(format_number)
Run Code Online (Sandbox Code Playgroud)

问题:1 - 如果我有一个包含50列的数据框,并希望将该格式应用于多列,等等,如第1,3,5,7,9列,该怎么办?

你可以去吗:

format = df.1,3,5,9.map(format_number)
Run Code Online (Sandbox Code Playgroud)

..这样我可以在一行中格式化我的所有数字列?

python filtering slice pandas

9
推荐指数
1
解决办法
9973
查看次数

如何判断 Excel 单元格是否使用 VBA 应用了条件格式

我有一系列应用了条件格式的单元格。

目的是在视觉上区分正值、负值和无变化的值。

如何使用 VBA 检查单元格是否应用了条件格式(例如由于负数而导致单元格的颜色)?

excel vba conditional-formatting

9
推荐指数
1
解决办法
1万
查看次数

将总行追加到数据帧后删除pandas数据帧索引的名称

我已经计算了一周中的一系列总计提示,并将其附加到totalspt数据框的底部.

我已将数据框设置index.nametotalspt无.

但是,当数据帧显示默认的0,1,2,3索引时,它不会在索引正上方的左上角显示默认的空单元格.

我怎么能在数据帧中使这个单元格为空?

在此输入图像描述

   total_bill   tip sex smoker  day time  size   tip_pct
0       16.54  1.01   F      N  Sun    D     2  0.061884
1       12.54  1.40   F      N  Mon    D     2  0.111643
2       10.34  3.50   M      Y  Tue    L     4  0.338491
3       20.25  2.50   M      Y  Wed    D     2  0.123457
4       16.54  1.01   M      Y  Thu    D     1  0.061064
5       12.54  1.40   F      N  Fri    L     2  0.111643
6       10.34  3.50   F      Y  Sat    D     3 …
Run Code Online (Sandbox Code Playgroud)

python indexing pivot-table pandas

9
推荐指数
1
解决办法
4206
查看次数

如何创建pandas数据帧字典,并将数据帧返回到excel工作表?

如何创建pandas数据帧字典,并将数据帧返回到excel工作表?

大家好,

我正在学习pandas和python,我想创建一个包含一些数据帧的字典,然后我可以在每个数据帧上运行指标.对于每个唯一的群集名称(其中一列),我想创建一个数据帧(原始数据帧的子集).

然后我希望能够选择它,在其上运行指标,将结果放在一个新的数据帧中,然后使用xlsxwriter python库将原始数据帧(每个子集)放入一个单独的工作表中.

#create dictionary object

    c_dict = {}

#get a list of the unique names

c_dict= data.groupby('Cluster').groups

#create a dictionary of dataframes, one for each cluster

for cluster in c_dict.items():
    df = data[data['Cluster']==cluster
    c_dict[cluster] =df                                                        <<< im getting invalid syntax here

#go through the dictionary and create a worksheet and put the dataframe in it.

for k,v in c_dict.items():
    dataframe = GetDF(k)                                                            <<< creating worksheets and puts the data from the dataframe > worksheet is not working …
Run Code Online (Sandbox Code Playgroud)

python dictionary pandas

7
推荐指数
1
解决办法
2万
查看次数

根据值对 pandas 数据框中的数据项进行颜色着色

我有一个包含一些数据的数据框(名称、amount_x、amount_y 和“diff”列,用于减去 X 和 Y 数量。

我想对单元格进行着色,其中“diff”是正数(并将其设置为绿色),如果是负数,则将其设置为红色)?

这可能吗?

python visualization pandas

6
推荐指数
1
解决办法
1万
查看次数

如何强制matplotlib只显示Y轴上的整数

我可视化的数据只有在整数时才有意义.

即,就我正在分析的信息的背景而言,记录的0.2是没有意义的.

如何强制matplotlib仅使用Y轴上的整数.即1,100,5等?不是0.1,0.2等

for a in account_list:
    f = plt.figure()
    f.set_figheight(20)
    f.set_figwidth(20)
    f.sharex = True
    f.sharey=True

    left  = 0.125  # the left side of the subplots of the figure
    right = 0.9    # the right side of the subplots of the figure
    bottom = 0.1   # the bottom of the subplots of the figure
    top = 0.9      # the top of the subplots of the figure
    wspace = 0.2   # the amount of width reserved for blank space between subplots …
Run Code Online (Sandbox Code Playgroud)

python visualization

6
推荐指数
4
解决办法
9048
查看次数

可以请求python库在存储该页面的内容之前强制页面加载所有javascript动态内容

Beautifulsoup通常可用于(1)将页面内容存储在变量中,以及(2)解析网页中的元素.

但是它上面的Beautifulsoup本身无法打开 - 密码保护的HTTP错误403页.所以我使用了这个任务的请求.

现在我想知道Requests库是否能够强制加载页面上的javascript?

我正在使用python2.7

请求是否具有request.open(some url).forceJavascriptLoad的能力

javascript python

5
推荐指数
1
解决办法
2154
查看次数

如何更改数据透视表字段的名称并避免错误“数据透视表字段名称已存在”

我在两个工作表上创建两个数据透视表,其中一个字段是项目数。

当我将此字段放入数据透视表时,它变为“项目数量总和”。

我的项目有两个阶段(“开始”和“结束”),每个阶段都在单独的工作表上。

我想创建一个图表,每个工作表都有一个图表,显示“项目数量”,其中两个实例中图表上的名称都是“项目数量”。

如何实现这一点并避免“字段名称已存在错误”?

在我看来,我在“字段设置”的“自定义名称”框中提供的字段名称别名不能与工作表中的列标题(您首先用来创建数据透视表)相同。

有没有办法解决这个问题?

一种选择是在数据透视表字段名称的前端或末尾添加一个空格,但必须有更好的方法。

为枢轴字段添加空间

在此处输入图片说明

excel pivot-table

5
推荐指数
1
解决办法
3万
查看次数

使用JQL在过滤器中自定义jira工作流状态的排序顺序

我知道您可以通过管理>问题>状态和排序顺序更改订单状态,但我更愿意在我的jql中按顶部和特定订单的某些状态订购结果.

是否可以使用JQL来排序查询中的状态.

例如:

如果您有以下状态:

  1. 评论,
  2. 积压,
  3. 开发中,
  4. 测试,
  5. 并做了

但您不想按字母顺序排序它们是否可以定义客户订单?

例如,自定义订单的JQL查询可能是 ORDER BY Status ("review","backlog","in development").

在这种情况下,状态将按此顺序在Y轴上从上到下显示("评论","积压","在开发中")

jira jql

5
推荐指数
1
解决办法
1441
查看次数