小编use*_*322的帖子

Python将逗号分隔列表转换为pandas数据帧

我正在努力将逗号分隔列表转换为多列(7)数据帧.

print (type(mylist))

<type 'list'>
Print(mylist)


['AN,2__AAS000,26,20150826113000,-283.000,20150826120000,-283.000',         'AN,2__AE000,26,20150826113000,0.000,20150826120000,0.000',.........
Run Code Online (Sandbox Code Playgroud)

以下内容创建单个列的框架:

df = pd.DataFrame(mylist)
Run Code Online (Sandbox Code Playgroud)

我已经回顾了Pandas的内置csv功能,但我的csv数据保存在列表中.我怎样才能简单地将列表转换为7列数据帧.

提前致谢.

python csv pandas

13
推荐指数
1
解决办法
2万
查看次数

Python Pandas Dataframe按组中的最大值选择行

我有一个通过df.pivot创建的数据框:

type                             start  end
F_Type         to_date                     
A              20150908143000    345    316
B              20150908140300    NaN    480
               20150908140600    NaN    120
               20150908143000  10743   8803
C              20150908140100    NaN   1715
               20150908140200    NaN   1062
               20150908141000    NaN    145
               20150908141500    418    NaN
               20150908141800    NaN    450
               20150908142900   1973   1499
               20150908143000  19522  16659
D              20150908143000    433     65
E              20150908143000   7290   7375
F              20150908143000      0      0
G              20150908143000   1796    340
Run Code Online (Sandbox Code Playgroud)

我想为每个'F_TYPE'过滤并返回一行,只返回带有Maximum'to_date'的行.我想返回以下数据帧:

type                             start  end
F_Type         to_date                     
A              20150908143000    345    316
B              20150908143000  10743   8803
C              20150908143000  19522  16659
D              20150908143000    433     65 …
Run Code Online (Sandbox Code Playgroud)

python pandas

13
推荐指数
2
解决办法
2万
查看次数

Postgres按时间戳分组为6小时桶

我有以下简单表:

ID      TIMESTAMP               VALUE
4   2011-05-27 15:50:04 1253
5   2011-05-27 15:55:02 1304
6   2011-05-27 16:00:02 1322
7   2011-05-27 16:05:01 1364
Run Code Online (Sandbox Code Playgroud)

我想了平均VALUES,并且GROUPTIMESTAMP一天为6个小时桶.例如00:00至06:00,06:00至12:00,12:00至18:00和18:00至00:00.

我可以使用以下查询按年,月,日和小时进行分组:

select avg(VALUE),
  EXTRACT(year from TIMESTAMP) AS year,
  EXTRACT(month from TIMESTAMP) AS month,
  EXTRACT(day from TIMESTAMP) as day
    from TABLE
      group by year,month,day
Run Code Online (Sandbox Code Playgroud)

但我无法按照上面的定义将每一天分为4个时段,我们非常欢迎任何帮助.

sql postgresql

10
推荐指数
1
解决办法
2万
查看次数

如何在大熊猫中结合枢轴和累计和

我有一个简单的数据框:

   type  | code | date    |value

0  apple | ap1  |08/12/14 |2
1  apple | ap1  |09/12/14 |12
2  apple | ap1  |10/12/14 |4
3  banana| b1   |08/12/14 |5
4  banana| b1   |09/12/14 |67
5  banana| b1   |10/12/14 |77
6  orange| o1   |08/12/14 |21
7  orange| o1   |09/12/14 |1
8  orange| o1   |10/12/14 |16
Run Code Online (Sandbox Code Playgroud)

我可以使用以下功能轻松地将日期作为列进行透视:

pivot = pd.pivot_table(data,values=('value'),rows=['code','type'],cols='date',aggfunc=np.sum)
Run Code Online (Sandbox Code Playgroud)

但是我找不到一种方法来使用累积和来代替np.sum,我想以以下格式显示数据吗?这可能吗?

type    08/12/14    09/12/14    10/12/14
apple   2           12          4
banana  7           79          81
orange  28          80          97
Run Code Online (Sandbox Code Playgroud)

python pivot pandas

1
推荐指数
1
解决办法
2112
查看次数

Postgres(亚马逊RDS)如何计算加权平均值

我正在使用Amazon RDS Postgres数据库(9.4.4),我想计算一些数据的加权平均值.

我发现以下扩展看起来非常适合这项工作. https://github.com/Kozea/weighted_mean

但是我现在不确定如何安装扩展,因为我的初步研究表明只允许"支持"扩展.

http://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/CHAP_PostgreSQL.html#PostgreSQL.Concepts.General.FeatureSupport

我有什么选择使用此扩展程序.我不想重新发明轮子,我不熟悉在Postgres中安装任何类型的功能/扩展.

谢谢

postgresql amazon-rds postgresql-9.4

1
推荐指数
1
解决办法
851
查看次数

JAX-WS Netbeans 如何启用压缩 Web 服务客户端

我在 Netbeans 7.1.2 中使用了 Web 服务客户端向导,但是当我尝试调用其中一个方法时,我收到以下错误:

javax.xml.ws.soap.SOAPFaultException:异常:未启用压缩,此 Web 服务期望客户端支持 GZIP、Deflate 压缩

生成的骨架文件很多,我无法弄清楚如何启用压缩。有人可以建议吗?

非常感谢

compression netbeans web-services jax-ws

0
推荐指数
1
解决办法
4077
查看次数