我正在努力将逗号分隔列表转换为多列(7)数据帧.
print (type(mylist))
<type 'list'>
Print(mylist)
['AN,2__AAS000,26,20150826113000,-283.000,20150826120000,-283.000', 'AN,2__AE000,26,20150826113000,0.000,20150826120000,0.000',.........
Run Code Online (Sandbox Code Playgroud)
以下内容创建单个列的框架:
df = pd.DataFrame(mylist)
Run Code Online (Sandbox Code Playgroud)
我已经回顾了Pandas的内置csv功能,但我的csv数据保存在列表中.我怎样才能简单地将列表转换为7列数据帧.
提前致谢.
我有一个通过df.pivot创建的数据框:
type start end
F_Type to_date
A 20150908143000 345 316
B 20150908140300 NaN 480
20150908140600 NaN 120
20150908143000 10743 8803
C 20150908140100 NaN 1715
20150908140200 NaN 1062
20150908141000 NaN 145
20150908141500 418 NaN
20150908141800 NaN 450
20150908142900 1973 1499
20150908143000 19522 16659
D 20150908143000 433 65
E 20150908143000 7290 7375
F 20150908143000 0 0
G 20150908143000 1796 340
Run Code Online (Sandbox Code Playgroud)
我想为每个'F_TYPE'过滤并返回一行,只返回带有Maximum'to_date'的行.我想返回以下数据帧:
type start end
F_Type to_date
A 20150908143000 345 316
B 20150908143000 10743 8803
C 20150908143000 19522 16659
D 20150908143000 433 65 …Run Code Online (Sandbox Code Playgroud) 我有以下简单表:
ID TIMESTAMP VALUE
4 2011-05-27 15:50:04 1253
5 2011-05-27 15:55:02 1304
6 2011-05-27 16:00:02 1322
7 2011-05-27 16:05:01 1364
Run Code Online (Sandbox Code Playgroud)
我想了平均VALUES,并且GROUP每TIMESTAMP一天为6个小时桶.例如00:00至06:00,06:00至12:00,12:00至18:00和18:00至00:00.
我可以使用以下查询按年,月,日和小时进行分组:
select avg(VALUE),
EXTRACT(year from TIMESTAMP) AS year,
EXTRACT(month from TIMESTAMP) AS month,
EXTRACT(day from TIMESTAMP) as day
from TABLE
group by year,month,day
Run Code Online (Sandbox Code Playgroud)
但我无法按照上面的定义将每一天分为4个时段,我们非常欢迎任何帮助.
我有一个简单的数据框:
type | code | date |value
0 apple | ap1 |08/12/14 |2
1 apple | ap1 |09/12/14 |12
2 apple | ap1 |10/12/14 |4
3 banana| b1 |08/12/14 |5
4 banana| b1 |09/12/14 |67
5 banana| b1 |10/12/14 |77
6 orange| o1 |08/12/14 |21
7 orange| o1 |09/12/14 |1
8 orange| o1 |10/12/14 |16
Run Code Online (Sandbox Code Playgroud)
我可以使用以下功能轻松地将日期作为列进行透视:
pivot = pd.pivot_table(data,values=('value'),rows=['code','type'],cols='date',aggfunc=np.sum)
Run Code Online (Sandbox Code Playgroud)
但是我找不到一种方法来使用累积和来代替np.sum,我想以以下格式显示数据吗?这可能吗?
type 08/12/14 09/12/14 10/12/14
apple 2 12 4
banana 7 79 81
orange 28 80 97
Run Code Online (Sandbox Code Playgroud) 我正在使用Amazon RDS Postgres数据库(9.4.4),我想计算一些数据的加权平均值.
我发现以下扩展看起来非常适合这项工作. https://github.com/Kozea/weighted_mean
但是我现在不确定如何安装扩展,因为我的初步研究表明只允许"支持"扩展.
我有什么选择使用此扩展程序.我不想重新发明轮子,我不熟悉在Postgres中安装任何类型的功能/扩展.
谢谢
我在 Netbeans 7.1.2 中使用了 Web 服务客户端向导,但是当我尝试调用其中一个方法时,我收到以下错误:
javax.xml.ws.soap.SOAPFaultException:异常:未启用压缩,此 Web 服务期望客户端支持 GZIP、Deflate 压缩
生成的骨架文件很多,我无法弄清楚如何启用压缩。有人可以建议吗?
非常感谢
pandas ×3
python ×3
postgresql ×2
amazon-rds ×1
compression ×1
csv ×1
jax-ws ×1
netbeans ×1
pivot ×1
sql ×1
web-services ×1