如何在下表输出格式中写下面的数据?
字典列表
data=[{'date': datetime.date(2011, 2, 8), 'user': u'xxx', 'status': u'P'}, {'date': datetime.date(2011, 2, 8), 'user': u'yyy', 'status': u'P'}, {'date': datetime.date(2011, 2, 8), 'user': u'zzz', 'status': u'P'}, {'date': datetime.date(2011, 2, 9), 'user': u'xxx, 'status': u'P'}, {'date': datetime.date(2011, 2, 9), 'user': u'yyy', 'status': u'E'}, {'date': datetime.date(2011, 2, 9), 'user': u'zzz', 'status': u'E'}, {'date': datetime.date(2011, 2, 10), 'user': u'xxx', 'status': u'P'}, {'date': datetime.date(2011, 2, 10), 'user': u'yyy', 'status': u'P'}, {'date': datetime.date(2011, 2, 10), 'user': u'zzz', 'status': u'P'}]
Run Code Online (Sandbox Code Playgroud)
输出格式应为:
S.no user 2011-02-08 2011-02-09 2011-02-10 p-total E-total total
1 xxx p p p 3 0 3
2 yyy p E p 2 1 3
3 zzz p E E 1 2 3
Run Code Online (Sandbox Code Playgroud)
请帮忙
Mar*_*air 18
我写这样的答案有点矛盾 - 似乎只是制作了一个很小的教学价值的完整解决方案,但我试图让它尽可能地普遍有用......
如果我理解您正在尝试正确执行的操作,则需要将data每个用户的行设置为CSV.有一系列日期,您希望每个日期有一列 - 该列表示该日期用户的状态.然后有列生成每个日期的每个状态的总计,依此类推.你引用的输出看起来最像CSV,标签作为分隔符,尽管正如eumiro指出的那样,它并不完全正确.但是,我们假设您要编写以制表符分隔的数据.从您的问题中不清楚如果您发现data用户在一天内有两种不同的状态会发生什么,所以让我们检查并抛出异常.
请注意,最后一段中的所有内容都应该在您的问题中,以及您迄今为止最佳尝试的代码.
因此,使用DictWritercsv模块是一个合理的想法,但是要使用该类,您需要为每个行添加一个字典,将列标题映射到值.因此,您可以迭代所有内容data以生成字典字典,将用户映射到表示该用户的行的字典.你可以这样做:
from collections import defaultdict
import csv
from datetime import date
user_to_row = defaultdict(dict)
for d in data:
user = d['user']
status = d['status']
row_dict = user_to_row[user]
row_dict['user'] = user
date_string = str(d['date'])
if date_string in d and row_dict[date_string] != status:
raise Exception, "Contradiction: '%s' on '%s'" % (user,date_string)
row_dict[date_string] = status
# If a value isn't set in one of the total columns yet, set it to 0:
row_dict.setdefault('p-total',0)
row_dict.setdefault('E-total',0)
row_dict.setdefault('total',0)
# Make sure you increment the right column:
count_column = 'p-total' if (status == 'P') else 'E-total'
row_dict[count_column] += 1
# And increment the overall total column in any case:
row_dict['total'] += 1
Run Code Online (Sandbox Code Playgroud)
您应该检查您是否了解其中发生了什么 - 尝试打印user_to_row以检查您是否了解正在生产的内容.
现在,您只需要遍历user_to_row字典中的值并使用DictWriter输出它们.这里要小心的是你不确定每个日期都会有一个条目,所以在这种情况下我只是Unknown在缺少一个值时插入:
with open("hello.csv","w") as f:
# Create the headings:
headings = ['S.no']
headings += [str(date(2011,2,i)) for i in xrange(6,11)]
headings += ['user', 'date_format','p-total','E-total','total']
writer = csv.DictWriter(f, headings, delimiter="\t")
# The writeheader method only appeared in Python 2.7, so write the
# headings from a dictionary that maps each heading to itself:
writer.writerow(dict(zip(headings,headings)))
# Assume that S.no is just a row number...
sno = 1
for d in user_to_row.values():
d['S.no'] = sno
# Fill in any unknown values with 'Unknown':
for h in headings:
d.setdefault(h,'Unknown')
writer.writerow(d)
sno += 1
Run Code Online (Sandbox Code Playgroud)
csv模块的文档应该为您提供了解该部分所需的所有额外信息.
然后输出如下:
S.no 2011-02-06 2011-02-07 2011-02-08 2011-02-09 2011-02-10 user date_format p-total E-total total
1 Unknown Unknown P P P xxx Unknown 3 0 3
2 Unknown Unknown P E P yyy Unknown 2 1 3
3 Unknown Unknown P E P zzz Unknown 2 1 3
Run Code Online (Sandbox Code Playgroud)
...因为标签看起来很奇怪,但会正确加载到电子表格中.
| 归档时间: |
|
| 查看次数: |
6698 次 |
| 最近记录: |