我需要通过一些变量来总结数据框,忽略其他变量.这有时被称为崩溃.例如,如果我有这样的数据帧:
Widget Type Energy  
egg 1 20  
egg 2 30  
jap 3 50  
jap 1 60
然后由Widget折叠,使用Energy的因变量Energy~Widget会产生
Widget Energy  
egg  25  
jap  55  
在Excel中,最接近的功能可能是"数据透视表",我已经研究了如何在python中实现它(http://alexholcombe.wordpress.com/2009/01/26/summarizing-data-by-combinations-of-变量 -with -python /),这是R使用doBy库做一些非常相关的事情的例子(http://www.mail-archive.com/r-help@r-project.org/msg02643.html),但有一个简单的方法来做到这一点?甚至更好的是ggplot2库中是否有任何内容可以创建在某些变量中崩溃的图?
我想知道是否可以在excel中过滤单个数据透视表列.换句话说,当您按计数汇总数据时,只有具有特定值的某个列的数据才会被计算.
我知道可以通过报告过滤获取这些值,但是我需要一个单独的数据透视表来表示我不希望被过滤的值.此外,某些值为0,因此在报告过滤时不会显示.更改显示0值的选项不会改变任何内容.提前致谢.
我有一个数据透视表,其中包含报表过滤器中的一个字段(概率).其值为步长5(0,5,10,15,...,100)的百分比.我想用它来过滤大于或等于某个值的概率,但过滤器只过滤精确的选择.
现在我使用允许多个值的解决方法,然后从我想要的阈值中选择所有值,一直到100这个解决方案,除了尴尬,不显示我的选择,这是必要的,因为这个表是打印出来.过滤器的显示值是"(多个值)",我想显示所选的所有值,甚至更好,例如"> = 20%".我真的不在乎它们是在现场本身还是在Pivot表外的另一个单元中显示.
我的问题:1)我可以使用过滤器来过滤> =我的选择吗?如果没有2)我可以显示多个选项,如"> = 20%"
我试图产生一个"反向枢轴"功能.我已经长时间努力寻找这样的功能,但找不到已经存在的功能.
我有一个摘要表,其中包含最多20列和数百行,但我想将其转换为平面列表,以便我可以导入到数据库(甚至使用平面数据来创建更多数据透视表!)
所以,我有这种格式的数据:
          | Customer 1 | Customer 2 | Customer 3
----------+------------+------------+-----------
Product 1 |          1 |          2 |          3
Product 2 |          4 |          5 |          6
Product 3 |          7 |          8 |          9
并需要将其转换为以下格式:
 Customer  |  Product  | Qty
-----------+-----------+----
Customer 1 | Product 1 |   1
Customer 1 | Product 2 |   4
Customer 1 | Product 3 |   7
Customer 2 | Product 1 |   2
Customer 2 | Product 2 |   5
Customer …我在excel中有一个使用原始表作为其数据源的数据透视表.这个数据透视表正在进行一系列的行分组和求和.
我现在想使用这个新数据透视表的结果作为新数据透视表的数据源,这将进一步修改此数据.
excel可以实现吗?我想你可以称之为'嵌套数据透视表'
我正在尝试重新安排我使用Pandas从json自动读入的DataFrame.我搜索过但没有成功.
我有以下json(保存为字符串以便于复制/粘贴),在标签'value'下有一堆json对象/字典
json_str = '''{"preferred_timestamp": "internal_timestamp",
    "internal_timestamp": 3606765503.684,
    "stream_name": "ctdpf_j_cspp_instrument",
    "values": [{
        "value_id": "temperature",
        "value": 9.8319
    }, {
        "value_id": "conductivity",
        "value": 3.58847
    }, {
        "value_id": "pressure",
        "value": 22.963
    }]
}'''
我使用函数'json_normalize'来将json加载到展平的Pandas数据帧中.
>>> from pandas.io.json import json_normalize
>>> import simplejson as json
>>> df = json_normalize(json.loads(json_str), 'values', ['preferred_timestamp', 'stream_name', 'internal_timestamp'])
>>> df
      value      value_id preferred_timestamp  internal_timestamp  \
0   9.83190   temperature  internal_timestamp        3.606766e+09   
1   3.58847  conductivity  internal_timestamp        3.606766e+09   
2  22.96300      pressure  internal_timestamp        3.606766e+09   
3  32.89470      salinity  internal_timestamp        3.606766e+09   
               stream_name  
0  ctdpf_j_cspp_instrument  
1 …我正在撰写一份报告,要求在Excel中生成多个数据透视表.我想有一种方法可以在R中执行此操作,以便我可以避免使用Excel.我想输出如下面的截图(教师姓名编辑).据我所知,我可以使用reshape包来计算聚合值,但我需要多次这样做,并以某种方式以正确的顺序获取所有数据.那时,我应该在Excel中完成它.有没有人有任何建议或包装建议?谢谢!
(编辑)数据从学生,他们的老师,学校和成长列表开始.然后汇总这些数据以获得具有平均班级增长的教师列表.请注意,然后老师按学校分组.我预见到目前为止这个问题最大的问题是你如何获得小计和总行数(BSA1总计,总计等),因为它们与其他行的观察类型不同?您是否只需手动计算它们并尝试以正确的顺序获取它们,以便它们出现在该组的底部?

我正在使用C#winforms创建一个需要将数据表转换为数据透视表的应用程序.我让数据透视表从SQL端运行良好,但从数据表创建它似乎比较棘手.我似乎无法为此找到.NET中的任何内容.
注意:我必须在.NET端执行此操作,因为我在创建数据透视之前操作数据.
我读过一些做过类似事情的文章,但我很难将它们应用到我的问题中.
*我有一个数据表,其中包含"StartDateTime","Tap"和"Data"列.应将startdates组合在一起并平均数据值(有时每个startdate有多个数据值).表格如下所示:

数据透视表应该输出如下图所示(尽管不是舍入值).列号是不同的抽头编号(每个唯一编号一个).

如何从数据表创建此数据透视表?
编辑:忘记提及,这些抽头值并不总是从1-4开始,它们的数量和价值各不相同.
没有/关于Apache站点中的数据透视表的Apache POI的最小文档让我写这个.
我想使用Apache POI刷新工作簿中的数据透视表.
请让我知道在哪里可以得到适当的文档和相关示例.